IBM
IBM Data Engineering Certificat Professionnel

Vente anticipée ! Débloquez plus de 10 000 cours de Google, Microsoft et autres pour 160 €/an. Économisez maintenant.

IBM

IBM Data Engineering Certificat Professionnel

Préparez-vous à une carrière d'ingénieur en données. Développez des compétences prêtes à l'emploi - et des compétences incontournables en IA - pour une carrière en demande. Obtenez un titre de compétences auprès d'IBM. Aucune expérience préalable n'est requise.

Enseigné en Français (doublage IA)

IBM Skills Network Team
Muhammad Yahya
Abhishek Gagneja

Instructeurs : IBM Skills Network Team

124 098 déjà inscrits

Inclus avec Coursera Plus

Obtenez une qualification professionnelle qui traduit votre expertise
4.7

(5,905 avis)

niveau Débutant

Expérience recommandée

Planning flexible
6 mois à 10 heures une semaine
Apprenez à votre propre rythme
Préparer un diplôme
Obtenez une qualification professionnelle qui traduit votre expertise
4.7

(5,905 avis)

niveau Débutant

Expérience recommandée

Planning flexible
6 mois à 10 heures une semaine
Apprenez à votre propre rythme
Préparer un diplôme

Ce que vous apprendrez

  • Maîtrisez les compétences pratiques et les connaissances les plus récentes que les ingénieurs de données utilisent dans leur travail quotidien

  • Apprendre à créer, concevoir et gérer des bases de données relationnelles et appliquer des concepts d'administration de bases de données (DBA) à des SGBDR tels que MySQL, PostgreSQL et IBM Db2.

  • Développer une connaissance pratique de NoSQL et Big Data en utilisant MongoDB, Cassandra, Cloudant, Hadoop, Apache Spark, Spark SQL, Spark ML, et Spark Streaming.

  • Mettre en œuvre des ETL et des pipelines de données avec Bash, Airflow et Kafka ; architecturer, alimenter et déployer des entrepôts de données ; créer des rapports BI et des tableaux de bord interactifs

Compétences que vous acquerrez

  • Catégorie : Pipelines de données
  • Catégorie : Commandes Linux
  • Catégorie : SQL
  • Catégorie : IBM Cognos Analytics
  • Catégorie : Apache Spark
  • Catégorie : Magasin de données
  • Catégorie : Gestion des bases de données
  • Catégorie : Jupyter
  • Catégorie : Conception de la base de données
  • Catégorie : Bash (langage de script)
  • Catégorie : IA générative
  • Catégorie : Apache Hadoop

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Enseigné en Français (doublage IA)

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Certificat professionnel - 16 séries de cours

Ce que vous apprendrez

  • Dressez la liste des compétences de base requises pour un poste d'ingénieur en données au niveau débutant.

  • Discuter des différentes étapes et des concepts du cycle de vie de l'ingénierie des données.

  • Décrire les technologies d'ingénierie des données telles que les bases de données relationnelles, les magasins de données NoSQL et les moteurs Big Data.

  • Résumer les concepts de sécurité des données, de gouvernance et de conformité.

Compétences que vous acquerrez

Catégorie : Pipelines de données
Catégorie : Extraction, transformation, chargement (ETL)
Catégorie : Entreposage de données
Catégorie : Sécurité des données
Catégorie : Architecture des données
Catégorie : Bases de données relationnelles
Catégorie : Apache Spark
Catégorie : SQL
Catégorie : NoSQL
Catégorie : Magasin de données
Catégorie : Big Data
Catégorie : Gouvernance de données
Catégorie : Lacs de données
Catégorie : Apache Hadoop
Catégorie : Bases de données

Ce que vous apprendrez

  • Développer une compréhension fondamentale de la programmation Python en apprenant la syntaxe de base, les types de données, les expressions, les variables et les opérations sur les chaînes de caractères.

  • Appliquer la logique de programmation Python en utilisant les structures de données, les conditions et les branchements, les boucles, les fonctions, la gestion des exceptions, les objets et les classes.

  • Démontrer une compétence dans l'utilisation des bibliothèques Python telles que Pandas et Numpy et dans le développement de code à l'aide des Bloc-notes Jupyter.

  • Accéder et extraire des données basées sur le web en travaillant avec des API REST à l'aide de requêtes et en effectuant du web scraping avec BeautifulSoup.

Compétences que vous acquerrez

Catégorie : Programmation orientée objet (POO)
Catégorie : structures de données
Catégorie : Programmation en Python
Catégorie : Web scraping
Catégorie : Pandas (paquetage Python)
Catégorie : NumPy
Catégorie : Gestion des fichiers
Catégorie : Programmation Informatique
Catégorie : Importation/exportation de données
Catégorie : Interface de programmation d'application (API)
Catégorie : Jupyter
Catégorie : Restful API
Catégorie : Manipulation de données
Catégorie : Analyse des Données
Catégorie : Principes de programmation

Ce que vous apprendrez

  • Démontrez vos compétences en Python pour travailler et manipuler des données

  • Mettre en œuvre le " webscraping " et utiliser les API pour extraire des données avec Python

  • Jouez le rôle d'un ingénieur de données travaillant sur un projet réel pour extraire, transformer et charger des données

  • Utilisez les blocs-notes Jupyter et les IDE pour mener à bien votre projet

Compétences que vous acquerrez

Catégorie : Web scraping
Catégorie : Programmation en Python
Catégorie : Extraction, transformation, chargement (ETL)
Catégorie : Manipulation de données
Catégorie : Guides de style
Catégorie : Bases de données
Catégorie : Tests unitaires
Catégorie : Traitement des données
Catégorie : Transformation de données
Catégorie : SQL
Catégorie : Examen du code
Catégorie : Restful API
Catégorie : Interface de programmation d'application (API)
Catégorie : Environnements de développement intégré

Ce que vous apprendrez

  • Décrire les données, les bases de données, les bases de données relationnelles et les bases de données en nuage.

  • Décrire les modèles d'information et de données, les bases de données relationnelles et les concepts de modèles relationnels (y compris les schémas et les tables).

  • Expliquez un diagramme de relations entre entités et concevez une base de données relationnelle pour un cas d'utilisation spécifique.

  • Développer une connaissance pratique des SGBD les plus courants, notamment MySQL, PostgreSQL et IBM DB2

Compétences que vous acquerrez

Catégorie : Bases de données relationnelles
Catégorie : SQL
Catégorie : Conception de la base de données
Catégorie : PostgreSQL
Catégorie : MySQL
Catégorie : Manipulation de données
Catégorie : Architecture et administration des bases de données
Catégorie : Bases de données
Catégorie : Systèmes de gestion de bases de données
Catégorie : IBM DB2
Catégorie : Gestion des données
Catégorie : Interface de ligne de commande
Catégorie : Intégrité des données
Catégorie : Modélisation des données

Ce que vous apprendrez

  • Analyser les données d'une base de données en utilisant SQL et Python.

  • Créer une base de données relationnelle et travailler avec plusieurs tables à l'aide de commandes DDL.

  • Construire des requêtes SQL de niveau basique à intermédiaire en utilisant des commandes DML.

  • Composez des requêtes plus puissantes avec des techniques SQL avancées telles que les vues, les transactions, les procédures stockées et les jointures.

Compétences que vous acquerrez

Catégorie : SQL
Catégorie : Pandas (paquetage Python)
Catégorie : Jupyter
Catégorie : Analyse des Données
Catégorie : Bases de données relationnelles
Catégorie : Manipulation de données
Catégorie : Bases de données
Catégorie : Langage de requête
Catégorie : Traitement des transactions
Catégorie : Procédure stockée

Ce que vous apprendrez

  • Décrire l'architecture Linux et les distributions Linux courantes et mettre à jour et installer des logiciels sur un système Linux.

  • Exécuter des commandes courantes d'information, de fichier, de contenu, de navigation, de compression et de mise en réseau dans l'interpréteur de commandes Bash.

  • Développer des scripts shell en utilisant des commandes Linux, des variables d'environnement, des tuyaux et des filtres.

  • Programmez des tâches cron sous Linux avec crontab et expliquez la syntaxe cron.

Compétences que vous acquerrez

Catégorie : Commandes Linux
Catégorie : Script Shell
Catégorie : Linux
Catégorie : Gestion des fichiers
Catégorie : Automatisation
Catégorie : Unix
Catégorie : Serveurs Linux
Catégorie : Commandes Unix
Catégorie : Bash (langage de script)
Catégorie : Protocoles de réseau
Catégorie : Langages de script
Catégorie : Shell Unix
Catégorie : Interface de ligne de commande
Catégorie : Installation du logiciel
Catégorie : Systèmes d'Exploitation
Catégorie : Gestion de processus OS

Ce que vous apprendrez

  • Créer, interroger et configurer des bases de données et accéder à des objets système tels que des tables et les construire.

  • Effectuer une gestion de base de données de base, y compris la sauvegarde et la restauration des bases de données, ainsi que la gestion des rôles et des autorisations des utilisateurs.

  • Surveillez et optimisez les aspects importants des performances de la base de données.

  • Dépanner les problèmes de base de données tels que la connectivité, la connexion et la configuration et automatiser les fonctions telles que les rapports, les notifications et les alertes.

Compétences que vous acquerrez

Catégorie : Gestion des bases de données
Catégorie : Architecture et administration des bases de données
Catégorie : MySQL
Catégorie : Conception de la base de données
Catégorie : Cryptage
Catégorie : Reprise après sinistre
Catégorie : Bases de données relationnelles
Catégorie : Systèmes de base de données
Catégorie : Moniteur du système
Catégorie : Optimisation des performances
Catégorie : Bases de données opérationnelles
Catégorie : IBM DB2
Catégorie : Comptes d'utilisateurs
Catégorie : Technologies de stockage des données
Catégorie : Contrôle d'accès basé sur les rôles (RBAC)
Catégorie : PostgreSQL

Ce que vous apprendrez

  • Décrire et comparer les processus d'extraction, de transformation et de chargement (ETL) et les processus d'extraction, de chargement et de transformation (ELT).

  • Expliquez les modes d'exécution batch et concurrent.

  • Mettre en œuvre le flux de travail ETL à l'aide de fonctions Bash et Python.

  • Décrire les composants, les processus, les outils et les technologies des pipelines de données.

Compétences que vous acquerrez

Catégorie : Extraction, transformation, chargement (ETL)
Catégorie : Pipelines de données
Catégorie : Flux d'air Apache
Catégorie : Apache Kafka
Catégorie : Script Shell
Catégorie : Entreposage de données
Catégorie : Intégration de données
Catégorie : Nettoyage des données
Catégorie : Données en temps réel
Catégorie : Web scraping
Catégorie : Big Data
Catégorie : Optimisation des performances
Catégorie : Migration de données
Catégorie : Transformation de données
Catégorie : Traitement des données
Catégorie : Évolutivité

Ce que vous apprendrez

  • Des compétences en Entrepôt de données prêtes à l'emploi en seulement 6 semaines, soutenues par une expérience pratique et un diplôme IBM.

  • Concevoir et alimenter un entrepôt de données, modéliser et interroger les données à l'aide de CUBE, ROLLUP et de vues matérialisées.

  • Identifier les outils et les fournisseurs les plus courants en matière d'analyse de données et de veille stratégique et créer des visualisations de données à l'aide d'IBM Cognos Analytics.

  • Comment concevoir et charger des données dans un entrepôt de données, écrire des requêtes d'agrégation, créer des tables de requêtes matérialisées et créer un tableau de bord analytique.

Compétences que vous acquerrez

Catégorie : Entreposage de données
Catégorie : Lacs de données
Catégorie : Schéma du flocon de neige
Catégorie : Schéma en étoile
Catégorie : Data Mart
Catégorie : IBM DB2
Catégorie : PostgreSQL
Catégorie : Intégration de données
Catégorie : Modélisation des données
Catégorie : Nettoyage des données
Catégorie : Langage de requête
Catégorie : SQL
Catégorie : Conception de la base de données
Catégorie : Systèmes de base de données
Catégorie : Validation des données
Catégorie : Extraction, transformation, chargement (ETL)
Catégorie : Qualité des données
Catégorie : Architecture des données

Ce que vous apprendrez

  • Explorer l'utilité des outils d'analyse et d'informatique décisionnelle (BI)

  • Découvrez les capacités d'IBM Cognos Analytics et de Google Looker Studio

  • Démontrez votre maîtrise de l'analyse des données DB2 avec IBM Cognos Analytics

  • Créer et partager des tableaux de bord interactifs à l'aide d'IBM Cognos Analytics et de Google Looker Studio

Compétences que vous acquerrez

Catégorie : Visualisation interactive des données
Catégorie : Looker (Logiciel)
Catégorie : IBM Cognos Analytics
Catégorie : Logiciel de Visualisation de Données
Catégorie : Tableau de bord
Catégorie : Informatique décisionnelle
Catégorie : Présentation des données
Catégorie : Analytique
Catégorie : Logiciel d'informatique décisionnelle

Ce que vous apprendrez

  • Faites la différence entre les quatre catégories principales de référentiels NoSQL.

  • Décrivez les caractéristiques, les avantages, les limites et les applications des outils de traitement des Big Data les plus populaires.

  • Effectuer des tâches courantes à l'aide de MongoDB, notamment des opérations de création, de lecture, de mise à jour et de suppression (CRUD).

  • Exécutez des opérations sur les espaces clés, les tables et les opérations CRUD dans Cassandra.

Compétences que vous acquerrez

Catégorie : NoSQL
Catégorie : Apache Cassandra
Catégorie : MongoDB
Catégorie : Modélisation des données
Catégorie : Langage de requête
Catégorie : Évolutivité
Catégorie : Informatique distribuée
Catégorie : Bases de données
Catégorie : JSON
Catégorie : Gestion des bases de données
Catégorie : IBM Cloud
Catégorie : Manipulation de données
Catégorie : Architecture et administration des bases de données

Ce que vous apprendrez

  • Expliquer l'impact du big data, y compris les cas d'utilisation, les outils et les méthodes de traitement.

  • Décrire l'architecture, l'écosystème, les pratiques et les applications liées à l'utilisateur d'Apache Hadoop, y compris Hive, HDFS, HBase, Spark et MapReduce.

  • Appliquer les bases de la programmation Spark, y compris les bases de la programmation parallèle pour les DataFrames, les ensembles de données et Spark SQL.

  • Utilisez les RDD et les ensembles de données de Spark, optimisez Spark SQL à l'aide de Catalyst et Tungsten, et utilisez les options de l'environnement de développement et d'exécution de Spark.

Compétences que vous acquerrez

Catégorie : Apache Spark
Catégorie : Big Data
Catégorie : Informatique distribuée
Catégorie : Apache Hadoop
Catégorie : Débogage
Catégorie : Évolutivité
Catégorie : Apache Hive
Catégorie : Traitement des données
Catégorie : IBM Cloud
Catégorie : PySpark
Catégorie : Transformation de données
Catégorie : Optimisation des performances
Catégorie : Docker (Logiciel)
Catégorie : Kubernetes

Ce que vous apprendrez

  • Décrivez la ML, expliquez son rôle dans l'ingénierie des données, résumez l'IA générative, discutez des utilisations de Spark et analysez les pipelines de ML et la persistance des modèles.

  • Évaluer les modèles ML, distinguer les modèles de régression, de classification et de regroupement, et comparer les pipelines d'ingénierie des données avec les pipelines ML.

  • Construisez les processus d'analyse des données à l'aide de Spark SQL et effectuez des régressions, des classifications et des regroupements à l'aide de SparkML.

  • Démonstration de la connexion aux clusters Spark, de la construction de pipelines de ML, de l'extraction et de la transformation des caractéristiques, et de la persistance des modèles.

Compétences que vous acquerrez

Catégorie : Apprentissage automatique
Catégorie : Apache Spark
Catégorie : Extraction, transformation, chargement (ETL)
Catégorie : Apprentissage supervisé
Catégorie : Apprentissage non supervisé
Catégorie : Transformation de données
Catégorie : PySpark
Catégorie : Pipelines de données
Catégorie : Analyse de régression
Catégorie : Modélisation prédictive
Catégorie : Traitement des données
Catégorie : Arbre de classification et de régression (CART)
Catégorie : Apprentissage automatique appliqué
Catégorie : Apache Hadoop
Catégorie : IA générative

Ce que vous apprendrez

  • Démontrer la maîtrise des compétences requises pour un poste d'ingénieur en données de niveau débutant.

  • Concevoir et mettre en œuvre divers concepts et composants dans le cycle de vie de l'ingénierie des données, tels que les référentiels de données.

  • Démontrer une connaissance pratique des bases de données relationnelles, des magasins de données NoSQL, des moteurs de big data, des entrepôts de données et des pipelines de données.

  • Appliquer les compétences en matière de scripts shell Linux, de langages de programmation SQL et Python aux problèmes d'ingénierie des données.

Compétences que vous acquerrez

Catégorie : Entreposage de données
Catégorie : Extraction, transformation, chargement (ETL)
Catégorie : Analyse des Données
Catégorie : Pipelines de données
Catégorie : Tableau de bord
Catégorie : MySQL
Catégorie : MongoDB
Catégorie : Apache Spark
Catégorie : Big Data
Catégorie : PostgreSQL
Catégorie : IBM DB2
Catégorie : Bases de données
Catégorie : Modélisation prédictive
Catégorie : Infrastructure de données
Catégorie : Architecture des données
Catégorie : IBM Cognos Analytics
Catégorie : Apprentissage automatique appliqué

Ce que vous apprendrez

  • Tirer parti de divers outils et techniques d'IA générative dans les processus d'ingénierie des données dans tous les secteurs d'activité

  • Mettre en œuvre divers processus d'ingénierie des données tels que la génération, l'augmentation et l'anonymisation des données à l'aide d'outils d'IA générative

  • Mettre en pratique les compétences en IA générative dans des laboratoires et des projets pratiques pour la conception de schémas d'entrepôt de données et la configuration de l'infrastructure

  • Évaluer des études de cas réels présentant l'application réussie de l'IA générative pour l'ETL et les référentiels de données

Compétences que vous acquerrez

Catégorie : IA générative
Catégorie : Synthèse des données
Catégorie : Analyse des Données
Catégorie : Data mining
Catégorie : Conception de la base de données
Catégorie : Extraction, transformation, chargement (ETL)
Catégorie : Intelligence artificielle
Catégorie : Qualité des données
Catégorie : Pipelines de données
Catégorie : Infrastructure de données
Catégorie : Schéma du flocon de neige
Catégorie : Entreposage de données
Catégorie : Éthique des données
Catégorie : Schéma en étoile
Catégorie : Langage de requête
Catégorie : Architecture des données

Ce que vous apprendrez

  • Décrivez le rôle d'un ingénieur en données et quelques options de carrière, ainsi que les perspectives d'avenir dans ce domaine.

  • Expliquer comment jeter les bases d'une recherche d'emploi, y compris la recherche d'offres d'emploi, la rédaction d'un curriculum vitae et la création d'un portfolio.

  • Résumez ce à quoi un candidat peut s'attendre au cours d'un cycle d'entretien d'embauche typique, les différents types d'entretiens et la manière de se préparer aux entretiens.

  • Expliquez comment mener un entretien efficace, y compris les techniques pour répondre aux questions et comment faire une présentation personnelle professionnelle.

Compétences que vous acquerrez

Catégorie : Compétences en matière d'entretien
Catégorie : Réseautage professionnel
Catégorie : Pipelines de données
Catégorie : Stratégie en matière de données
Catégorie : Compétences en matière de communication verbale
Catégorie : Infrastructure de données
Catégorie : Développement professionnel
Catégorie : Stratégies de communication
Catégorie : LinkedIn
Catégorie : Éthique des données
Catégorie : Communication technique

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Préparer un diplôme

Lorsque vous aurez terminé ce site Certificat Professionnel, vous pourrez peut-être faire reconnaître vos acquis si vous êtes admis et si vous vous inscrivez à l'un des programmes d'études en ligne suivants.¹

 
Logo de l’ACE

Ce Certificat Professionnel bénéficie d’une recommandation par l’ACE®. Il donne droit à des crédits universitaires dans les établissements d’enseignement supérieur américains participants. Note : La décision d’accepter des recommandations de crédits spécifiques est du ressort de chaque institution. 

Instructeurs

IBM Skills Network Team
IBM
84 Cours1 323 324 apprenants
Muhammad Yahya
IBM
5 Cours82 505 apprenants
Abhishek Gagneja
IBM
6 Cours203 755 apprenants

Offert par

IBM

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Coursera Plus

Ouvrez de nouvelles portes avec Coursera Plus

Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.

Faites progresser votre carrière avec un diplôme en ligne

Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne

Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires

Améliorez les compétences de vos employés pour exceller dans l’économie numérique

Foire Aux Questions

¹ Median salary and job opening data are sourced from Lightcast™ Job Postings Report. Content Creator, Machine Learning Engineer and Salesforce Development Representative (1/1/2024 - 12/31/2024) All other job roles (6/1/2024 - 6/1/2025)