IBM
IBM Data Engineering Certificat Professionnel

Vente anticipée ! Débloquez plus de 10 000 cours de Google, Microsoft et autres pour 160 €/an. Économisez maintenant.

IBM

IBM Data Engineering Certificat Professionnel

Préparez-vous à une carrière d'ingénieur en données. Développez des compétences prêtes à l'emploi - et des compétences incontournables en IA - pour une carrière en demande. Obtenez un titre de compétences auprès d'IBM. Aucune expérience préalable n'est requise.

Enseigné en Français (doublage IA)

IBM Skills Network Team
Muhammad Yahya
Abhishek Gagneja

Instructeurs : IBM Skills Network Team

124 200 déjà inscrits

Inclus avec Coursera Plus

Obtenez une qualification professionnelle qui traduit votre expertise
4.7

(5,911 avis)

niveau Débutant

Expérience recommandée

Planning flexible
6 mois à 10 heures une semaine
Apprenez à votre propre rythme
Préparer un diplôme
Obtenez une qualification professionnelle qui traduit votre expertise
4.7

(5,911 avis)

niveau Débutant

Expérience recommandée

Planning flexible
6 mois à 10 heures une semaine
Apprenez à votre propre rythme
Préparer un diplôme

Ce que vous apprendrez

  • Maîtrisez les compétences pratiques et les connaissances les plus récentes que les ingénieurs de données utilisent dans leur travail quotidien

  • Apprendre à créer, concevoir et gérer des bases de données relationnelles et appliquer des concepts d'administration de bases de données (DBA) à des SGBDR tels que MySQL, PostgreSQL et IBM Db2.

  • Développer une connaissance pratique de NoSQL et Big Data en utilisant MongoDB, Cassandra, Cloudant, Hadoop, Apache Spark, Spark SQL, Spark ML, et Spark Streaming.

  • Mettre en œuvre des ETL et des pipelines de données avec Bash, Airflow et Kafka ; architecturer, alimenter et déployer des entrepôts de données ; créer des rapports BI et des tableaux de bord interactifs

Compétences que vous acquerrez

  • Catégorie : NoSQL
  • Catégorie : Apache Hadoop
  • Catégorie : MySQL
  • Catégorie : Magasin de données
  • Catégorie : Web scraping
  • Catégorie : Gestion des bases de données
  • Catégorie : Jupyter
  • Catégorie : Flux d'air Apache
  • Catégorie : Extraction, transformation, chargement (ETL)
  • Catégorie : Entreposage de données
  • Catégorie : Réseautage professionnel
  • Catégorie : Bash (langage de script)

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Enseigné en Français (doublage IA)

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Certificat professionnel - 16 séries de cours

Ce que vous apprendrez

  • Dressez la liste des compétences de base requises pour un poste d'ingénieur en données au niveau débutant.

  • Discuter des différentes étapes et des concepts du cycle de vie de l'ingénierie des données.

  • Décrire les technologies d'ingénierie des données telles que les bases de données relationnelles, les magasins de données NoSQL et les moteurs Big Data.

  • Résumer les concepts de sécurité des données, de gouvernance et de conformité.

Compétences que vous acquerrez

Catégorie : Pipelines de données
Catégorie : Entreposage de données
Catégorie : Extraction, transformation, chargement (ETL)
Catégorie : Sécurité des données
Catégorie : Architecture des données
Catégorie : SQL
Catégorie : Bases de données relationnelles
Catégorie : Big Data
Catégorie : Apache Spark
Catégorie : Gouvernance de données
Catégorie : NoSQL
Catégorie : Magasin de données
Catégorie : Apache Hadoop
Catégorie : Lacs de données
Catégorie : Bases de données

Ce que vous apprendrez

  • Développer une compréhension fondamentale de la programmation Python en apprenant la syntaxe de base, les types de données, les expressions, les variables et les opérations sur les chaînes de caractères.

  • Appliquer la logique de programmation Python en utilisant les structures de données, les conditions et les branchements, les boucles, les fonctions, la gestion des exceptions, les objets et les classes.

  • Démontrer une compétence dans l'utilisation des bibliothèques Python telles que Pandas et Numpy et dans le développement de code à l'aide des Bloc-notes Jupyter.

  • Accéder et extraire des données basées sur le web en travaillant avec des API REST à l'aide de requêtes et en effectuant du web scraping avec BeautifulSoup.

Compétences que vous acquerrez

Catégorie : structures de données
Catégorie : Programmation orientée objet (POO)
Catégorie : Programmation en Python
Catégorie : Pandas (paquetage Python)
Catégorie : NumPy
Catégorie : Gestion des fichiers
Catégorie : Web scraping
Catégorie : Interface de programmation d'application (API)
Catégorie : Manipulation de données
Catégorie : Programmation Informatique
Catégorie : Principes de programmation
Catégorie : Scripting
Catégorie : Restful API
Catégorie : Analyse des Données
Catégorie : Maîtrise des données
Catégorie : Jupyter
Catégorie : Importation/exportation de données

Ce que vous apprendrez

  • Démontrez vos compétences en Python pour travailler et manipuler des données

  • Mettre en œuvre le " webscraping " et utiliser les API pour extraire des données avec Python

  • Jouez le rôle d'un ingénieur de données travaillant sur un projet réel pour extraire, transformer et charger des données

  • Utilisez les blocs-notes Jupyter et les IDE pour mener à bien votre projet

Compétences que vous acquerrez

Catégorie : Extraction, transformation, chargement (ETL)
Catégorie : Manipulation de données
Catégorie : Programmation en Python
Catégorie : Web scraping
Catégorie : Transformation de données
Catégorie : Interface de programmation d'application (API)
Catégorie : Environnements de développement intégré
Catégorie : Traitement des données
Catégorie : Bases de données
Catégorie : Tests unitaires
Catégorie : Examen du code
Catégorie : Restful API
Catégorie : SQL
Catégorie : Guides de style

Ce que vous apprendrez

  • Décrire les données, les bases de données, les bases de données relationnelles et les bases de données en nuage.

  • Décrire les modèles d'information et de données, les bases de données relationnelles et les concepts de modèles relationnels (y compris les schémas et les tables).

  • Expliquez un diagramme de relations entre entités et concevez une base de données relationnelle pour un cas d'utilisation spécifique.

  • Développer une connaissance pratique des SGBD les plus courants, notamment MySQL, PostgreSQL et IBM DB2

Compétences que vous acquerrez

Catégorie : Bases de données relationnelles
Catégorie : SQL
Catégorie : Conception de la base de données
Catégorie : MySQL
Catégorie : PostgreSQL
Catégorie : Architecture et administration des bases de données
Catégorie : Manipulation de données
Catégorie : Interface de ligne de commande
Catégorie : Systèmes de gestion de bases de données
Catégorie : Modélisation des données
Catégorie : Gestion des données
Catégorie : Intégrité des données
Catégorie : Bases de données
Catégorie : IBM DB2

Ce que vous apprendrez

  • Analyser les données d'une base de données en utilisant SQL et Python.

  • Créer une base de données relationnelle et travailler avec plusieurs tables à l'aide de commandes DDL.

  • Construire des requêtes SQL de niveau basique à intermédiaire en utilisant des commandes DML.

  • Composez des requêtes plus puissantes avec des techniques SQL avancées telles que les vues, les transactions, les procédures stockées et les jointures.

Compétences que vous acquerrez

Catégorie : SQL
Catégorie : Pandas (paquetage Python)
Catégorie : Bases de données relationnelles
Catégorie : Analyse des Données
Catégorie : Bases de données
Catégorie : Jupyter
Catégorie : Manipulation de données
Catégorie : Langage de requête
Catégorie : Conception de la base de données
Catégorie : Procédure stockée
Catégorie : Traitement des transactions
Catégorie : Gestion des bases de données

Ce que vous apprendrez

  • Décrire l'architecture Linux et les distributions Linux courantes et mettre à jour et installer des logiciels sur un système Linux.

  • Exécuter des commandes courantes d'information, de fichier, de contenu, de navigation, de compression et de mise en réseau dans l'interpréteur de commandes Bash.

  • Développer des scripts shell en utilisant des commandes Linux, des variables d'environnement, des tuyaux et des filtres.

  • Programmez des tâches cron sous Linux avec crontab et expliquez la syntaxe cron.

Compétences que vous acquerrez

Catégorie : Commandes Linux
Catégorie : Script Shell
Catégorie : Linux
Catégorie : Gestion des fichiers
Catégorie : Unix
Catégorie : Automatisation
Catégorie : Gestion de processus OS
Catégorie : Protocoles de réseau
Catégorie : Commandes Unix
Catégorie : Interface de ligne de commande
Catégorie : Shell Unix
Catégorie : Bash (langage de script)
Catégorie : Installation du logiciel
Catégorie : Langages de script
Catégorie : Serveurs Linux
Catégorie : Systèmes d'Exploitation

Ce que vous apprendrez

  • Créer, interroger et configurer des bases de données et accéder à des objets système tels que des tables et les construire.

  • Effectuer une gestion de base de données de base, y compris la sauvegarde et la restauration des bases de données, ainsi que la gestion des rôles et des autorisations des utilisateurs.

  • Surveillez et optimisez les aspects importants des performances de la base de données.

  • Dépanner les problèmes de base de données tels que la connectivité, la connexion et la configuration et automatiser les fonctions telles que les rapports, les notifications et les alertes.

Compétences que vous acquerrez

Catégorie : Gestion des bases de données
Catégorie : Architecture et administration des bases de données
Catégorie : Systèmes de base de données
Catégorie : Reprise après sinistre
Catégorie : Cryptage
Catégorie : Conception de la base de données
Catégorie : MySQL
Catégorie : Bases de données relationnelles
Catégorie : Optimisation des performances
Catégorie : Bases de données opérationnelles
Catégorie : Moniteur du système
Catégorie : Contrôle d'accès basé sur les rôles (RBAC)
Catégorie : Comptes d'utilisateurs
Catégorie : PostgreSQL
Catégorie : Technologies de stockage des données
Catégorie : IBM DB2

Ce que vous apprendrez

  • Décrire et comparer les processus d'extraction, de transformation et de chargement (ETL) et les processus d'extraction, de chargement et de transformation (ELT).

  • Expliquez les modes d'exécution batch et concurrent.

  • Mettre en œuvre le flux de travail ETL à l'aide de fonctions Bash et Python.

  • Décrire les composants, les processus, les outils et les technologies des pipelines de données.

Compétences que vous acquerrez

Catégorie : Extraction, transformation, chargement (ETL)
Catégorie : Pipelines de données
Catégorie : Flux d'air Apache
Catégorie : Apache Kafka
Catégorie : Script Shell
Catégorie : Transformation de données
Catégorie : Big Data
Catégorie : Entreposage de données
Catégorie : Intégration de données
Catégorie : Nettoyage des données
Catégorie : Traitement des données
Catégorie : Données en temps réel
Catégorie : Migration de données
Catégorie : Web scraping
Catégorie : Évolutivité
Catégorie : Optimisation des performances

Ce que vous apprendrez

  • Des compétences en Entrepôt de données prêtes à l'emploi en seulement 6 semaines, soutenues par une expérience pratique et un diplôme IBM.

  • Concevoir et alimenter un entrepôt de données, modéliser et interroger les données à l'aide de CUBE, ROLLUP et de vues matérialisées.

  • Identifier les outils et les fournisseurs les plus courants en matière d'analyse de données et de veille stratégique et créer des visualisations de données à l'aide d'IBM Cognos Analytics.

  • Comment concevoir et charger des données dans un entrepôt de données, écrire des requêtes d'agrégation, créer des tables de requêtes matérialisées et créer un tableau de bord analytique.

Compétences que vous acquerrez

Catégorie : Entreposage de données
Catégorie : Schéma du flocon de neige
Catégorie : Data Mart
Catégorie : Schéma en étoile
Catégorie : Lacs de données
Catégorie : IBM DB2
Catégorie : SQL
Catégorie : Architecture des données
Catégorie : Langage de requête
Catégorie : Intégration de données
Catégorie : Validation des données
Catégorie : Extraction, transformation, chargement (ETL)
Catégorie : PostgreSQL
Catégorie : Qualité des données
Catégorie : Modélisation des données
Catégorie : Nettoyage des données
Catégorie : Conception de la base de données
Catégorie : Systèmes de base de données

Ce que vous apprendrez

  • Explorer l'utilité des outils d'analyse et d'informatique décisionnelle (BI)

  • Découvrez les capacités d'IBM Cognos Analytics et de Google Looker Studio

  • Démontrez votre maîtrise de l'analyse des données DB2 avec IBM Cognos Analytics

  • Créer et partager des tableaux de bord interactifs à l'aide d'IBM Cognos Analytics et de Google Looker Studio

Compétences que vous acquerrez

Catégorie : IBM Cognos Analytics
Catégorie : Visualisation interactive des données
Catégorie : Looker (Logiciel)
Catégorie : Logiciel de Visualisation de Données
Catégorie : Tableau de bord
Catégorie : Présentation des données
Catégorie : Analytique
Catégorie : Logiciel d'informatique décisionnelle
Catégorie : Informatique décisionnelle

Ce que vous apprendrez

  • Faites la différence entre les quatre catégories principales de référentiels NoSQL.

  • Décrivez les caractéristiques, les avantages, les limites et les applications des outils de traitement des Big Data les plus populaires.

  • Effectuer des tâches courantes à l'aide de MongoDB, notamment des opérations de création, de lecture, de mise à jour et de suppression (CRUD).

  • Exécutez des opérations sur les espaces clés, les tables et les opérations CRUD dans Cassandra.

Compétences que vous acquerrez

Catégorie : NoSQL
Catégorie : MongoDB
Catégorie : Apache Cassandra
Catégorie : Modélisation des données
Catégorie : Évolutivité
Catégorie : Langage de requête
Catégorie : Informatique distribuée
Catégorie : JSON
Catégorie : Manipulation de données
Catégorie : Gestion des bases de données
Catégorie : Architecture et administration des bases de données
Catégorie : Bases de données
Catégorie : IBM Cloud

Ce que vous apprendrez

  • Expliquer l'impact du big data, y compris les cas d'utilisation, les outils et les méthodes de traitement.

  • Décrire l'architecture, l'écosystème, les pratiques et les applications liées à l'utilisateur d'Apache Hadoop, y compris Hive, HDFS, HBase, Spark et MapReduce.

  • Appliquer les bases de la programmation Spark, y compris les bases de la programmation parallèle pour les DataFrames, les ensembles de données et Spark SQL.

  • Utilisez les RDD et les ensembles de données de Spark, optimisez Spark SQL à l'aide de Catalyst et Tungsten, et utilisez les options de l'environnement de développement et d'exécution de Spark.

Compétences que vous acquerrez

Catégorie : Apache Spark
Catégorie : Informatique distribuée
Catégorie : Big Data
Catégorie : Apache Hadoop
Catégorie : Apache Hive
Catégorie : Évolutivité
Catégorie : Débogage
Catégorie : IBM Cloud
Catégorie : Traitement des données
Catégorie : Transformation de données
Catégorie : PySpark
Catégorie : Docker (Logiciel)
Catégorie : Optimisation des performances
Catégorie : Kubernetes

Ce que vous apprendrez

  • Décrivez la ML, expliquez son rôle dans l'ingénierie des données, résumez l'IA générative, discutez des utilisations de Spark et analysez les pipelines de ML et la persistance des modèles.

  • Évaluer les modèles ML, distinguer les modèles de régression, de classification et de regroupement, et comparer les pipelines d'ingénierie des données avec les pipelines ML.

  • Construisez les processus d'analyse des données à l'aide de Spark SQL et effectuez des régressions, des classifications et des regroupements à l'aide de SparkML.

  • Démonstration de la connexion aux clusters Spark, de la construction de pipelines de ML, de l'extraction et de la transformation des caractéristiques, et de la persistance des modèles.

Compétences que vous acquerrez

Catégorie : Apprentissage automatique
Catégorie : Apache Spark
Catégorie : Extraction, transformation, chargement (ETL)
Catégorie : Pipelines de données
Catégorie : Transformation de données
Catégorie : Modélisation prédictive
Catégorie : Apprentissage non supervisé
Catégorie : Apprentissage supervisé
Catégorie : Analyse de régression
Catégorie : PySpark
Catégorie : IA générative
Catégorie : Traitement des données
Catégorie : Apache Hadoop
Catégorie : Arbre de classification et de régression (CART)
Catégorie : Apprentissage automatique appliqué

Ce que vous apprendrez

  • Démontrer la maîtrise des compétences requises pour un poste d'ingénieur en données de niveau débutant.

  • Concevoir et mettre en œuvre divers concepts et composants dans le cycle de vie de l'ingénierie des données, tels que les référentiels de données.

  • Démontrer une connaissance pratique des bases de données relationnelles, des magasins de données NoSQL, des moteurs de big data, des entrepôts de données et des pipelines de données.

  • Appliquer les compétences en matière de scripts shell Linux, de langages de programmation SQL et Python aux problèmes d'ingénierie des données.

Compétences que vous acquerrez

Catégorie : Entreposage de données
Catégorie : Extraction, transformation, chargement (ETL)
Catégorie : Tableau de bord
Catégorie : MySQL
Catégorie : Pipelines de données
Catégorie : MongoDB
Catégorie : Analyse des Données
Catégorie : Big Data
Catégorie : Apache Spark
Catégorie : Modélisation prédictive
Catégorie : Infrastructure de données
Catégorie : Architecture des données
Catégorie : Apprentissage automatique appliqué
Catégorie : IBM Cognos Analytics
Catégorie : Bases de données
Catégorie : IBM DB2
Catégorie : PostgreSQL

Ce que vous apprendrez

  • Tirer parti de divers outils et techniques d'IA générative dans les processus d'ingénierie des données dans tous les secteurs d'activité

  • Mettre en œuvre divers processus d'ingénierie des données tels que la génération, l'augmentation et l'anonymisation des données à l'aide d'outils d'IA générative

  • Mettre en pratique les compétences en IA générative dans des laboratoires et des projets pratiques pour la conception de schémas d'entrepôt de données et la configuration de l'infrastructure

  • Évaluer des études de cas réels présentant l'application réussie de l'IA générative pour l'ETL et les référentiels de données

Compétences que vous acquerrez

Catégorie : IA générative
Catégorie : Synthèse des données
Catégorie : Extraction, transformation, chargement (ETL)
Catégorie : Analyse des Données
Catégorie : Data mining
Catégorie : Conception de la base de données
Catégorie : Langage de requête
Catégorie : Intelligence artificielle
Catégorie : Schéma du flocon de neige
Catégorie : Éthique des données
Catégorie : Infrastructure de données
Catégorie : Pipelines de données
Catégorie : Schéma en étoile
Catégorie : Architecture des données
Catégorie : Qualité des données
Catégorie : Entreposage de données

Ce que vous apprendrez

  • Décrivez le rôle d'un ingénieur en données et quelques options de carrière, ainsi que les perspectives d'avenir dans ce domaine.

  • Expliquer comment jeter les bases d'une recherche d'emploi, y compris la recherche d'offres d'emploi, la rédaction d'un curriculum vitae et la création d'un portfolio.

  • Résumez ce à quoi un candidat peut s'attendre au cours d'un cycle d'entretien d'embauche typique, les différents types d'entretiens et la manière de se préparer aux entretiens.

  • Expliquez comment mener un entretien efficace, y compris les techniques pour répondre aux questions et comment faire une présentation personnelle professionnelle.

Compétences que vous acquerrez

Catégorie : Compétences en matière d'entretien
Catégorie : Réseautage professionnel
Catégorie : Pipelines de données
Catégorie : Compétences en matière de communication verbale
Catégorie : Éthique des données
Catégorie : Développement professionnel
Catégorie : Infrastructure de données
Catégorie : Communication technique
Catégorie : LinkedIn
Catégorie : Stratégie en matière de données
Catégorie : Stratégies de communication

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Préparer un diplôme

Lorsque vous aurez terminé ce site Certificat Professionnel, vous pourrez peut-être faire reconnaître vos acquis si vous êtes admis et si vous vous inscrivez à l'un des programmes d'études en ligne suivants.¹

 
Logo de l’ACE

Ce Certificat Professionnel bénéficie d’une recommandation par l’ACE®. Il donne droit à des crédits universitaires dans les établissements d’enseignement supérieur américains participants. Note : La décision d’accepter des recommandations de crédits spécifiques est du ressort de chaque institution. 

Instructeurs

IBM Skills Network Team
IBM
84 Cours1 326 341 apprenants
Muhammad Yahya
IBM
5 Cours82 595 apprenants
Abhishek Gagneja
IBM
6 Cours204 077 apprenants

Offert par

IBM

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Coursera Plus

Ouvrez de nouvelles portes avec Coursera Plus

Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.

Faites progresser votre carrière avec un diplôme en ligne

Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne

Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires

Améliorez les compétences de vos employés pour exceller dans l’économie numérique

Foire Aux Questions

¹ Median salary and job opening data are sourced from Lightcast™ Job Postings Report. Content Creator, Machine Learning Engineer and Salesforce Development Representative (1/1/2024 - 12/31/2024) All other job roles (6/1/2024 - 6/1/2025)