Data & Business Intelligence

Modern Data Engineering avec Hadoop, Hive, et alternatives Cloud (BigQuery, Snowflake)

Formation complète pour traiter des données massives avec Hadoop et découvrir les solutions analytiques cloud modernes comme BigQuery et Snowflake.

35h

Intermédiaire

Mixte

Description de la formation

Cette formation Modern Data Engineering s’adresse aux data engineers, analystes et développeurs souhaitant maîtriser les technologies Big Data. En 35 heures, vous apprendrez à concevoir et gérer des pipelines de données robustes avec Hadoop et Hive, puis à migrer vers les solutions cloud modernes comme BigQuery et Snowflake.

Au programme : architecture distribuée, traitement massif de données, optimisation des requêtes SQL, gouvernance et qualité des données. Vous acquérez des compétences opérationnelles immédiatement transposables en entreprise, du on-premise au cloud.

Le format distanciel et présentiel combine flexibilité et interaction. Un accompagnement individualisé vous guide tout au long du parcours. Cette formation est éligible CPF, finançable par les OPCO et compatible avec les dispositifs France Travail.

ESIC, certifié Qualiopi, garantit une formation de qualité axée sur vos objectifs professionnels et l’employabilité.

Objectifs pédagogiques

Comprendre les bases du traitement distribué avec Hadoop et son écosystème (Hive, HDFS, Pig)
Identifier les limites d’Hadoop et les alternatives cloud modernes (BigQuery, Snowflake)
Mettre en œuvre des chaînes de traitement Big Data batch et hybrides (on-prem/cloud)
Déployer des workflows efficaces intégrés dans des pipelines analytiques actuels

Programme détaillé

Module 1 Introduction au Big Data & écosystème Hadoop

Historique, cas d’usage, architecture HDFS
Hive, Pig, HBase : rôles, forces, limites
MapReduce et Spark : traitements batch et mémoire
Démonstration : exécution d’un job Hadoop simple

Module 2 Pratique Hadoop & Hive

Installation d’un mini-cluster (VM ou Docker)
Utilisation de HDFS : chargement, transformation, export
Langage HiveQL : requêtes SQL sur HDFS
Cas pratique : traitement de fichiers logs massifs

Module 3 Au-delà d’Hadoop : Cloud & plateformes modernes

Présentation de BigQuery (GCP), Snowflake, Redshift
Comparatif architecture, performance, coût
Ingestion de données dans un entrepôt cloud
Atelier : transformation SQL à grande échelle dans BigQuery

Module 4 Construction de pipelines hybrides

Intégration avec Talend / Airflow / dbt
Cas d’usage moderne : reporting, IA, dashboards
Bonnes pratiques de maintenance et sécurité

Prérequis

Maîtrise de SQL
Connaissances générales en systèmes distribués ou cloud

Public visé

Développeurs, data engineers, architectes IT, chefs de projet data

Modalités de la formation

⏱ Durée : 35h
📍 Format : Mixte (présentiel + distanciel)
📊 Niveau d'entrée : Intermédiaire
🎯 Pédagogie : Apports théoriques, exercices pratiques, études de cas, projet fil rouge
🗓️ Délai d'accès : variable selon le mode de financement, généralement de 11 jours ouvrés à 1 mois après l'inscription. En savoir plus.
♿ Accessibilité : Chaque demande émanant d'une personne en situation de handicap fait l'objet d'une étude de faisabilité et d'adaptation. Contactez notre référent handicap.

🏆

Passage de la certification obligatoire

Cette formation se conclut par le passage d'une certification officielle, indispensable à la validation de votre parcours.

Certification(s) : TP – Assistant de vie aux familles

Équipe pédagogique

Nos formations sont conçues et animées par une équipe de formateurs experts, sélectionnés pour leur double compétence : une expertise métier acquise sur le terrain et une réelle expérience pédagogique. Le suivi de chaque apprenant est assuré par un référent pédagogique dédié.

Formateurs professionnels spécialistes de leur domaine, en veille permanente sur les évolutions du secteur
Référent pédagogique dédié, disponible tout au long du parcours
Contenus régulièrement actualisés et adaptés au niveau de chaque participant
Référent handicap pour l'accueil et l'adaptation des personnes en situation de handicap

Ressources pédagogiques

Démonstrations techniques
Mini-projet fil rouge comparant Hadoop et solution cloud
Exercices pratiques sur jeux de données volumineux
Théorie appliquée, cas concrets
Mise à disposition en ligne de documents supports à la suite de la formation.

Suivi de l'exécution et évaluation

Feuilles de présence.
Formulaires d'évaluation de la formation.
Certificat de réalisation de l’action de formation.
Projet final comparatif (Hadoop vs BigQuery)

Accessibilité

Les personnes atteintes de handicap souhaitant suivre cette formation sont invitées à nous contacter directement, afin d’étudier ensemble les possibilités de suivre la formation.

Fiche mise à jour le 7 juillet 2026.

Modern Data Engineering avec Hadoop, Hive, et alternatives Cloud (BigQuery, Snowflake)

Description de la formation

Objectifs pédagogiques

Programme détaillé

Prérequis

Public visé

Modalités de la formation

Équipe pédagogique

Ressources pédagogiques

Suivi de l'exécution et évaluation

Accessibilité

Cette formation prépare à

TP – Assistant de vie aux familles

Formations similaires

Bases de données dans le Cloud (AWS / GCP / Azure)

Panorama et cas d’usage des bases NoSQL (MongoDB, Cassandra, Redis)

Développer en PL/SQL – Oracle

Les apprenants ont aussi consulté

Word – Rédiger et mettre en forme des documents professionnels

Élaborer et mettre en œuvre une démarche de cybersécurité

Préparation à la certification LILATE Test d’aptitude à travailler en espagnol (RS7316)