Langage & Développement informatique

Hadoop – Développer des applications pour le Big Data

Cette formation de 28 heures permet de comprendre l’architecture Hadoop et de développer des applications pour le traitement distribué de données massives. Les participants manipulent HDFS, conçoivent des traitements MapReduce,…

28h

Intermédiaire

Mixte

Description de la formation

Cette formation Hadoop – Développer des applications pour le Big Data s’adresse aux développeurs et data engineers souhaitant maîtriser l’écosystème Hadoop pour traiter et analyser des volumes massifs de données. En 28 heures, vous apprendrez à concevoir des applications robustes utilisant MapReduce, HDFS et les frameworks associés pour transformer vos données en insights métier.

Au programme : architecture Hadoop, développement d’applications distribuées, optimisation des traitements batch, et gestion des données en environnement production. Vous alternerez entre sessions distanciel et présentiel, combinant théorie et mise en pratique intensive sur des cas réels du Big Data.

ESIC vous propose un accompagnement individualisé tout au long de votre parcours, avec un formateur expert du domaine. Cette formation est éligible CPF et peut être financée par votre OPCO ou France Travail selon votre situation professionnelle.

Organisme certifié Qualiopi, ESIC garantit une formation de qualité répondant aux standards de référence de la formation professionnelle en France.

Objectifs pédagogiques

Comprendre le fonctionnement du système de fichiers HDFS
Développer des traitements MapReduce (Java ou Python)
Exploiter les données via Hive et Pig
Structurer un pipeline Big Data sous Hadoop

Programme détaillé

Module 1 Jour 1 – Architecture Hadoop et HDFS

Introduction au Big Data
Fonctionnement du cluster Hadoop
Principe et structure de HDFS
Chargement de données, commandes HDFS

Module 2 Jour 2 – Développement MapReduce

Comprendre MapReduce (Mapper, Reducer, Combiner)
Implémentation Java et Hadoop Streaming (Python)
Tests de performances (partitions, shuffle)
TP : traitement de fichiers volumineux

Module 3 Jour 3 – Hive et Pig

Hive : SQL sur HDFS, DDL, DML, UDF
Pig : langage de transformation déclaratif
Comparaison avec MapReduce classique
TP : requêtes sur jeux de données textuels

Module 4 Jour 4 – Projet et cas concrets

Pipeline complet (stockage, traitement, analyse)
Traitement de logs, fichiers CSV, JSON
Audit du flux et mise en qualité
Perspectives vers Spark, HBase, YARN

Prérequis

Connaissance de Java ou Python
Maîtrise de SQL
Notions de base sur les architectures distribuées utiles

Public visé

Développeurs, data engineers, analystes ou profils IT souhaitant exploiter Hadoop pour des traitements distribués à grande échelle

Modalités de la formation

⏱ Durée : 28h
📍 Format : Mixte (présentiel + distanciel)
📊 Niveau d'entrée : Intermédiaire
🎯 Pédagogie : Apports théoriques, exercices pratiques, études de cas, projet fil rouge
🗓️ Délai d'accès : variable selon le mode de financement, généralement de 11 jours ouvrés à 1 mois après l'inscription. En savoir plus.
♿ Accessibilité : Chaque demande émanant d'une personne en situation de handicap fait l'objet d'une étude de faisabilité et d'adaptation. Contactez notre référent handicap.

🏆

Passage de la certification obligatoire

Cette formation se conclut par le passage d'une certification officielle, indispensable à la validation de votre parcours.

Certification(s) : TP – Assistant de vie aux familles

Équipe pédagogique

Nos formations sont conçues et animées par une équipe de formateurs experts, sélectionnés pour leur double compétence : une expertise métier acquise sur le terrain et une réelle expérience pédagogique. Le suivi de chaque apprenant est assuré par un référent pédagogique dédié.

Formateurs professionnels spécialistes de leur domaine, en veille permanente sur les évolutions du secteur
Référent pédagogique dédié, disponible tout au long du parcours
Contenus régulièrement actualisés et adaptés au niveau de chaque participant
Référent handicap pour l'accueil et l'adaptation des personnes en situation de handicap

Ressources pédagogiques

Support PDF
Scripts MapReduce (Java, Python)
Scripts Hive et Pig
Jeux de données et VM Hadoop si nécessaire

Suivi de l'exécution et évaluation

QCM sur l’architecture Hadoop
Évaluation via le mini-projet
Feuille de présence
Questionnaire de satisfaction

Accessibilité

Nous accordons une attention particulière à l'accueil des personnes en situation de handicap. Si vous êtes concerné(e) et souhaitez suivre cette formation, nous vous invitons à nous contacter dès que possible. Ensemble, nous étudierons vos besoins spécifiques et mettrons en place les adaptations nécessaires pour garantir votre accès à la formation dans les meilleures conditions.

Fiche mise à jour le 7 juillet 2026.

Hadoop – Développer des applications pour le Big Data

Description de la formation

Objectifs pédagogiques

Programme détaillé

Prérequis

Public visé

Modalités de la formation

Équipe pédagogique

Ressources pédagogiques

Suivi de l'exécution et évaluation

Accessibilité

Cette formation prépare à

TP – Assistant de vie aux familles

Formations similaires

Python – Programmation structurée et applications pratiques

RGAA – Auditer l’accessibilité d’un site web ou d’une application mobile

Programmer en C++

Les apprenants ont aussi consulté

Préparation à la certification LILATE Test d’aptitude à travailler en anglais (RS7314)

Exploiter les fonctionnalités de Microsoft Excel pour la gestion et l’analyse des données (Tosa)

Préparation à la certification LILATE Test d’aptitude à travailler en russe (RS7321)