Langage & Développement informatique

Spark Java – Développer des applications pour le Big Data

Cette formation de 21 heures permet aux développeurs Java de maîtriser le développement de traitements distribués avec Apache Spark. Les participants apprendront à manipuler RDD, DataFrames et SQL, tout en…

21h

Intermédiaire

Mixte

Description de la formation

Cette formation Spark Java s’adresse aux développeurs et architectes souhaitant maîtriser les technologies du Big Data. En 21 heures, vous apprendrez à développer des applications performantes utilisant Apache Spark avec Java, exploiter les données massives et optimiser vos traitements distribués.

Au programme : fondamentaux de Spark, programmation RDD et DataFrames, gestion des clusters, optimisation des performances et cas d’usage concrets. Cette formation de niveau intermédiaire combine sessions distanciel et présentiel pour une flexibilité maximale adaptée à votre rythme professionnel.

Éligible au CPF, cette formation est également finançable via votre OPCO ou France Travail. ESIC, organisme certifié Qualiopi, vous propose un accompagnement individualisé tout au long de votre parcours pour garantir l’acquisition de compétences opérationnelles immédiatement applicables en entreprise.

Objectifs pédagogiques

Développer un traitement distribué avec Spark en Java
Développer un traitement distribué avec Spark en Java
Manipuler RDD, DataFrames et SQL
Manipuler RDD, DataFrames et SQL
Optimiser les traitements Spark (cache, persist, partitionnement)
Optimiser les traitements Spark (cache, persist, partitionnement)
Structurer une application Spark Java efficace et réutilisable
Structurer une application Spark Java efficace et réutilisable

Programme détaillé

Module 1 Jour 1 – Introduction à Spark et RDD en Java

Architecture Spark : cluster, driver, worker
Concepts de DAG, exécution distribuée
Manipulation des RDD (map, filter, reduce)
Création de traitements Spark en Java avec fonctions lambda

Module 2 Jour 2 – DataFrames et Spark SQL

Création de DataFrames avec SparkSession
Opérations tabulaires (select, join, groupBy, aggregation)
SQL dans Spark avec Java
Plan d’exécution, cache, persist, partitionnement

Module 3 Jour 3 – Intégration, projet et bonnes pratiques

Chargement de gros fichiers (CSV, JSON, Parquet)
Dataset<Row> vs RDD : cas d’usage
Mini-projet : traitement Spark Java complet
Bilan et perspectives (exécution sur cluster, Spark Streaming, etc.)

Prérequis

Maîtrise de Java (POO, lambda, collections)
Connaissances de base en SQL et traitement de fichiers structurés

Public visé

Développeurs Java, data engineers, analystes techniques ou architectes souhaitant travailler sur le traitement de données volumineuses avec Spark

Modalités de la formation

⏱ Durée : 21h
📍 Format : Mixte (présentiel + distanciel)
📊 Niveau d'entrée : Intermédiaire
🎯 Pédagogie : Apports théoriques, exercices pratiques, études de cas, projet fil rouge
🗓️ Délai d'accès : variable selon le mode de financement, généralement de 11 jours ouvrés à 1 mois après l'inscription. En savoir plus.
♿ Accessibilité : Chaque demande émanant d'une personne en situation de handicap fait l'objet d'une étude de faisabilité et d'adaptation. Contactez notre référent handicap.

🏆

Passage de la certification obligatoire

Cette formation se conclut par le passage d'une certification officielle, indispensable à la validation de votre parcours.

Certification(s) : TP – Assistant de vie aux familles

Équipe pédagogique

Nos formations sont conçues et animées par une équipe de formateurs experts, sélectionnés pour leur double compétence : une expertise métier acquise sur le terrain et une réelle expérience pédagogique. Le suivi de chaque apprenant est assuré par un référent pédagogique dédié.

Formateurs professionnels spécialistes de leur domaine, en veille permanente sur les évolutions du secteur
Référent pédagogique dédié, disponible tout au long du parcours
Contenus régulièrement actualisés et adaptés au niveau de chaque participant
Référent handicap pour l'accueil et l'adaptation des personnes en situation de handicap

Ressources pédagogiques

Support PDF
Code Java Spark structuré (TP et projet)
Données d'entraînement (fichiers logs/CSV)
Guide d’installation et de lancement Spark local

Suivi de l'exécution et évaluation

Exercices pratiques et corrigés
Évaluation sur le mini-projet Spark Java
Feuille de présence
Questionnaire de satisfaction

Accessibilité

Nous accordons une attention particulière à l'accueil des personnes en situation de handicap. Si vous êtes concerné(e) et souhaitez suivre cette formation, nous vous invitons à nous contacter dès que possible. Ensemble, nous étudierons vos besoins spécifiques et mettrons en place les adaptations nécessaires pour garantir votre accès à la formation dans les meilleures conditions.

Fiche mise à jour le 7 juillet 2026.

Spark Java – Développer des applications pour le Big Data

Description de la formation

Objectifs pédagogiques

Programme détaillé

Prérequis

Public visé

Modalités de la formation

Équipe pédagogique

Ressources pédagogiques

Suivi de l'exécution et évaluation

Accessibilité

Cette formation prépare à

TP – Assistant de vie aux familles

Formations similaires

UML 2 – Modélisation avec Enterprise Architect

Développer avec Codex d’OpenAI

Hadoop – Développer des applications pour le Big Data

Les apprenants ont aussi consulté

RNCP38565BC02 – Exercer son activité en accueil collectif

Préparation à la certification LILATE Test d’aptitude à travailler en français langue étrangère (RS6916)

Accompagnement VAE