Aller au contenu
Virtualisation, Cloud, Devops

Private Cloud & Big Data – Déployer une infrastructure big data sécurisée en cloud privé

Apprenez à déployer et administrer une plateforme Big Data sécurisée dans un cloud privé, avec les outils clés de l’ingénierie moderne des données et de la virtualisation.

Intermédiaire
Blended

Description de la formation

1. Cloud privé : définition, enjeux et architecture

  • Cloud privé vs public vs hybride
  • Technologies : OpenStack, Proxmox, VMware vSphere
  • Approche “Infrastructure as Code” (Terraform, Ansible)
  • Sécurité et conformité RGPD / SecNumCloud

2. Plateformes Big Data dans un cloud privé

  • Hadoop : HDFS, YARN, MapReduce
  • Spark : architecture, in-memory, DataFrame
  • Kafka : ingestion en streaming, résilience
  • Hive / Impala : requêtage SQL-like
  • Déploiement local ou en conteneurs (Docker + Kubernetes ou Rancher)

3. Cas pratique : déploiement d’un environnement Big Data on-prem

  • Création d’un cluster virtualisé sous OpenStack
  • Installation de la suite Hadoop/Spark
  • Ingestion de données via Kafka (fichiers CSV + API REST)
  • Traitement distribué et restitution avec SparkSQL

4. Supervision, sécurisation et monitoring

  • Monitoring avec Grafana, Prometheus, ElasticSearch
  • Gestion des accès : Kerberos, LDAP, SSO
  • Encryption des flux et des données au repos
  • Analyse de performances et gestion du stockage (NAS, Ceph)

Objectifs pédagogiques

  • Comprendre les fondements de l’architecture cloud privé et ses cas d’usage big data
  • Déployer une plateforme big data (Hadoop, Spark, Kafka) sur un cloud privé virtualisé
  • Sécuriser les flux, accès et données dans un environnement souverain
  • Superviser les performances et piloter le stockage et le traitement des volumes massifs

Programme détaillé

Module 1 1. Cloud privé : définition, enjeux et architecture
  • Cloud privé vs public vs hybride
  • Technologies : OpenStack, Proxmox, VMware vSphere
  • Approche “Infrastructure as Code” (Terraform, Ansible)
  • Sécurité et conformité RGPD / SecNumCloud
Module 2 2. Plateformes Big Data dans un cloud privé
  • Hadoop : HDFS, YARN, MapReduce
  • Spark : architecture, in-memory, DataFrame
  • Kafka : ingestion en streaming, résilience
  • Hive / Impala : requêtage SQL-like
  • Déploiement local ou en conteneurs (Docker + Kubernetes ou Rancher)
Module 3 3. Cas pratique : déploiement d’un environnement Big Data on-prem
  • Création d’un cluster virtualisé sous OpenStack
  • Installation de la suite Hadoop/Spark
  • Ingestion de données via Kafka (fichiers CSV + API REST)
  • Traitement distribué et restitution avec SparkSQL
Module 4 4. Supervision, sécurisation et monitoring
  • Monitoring avec Grafana, Prometheus, ElasticSearch
  • Gestion des accès : Kerberos, LDAP, SSO
  • Encryption des flux et des données au repos
  • Analyse de performances et gestion du stockage (NAS, Ceph)

Prérequis

  • Maîtrise des systèmes Linux, réseaux, bases de données et principes de virtualisation.

Public visé

  • Architectes systèmes, ingénieurs cloud, data engineers
  • Responsables IT, administrateurs de clusters big data
  • Toute personne impliquée dans des projets data sur infrastructures internes

Modalités de la formation

  • 📍 Format : Mixte (présentiel + distanciel)
  • 📊 Niveau d'entrée : Intermédiaire
  • 👥 Effectif : 4 à 12 stagiaires (groupe restreint)
  • 🎯 Pédagogie : Apports théoriques, exercices pratiques, études de cas, projet fil rouge
  • ♿ Accessibilité : Formations accessibles aux personnes en situation de handicap. Contactez notre référent handicap.