01 53 90 15 20

Cette formation Cloudera qui propose sa propre distribution d’Hadoop vous permettra de traiter en temps réel de très gros volumes de données.  

Objectifs

  • Apprendre à installer et configurer Hadoop Cloudera 
  • Comprendre comment gérer en permanence et maintenir des noeuds dans le cluster 
  • Être capable d’optimiser la performance d’un cluster 
  • Comprendre comment mettre en place une haute solution de disponibilité 
  • Connaître les meilleures pratiques pour déployer un cluster Hadoop Cloudera 

3 jours

  • Programme
  • Public et Prérequis
  • Pédagogie
  • Dates et Tarifs
  • Nous contacter

Programme de la formation CLOUDERA

INTRODUCTION

  • Présentation générale d’Hadoop
  • Exemples d’utilisation dans différents secteurs
  • Historique et chiffres clés : Quand parle-t-on de Big Data ?
  • Les possibilités d’implantation de l’infrastructure et les coûts associés

L’ÉCOSYSTÈME D’HADOOP

  • Le système de fichier HDFS
  • Le paradigme MapReduce et l’utilisation à travers YARN
  • Le garant des informations : Zookeeper
  • Le système de stockage de la donnée basé sur le socle : HBase
  • La présentation de l’architecture globale : où installer les services ?
  • La définition du dimensionnement pour un cluster Hadoop
  • Les particularités de MapR

INSTALLATION DU SOCLE D’HADOOP

  • Installation et configuration manuelle pas-à-pas sur plusieurs machines de : HDFS, YARN, Zookeeper, HBase

MANIPULATION DES DONNÉES DANS UN CLUSTER HADOOP

  • Architecture, Objectif et fonctionnement de : Hue, Hive, Pig, Oozie, Sqoop, Flume, Spark
  • Mise en pratique sur les différents outils

EXPLOITATION D’ARCHITECTURE COMPLEXE

  • Architecture en rack : les avantages et fonctionnement et paramétrage du rack awareness
  • Scalabilité et performances : le Namenode Federation
  • High Availability des serveurs maitres
  • Utilisation des snapshots : sauvegarde et restauration

Public 

La formation est destinée aux administrateurs systèmes et aux personnes qui gèrent et maintiennent les clusters Apache Hadoop en production ou qui évoluent dans un environnement de développement.

Prérequis 

Afin de profiter pleinement de la formation, il est conseillé de savoir naviguer et modifier des fichiers dans l’environnement Linux. La connaissance d’Hadoop n’est pas exigée.

Modalités d’évaluation

L’évaluation des acquis se fait tout au long de la session au travers des multiples exercices à réaliser (50 à 70% du temps).

Compétences du formateur

Notre formation est animée par un expert reconnu dans son domaine possédant une expérience sur le terrain significative et des compétences pédagogiques reconnues.

Moyens pédagogiques et techniques

  • Ordinateur (PC / MAC), vidéoprojecteur, aides audiovisuelles, documentation et support de cours, exercices pratiques d’application et corrigés des exercices pour les stages pratiques, études de cas ou présentation de cas réels pour les séminaires de formation.

A l’issue de chaque stage ou séminaire, ESIC fournit aux participants :

  • Un questionnaire d’évaluation de la session
  • Une feuille d’émargement par demi-journée de présence
  • Une attestation de fin de formation

Dates 

    • 25 novembre 201927 novembre 2019 @ 

    • 24 février 202026 février 2020 @ 

    • 25 mai 202027 mai 2020 @ 

    • 24 août 202026 août 2020 @ 

( Sous réserve d’un effectif nécessaire pour l’ouverture de session )

Tarif

1690€HT/personne.

Intra-entreprise et sur-mesure

Nos consultants vous accompagnent pour adapter ce programme de formation à votre contexte.

Fermer le menu