Actions collectives - Se former sans impacter son budget formation pour les adhérents AGEFICE  ou FAFIEC.
REF ESBD005 | 3 JOURS |  BIG DATA | FORMATION 100% PRATIQUE

 

Préparez votre projet de formation.
LA FORMATION HADOOP CLOUDDERA VOUS PERMETTRA :
  • Acquérir les meilleurs pratiques pour l’administration d’Apache Hadoop 2.0
  • Savoir définir la taille d’un cluster et comment le déployer
  • Apprendre à installer et configurer Hadoop Cloudera
  • Comprendre comment gérer en permanence et maintenir des noeuds dans le cluster
  • Être capable d’optimiser la performance d’un cluster
  • Savoir déplacer et gérer les données dans le cluster ou encore ajouter et enlever des noeuds de données
  • Être en mesure de surveiller les statuts et l’état de santé du cluster dans un outil de monitoring
  • Comprendre comment mettre en place une haute solution de disponibilité
  • Connaître les meilleures pratiques pour déployer un cluster Hadoop Cloudera
Cloudera propose sa propre distribution d’Hadoop, la plus utilisée à ce jour. Cloudera propose propose également une suite d’outils permettant des traitements temps réel de très gros volumes de données.

 

CONTENU DE LA FORMATIONCOMPRIS DANS LA FORMATIONTARIFS & DATESSE RENSEIGNER
Prérequis
Afin de profiter pleinement de la formation, il est conseillé de savoir naviguer et modifier des fichiers dans l’environnement Linux. La connaissance d’Hadoop n’est pas exigée.

Public
La formation est destinée aux administrateurs systèmes et aux personnes qui gèrent et maintiennent les clusters Apache Hadoop en production ou qui évoluent dans un environnement de développement.

 

Programme de la formation CLOUDERA

INTRODUCTION

  • Présentation générale d’Hadoop
  • Exemples d’utilisation dans différents secteurs
  • Historique et chiffres clés : Quand parle-t-on de Big Data ?
  • Les possibilités d’implantation de l’infrastructure et les coûts associés

L’ÉCOSYSTÈME D’HADOOP

  • Le système de fichier HDFS
  • Le paradigme MapReduce et l’utilisation à travers YARN
  • Le garant des informations : Zookeeper
  • Le système de stockage de la donnée basé sur le socle : HBase
  • La présentation de l’architecture globale : où installer les services ?
  • La définition du dimensionnement pour un cluster Hadoop
  • Les particularités de MapR

INSTALLATION DU SOCLE D’HADOOP

  • Installation et configuration manuelle pas-à-pas sur plusieurs machines de : HDFS, YARN, Zookeeper, HBase

MANIPULATION DES DONNÉES DANS UN CLUSTER HADOOP

  • Architecture, Objectif et fonctionnement de : Hue, Hive, Pig, Oozie, Sqoop, Flume, Spark
  • Mise en pratique sur les différents outils

EXPLOITATION D’ARCHITECTURE COMPLEXE

  • Architecture en rack : les avantages et fonctionnement et paramétrage du rack awareness
  • Scalabilité et performances : le Namenode Federation
  • High Availability des serveurs maitres
  • Utilisation des snapshots : sauvegarde et restauration
  • SUIVI POST-FORMATION D’UN AN
  • SUPPORTS DE FORMATION
  • GUIDE DE BONNES PRATIQUES
INTER-ENTREPRISES : 1690€ HT par stagiaire
PARIS
    • 28 mai 2018 - 30 mai 2018 @ 

    • 27 août 2018 - 29 août 2018 @ 

    • 26 novembre 2018 - 28 novembre 2018 @ 

    • 25 février 2019 - 27 février 2019 @ 

INTRAS ET SUR MESURE
Nos consultants vous accompagnent pour adapter ce programme de formation à votre contexte.

Utilisez ce formulaire pour décrire votre projet de formation.


1
Fermer le menu
×
×

Panier