Hadoop - Mise en oeuvre et administration avec Hbase

Formation créée le 19/05/2021. Dernière mise à jour le 17/03/2022.
Version du programme : 1

Type de formation

Formation à distance

Durée de formation

14 heures (2 jours)

Hadoop - Mise en oeuvre et administration avec Hbase


Objectifs de formation : à l’issue de la formation, le stagiaire sera capable d’installer et de mettre en œuvre une configuration distribuée de données sous la solution HBase.

Objectifs de la formation

  • Appréhender l’écosystème Hadoop
  • Comprendre l’architecture et le fonctionnement de HBase
  • Identifier les apports d’HBase en termes de stockage distribué des données
  • Mener à bien l’installation du système
  • Savoir mettre en place une configuration distribuée

Profil des bénéficiaires

Pour qui
  • Chefs de projets
  • Administrateurs
  • Toute personne souhaitant utiliser HBase
Prérequis
  • Avoir des bases en Hadoop et en bases de données

Contenu de la formation

Introduction
  • L’écosystème Hadoop
  • Les bases du framework
  • Le projet et les modules : Hadoop Common, HDFS, YARN, Spark…
  • Introduction à HBase
  • HBase & HDFS
  • Les formats de données
  • Définitions: table, région, ligne, famille de colonnes, cellules, espaces de nommage
  • Fonctionnalitées: failover automatique, sharding, interface avec des jobs MapReduce
Architecture
  • HBase master node
  • Région master
  • Liaison client HBase
  • ZooKeeper
Installation
  • Choix de packages
  • Initialisation et réglages : le fichier conf/hbase-site.xml
  • Initialisation en mode distribué
  • Test de connexion : HBase Shell
  • Travaux pratiques: manipulation depuis un serveur HTTP
HBase: fonctionnement avec Shell
  • Introduction aux interfaces disponibles
  • Commandes de base
  • Manipulation des données
  • Désactiver une table ou la supprimer
  • Programmer des scripts
  • Gérer les tables par des filtres
  • Filtres de recherches et réglages des tables
  • Les espaces de nommage
  • Travaux pratiques: utiliser HBase Shell
Cluster HBase
  • Utilisation en mode distribué
  • Fonctionnement indépendant des démons
  • Le mode distribué
  • Travaux pratiques: créer et mettre en place des splits dans des tables réparties
Programmation
  • Programmation par API
  • Accès JMX
  • Programmation d’un client Java
  • MapReduce et la gestion des tables
  • Travaux pratiques: lancement et écriture de programmes Spark

Équipe pédagogique

Professionnel expert dans le big data

Suivi de l'exécution et évaluation des résultats

  • Feuilles de présence
  • Mises en situation
  • Formulaires d'évaluation de la formation
  • Certificat de réalisation de l’action de formation
  • Émargement numérique

Ressources techniques et pédagogiques

  • Documents supports de formation projetés
  • Exposés théoriques
  • Etude de cas concrets
  • Mise à disposition en ligne de documents supports à la suite de la formation
  • Espace intranet de formation

Qualité et satisfaction

Taux de satisfaction des stagiaires Progression des compétences visées Taux d'abandon Taux de retour des enquêtes Taux d'interruption en cours de prestation