Hadoop - Mise en oeuvre et administration avec Hbase
0/10
(0 avis)
Formation créée le 19/05/2021. Dernière mise à jour le 17/03/2022.
Version du programme : 1
Programme de la formation
Objectifs de formation : à l’issue de la formation, le stagiaire sera capable d’installer et de mettre en œuvre une configuration distribuée de données sous la solution HBase.
Objectifs de la formation
- Appréhender l’écosystème Hadoop
- Comprendre l’architecture et le fonctionnement de HBase
- Identifier les apports d’HBase en termes de stockage distribué des données
- Mener à bien l’installation du système
- Savoir mettre en place une configuration distribuée
Profil des bénéficiaires
Pour qui
- Chefs de projets
- Administrateurs
- Toute personne souhaitant utiliser HBase
Prérequis
- Avoir des bases en Hadoop et en bases de données
Contenu de la formation
-
Introduction
- L’écosystème Hadoop
- Les bases du framework
- Le projet et les modules : Hadoop Common, HDFS, YARN, Spark…
- Introduction à HBase
- HBase & HDFS
- Les formats de données
- Définitions: table, région, ligne, famille de colonnes, cellules, espaces de nommage
- Fonctionnalitées: failover automatique, sharding, interface avec des jobs MapReduce
-
Architecture
- HBase master node
- Région master
- Liaison client HBase
- ZooKeeper
-
Installation
- Choix de packages
- Initialisation et réglages : le fichier conf/hbase-site.xml
- Initialisation en mode distribué
- Test de connexion : HBase Shell
- Travaux pratiques: manipulation depuis un serveur HTTP
-
HBase: fonctionnement avec Shell
- Introduction aux interfaces disponibles
- Commandes de base
- Manipulation des données
- Désactiver une table ou la supprimer
- Programmer des scripts
- Gérer les tables par des filtres
- Filtres de recherches et réglages des tables
- Les espaces de nommage
- Travaux pratiques: utiliser HBase Shell
-
Cluster HBase
- Utilisation en mode distribué
- Fonctionnement indépendant des démons
- Le mode distribué
- Travaux pratiques: créer et mettre en place des splits dans des tables réparties
-
Programmation
- Programmation par API
- Accès JMX
- Programmation d’un client Java
- MapReduce et la gestion des tables
- Travaux pratiques: lancement et écriture de programmes Spark
Équipe pédagogique
Professionnel expert dans le big data
Suivi de l'exécution et évaluation des résultats
- Feuilles de présence
- Mises en situation
- Formulaires d'évaluation de la formation
- Certificat de réalisation de l’action de formation
- Émargement numérique
Ressources techniques et pédagogiques
- Documents supports de formation projetés
- Exposés théoriques
- Etude de cas concrets
- Mise à disposition en ligne de documents supports à la suite de la formation
- Espace intranet de formation
Qualité et satisfaction
Taux de satisfaction des stagiaires
Progression des compétences visées
Taux d'abandon
Taux de retour des enquêtes
Taux d'interruption en cours de prestation
0/10
(0 avis)