Elasticsearch - Indexation
0/10
(0 avis)
Formation créée le 17/03/2022. Dernière mise à jour le 24/04/2025.
Version du programme : 1
Programme de la formation
Objectifs de formation : à l’issue de la formation, le stagiaire sera capable de mettre en œuvre une solution de recherche performante de données volumineuses avec ElasticSearch.
Objectifs de la formation
- Situer Elasticsearch dans un écosystème Big Data
- Identifier les enjeux et les cas d'utilisation d'un moteur de recherche
- Appréhender le fonctionnement d'ElasticSearch
- Savoir installer et configurer ElasticSearch
- Indexer des volumes importants de données
- Comprendre comment administrer le système et le surveiller afin de garantir sa disponibilité
Profil des bénéficiaires
Pour qui
- Administrateur système
- Architectes
- Développeurs
- Data Analysts
- Data Engineers
Prérequis
- Disposer de solides bases en administration système Unix/Linux
Contenu de la formation
-
Présentation des moteurs de recherche
- Définitions & tour d'horizon des outils Open Source
- Implémentation d'un moteur de recherche au sein d'une App
- Enjeux & clés de succès
- Présentation d'Elasticsearch & historique des versions
-
Le projet Elasticsearch
- Historique du projet
- Apache Lucene
- Comparatif Elascticsearch / Lucene
-
Premiers pas sur Elasticsearch
- Fonctionnement en Cluster
- Installation & paramétrage
- Définitions : Node, Index & type
- Partitionnement de données
- API Rest
-
Observabilité
- Monitoring
- Logs
- Metrics
- Traces API
- Envoyer des données depuis un serveur Elastic
- Données métriques d'expédition // Données de journal d'expédition
- APM
- Applications d'observabilité
-
Indexation
- Création d'index et des documents liés
- API Rest : suppression & indexation
- Indexation en masse
- Version
- Pondération
- Pour aller plus loin : tour d'horizon des fonctionnalités avancées
-
Mapping
- Qu'est ce que le mapping ?
- Intérêt du mapping
- Type de champs
- Focus sur les champs prédéfinis
- Méta données d'un Index
-
Analyse & extraction de texte
- Notions fondamentales de l'extraction et de l'analyse de texte : analysers, char filters, tokenizers, token filters
- Cas d'usage
- Paramétrage & manipulation des analyzers prédéfinis ou customisés
- Analyse de texte multilingue
- Suppression de mots
- Extraction d'adresses email & d'URLs
- Suppression de balises HTML
- Correction orthographique
- Indexation de fichiers binaires
-
Recherche de documents
- Recherche par l'API Rest
- Gestion des résultats
- Types de requêtes
- Requêtes & filtres
- Types de filtres
- Combinaison de filtres
- Pertinence & score
- Suggestions
- Autocomplétion
- Highlighting
- Recherche Objets / Nested / Parent-Enfant
- More Like This
- Recherche géospatiale
-
Elasticsearch & API Java
- Types de clients disponibles
- Intégration Java / Elasticsearch
- API Java
- Indexation & recherche de documents
- Gestion des index
- Gestion des mappings
-
Cloud & clusterisation
- Fonctionnement d'un cluster Elasticsearch
- Split brains
- Paramétrage du cluster
- Scalabilité & volumétrie de données
- Sauvegarde & restauration du cluster
- Supervision du cluster
-
Pour aller plus loin
- Plugins Elasticsearch
- River
- Scripting
- Pré-chauffage du cluster
- Percolation
- Maintenance des nodes
- Répartition des indexes sur différents nodes
- Requêtes et statistiques
Équipe pédagogique
Professionnel expert technique et pédagogique.
Suivi de l'exécution et évaluation des résultats
- Feuilles de présence.
- Questions orales ou écrites (QCM).
- Mises en situation.
- Formulaires d'évaluation de la formation.
- Certificat de réalisation de l’action de formation.
Ressources techniques et pédagogiques
- Espace numérique de travail
- Documents supports de formation projetés
- Exposés théoriques
- Etude de cas concrets
- Quiz en salle
- Mise à disposition en ligne de documents supports à la suite de la formation
Qualité et satisfaction
Taux de satisfaction des apprenants, nombre d'apprenants, taux et causes des abandons, taux de retour des enquêtes, taux d'interruption en cours de prestation...
0/10
(0 avis)