Big Data - Analyse de données
0/10
(0 avis)
Formation créée le 16/01/2023. Dernière mise à jour le 16/03/2023.
Version du programme : 1
Programme de la formation
Objectif de formation : Appréhender les enjeux et intérêts du Big Data, puis découvrir les différents outils.
Objectifs de la formation
- Maîtriser les notions clés et les intérêts du Big Data vis-à-vis des enjeux métiers
- Appréhender l'environnement technologique nécessaire pour créer et déployer un projet Big Data
- Détenir les connaissances techniques pour manipuler et administrer des flux de données complexes, non structurés et massifs
- Mettre en oeuvre des modèles d'analyses statistiques pour répondre aux besoins métiers
- Manipuler un outil de data visualisation pour concevoir des analyses dynamiques
Profil des bénéficiaires
Pour qui
- Dataminers
- Chargés d'études statistiques
- Développeurs
- Chefs de projet
- Consultants en informatique décisionnelle
Prérequis
- Connaissances de base des modèles relationnels, des statistiques et des langages de programmation
- Connaissances de base des concepts de la Business Intelligence
Contenu de la formation
-
Introduction : notions & enjeux du Big Data
- Histoire et terminologie du Big Data
- Le Big Data aujourd'hui : chiffres clés Monde et France
- Tour d'horizon des enjeux du Big Data
- Travaux pratiques : analyse d'une architecture Big Data
-
Technologies du Big Data
- Étude de l'architecture et des composants d'Hadoop
- Présentation des modes de stockage
- Principes de fonctionnement de MapReduce, Spark, Storm...
- Tour d'horizon des différentes distributions du marché
- Installation d'une plateforme Hadoop
- Datascientist : missions et défis
- Introduction aux technologies spécifiques pour la data visualisation
- Travaux pratiques : Implémentation d'une plateforme Big Data Hadoop
-
Traitement des données structurées & non structurées
- Fonctionnement de Hadoop Distributed File System
- Importation des données externes vers HDFS
- Déployer des requêtes SQL avec HIVE
- Utilisation de PIG pour le traitement de la donnée
- Principe des ETL
- Utilisation de streaming de données massive
- Travaux pratiques : Mise en oeuvre de flux de données massives
-
Technique & méthodes Big Data analytics
- Introduction au Machine Learning & à l'IA
- Régression, Classification & Clustering
- Travail en amont : préparation des données
- Génération des modèles en R ou Python
- Ensemble Learning
- Présentation des outils du marché
- Exercice : Mise en oeuvre d'analyses
-
Data visualisation & cas d'usage concrets
- Définition du besoin de la data visualisation
- Analyse & visualisation des données
- Types de données & DataViz
- Présentation des outils de DataViz du marché
- Travaux pratiques : Implémentation & utilisation d'un outil de Data Visualisation pour concevoir des analyses dynamiques
-
Pour aller plus loin
- Bonnes pratiques
Équipe pédagogique
Professionnel expert technique et pédagogique.
Suivi de l'exécution et évaluation des résultats
- Émargement numérique
- Mises en situation
- Formulaires d’évaluation de la formation
- Certificat de réalisation de l’action de formation
Ressources techniques et pédagogiques
- Espace intranet de formation
- Documents supports de formation projetés
- Exposés théoriques
- Étude de cas concrets
- Mise à disposition en ligne de documents supports à la suite de la formation
Qualité et satisfaction
Taux de satisfaction des apprenants, nombre d'apprenants, taux et causes des abandons, taux de retour des enquêtes, taux d'interruption en cours de prestation...
0/10
(0 avis)