Big Data - Analyse de données

Formation créée le 16/01/2023. Dernière mise à jour le 16/03/2023.
Version du programme : 1

Type de formation

Formation à distance

Durée de formation

35 heures (5 jours)

Big Data - Analyse de données


Objectif de formation : Appréhender les enjeux et intérêts du Big Data, puis découvrir les différents outils.

Objectifs de la formation

  • Maîtriser les notions clés et les intérêts du Big Data vis-à-vis des enjeux métiers
  • Appréhender l'environnement technologique nécessaire pour créer et déployer un projet Big Data
  • Détenir les connaissances techniques pour manipuler et administrer des flux de données complexes, non structurés et massifs
  • Mettre en oeuvre des modèles d'analyses statistiques pour répondre aux besoins métiers
  • Manipuler un outil de data visualisation pour concevoir des analyses dynamiques

Profil des bénéficiaires

Pour qui
  • Dataminers
  • Chargés d'études statistiques
  • Développeurs
  • Chefs de projet
  • Consultants en informatique décisionnelle
Prérequis
  • Connaissances de base des modèles relationnels, des statistiques et des langages de programmation
  • Connaissances de base des concepts de la Business Intelligence

Contenu de la formation

Introduction : notions & enjeux du Big Data
  • Histoire et terminologie du Big Data
  • Le Big Data aujourd'hui : chiffres clés Monde et France
  • Tour d'horizon des enjeux du Big Data
  • Travaux pratiques : analyse d'une architecture Big Data
Technologies du Big Data
  • Étude de l'architecture et des composants d'Hadoop
  • Présentation des modes de stockage
  • Principes de fonctionnement de MapReduce, Spark, Storm...
  • Tour d'horizon des différentes distributions du marché
  • Installation d'une plateforme Hadoop
  • Datascientist : missions et défis
  • Introduction aux technologies spécifiques pour la data visualisation
  • Travaux pratiques : Implémentation d'une plateforme Big Data Hadoop
Traitement des données structurées & non structurées
  • Fonctionnement de Hadoop Distributed File System
  • Importation des données externes vers HDFS
  • Déployer des requêtes SQL avec HIVE
  • Utilisation de PIG pour le traitement de la donnée
  • Principe des ETL
  • Utilisation de streaming de données massive
  • Travaux pratiques : Mise en oeuvre de flux de données massives
Technique & méthodes Big Data analytics
  • Introduction au Machine Learning & à l'IA
  • Régression, Classification & Clustering
  • Travail en amont : préparation des données
  • Génération des modèles en R ou Python
  • Ensemble Learning
  • Présentation des outils du marché
  • Exercice : Mise en oeuvre d'analyses
Data visualisation & cas d'usage concrets
  • Définition du besoin de la data visualisation
  • Analyse & visualisation des données
  • Types de données & DataViz
  • Présentation des outils de DataViz du marché
  • Travaux pratiques : Implémentation & utilisation d'un outil de Data Visualisation pour concevoir des analyses dynamiques
Pour aller plus loin
  • Bonnes pratiques

Équipe pédagogique

Professionnel expert technique et pédagogique.

Suivi de l'exécution et évaluation des résultats

  • Émargement numérique
  • Mises en situation
  • Formulaires d’évaluation de la formation
  • Certificat de réalisation de l’action de formation

Ressources techniques et pédagogiques

  • Espace intranet de formation
  • Documents supports de formation projetés
  • Exposés théoriques
  • Étude de cas concrets
  • Mise à disposition en ligne de documents supports à la suite de la formation

Qualité et satisfaction

Taux de satisfaction des apprenants, nombre d'apprenants, taux et causes des abandons, taux de retour des enquêtes, taux d'interruption en cours de prestation...