Logo de l'organisme de formation

La formation au coeur de l'avenir technologique

Représentation de la formation : Big Data - Analyse de données

Big Data - Analyse de données

Formation à distance
Durée : 35 heures (5 jours)
Durée :35 heures (5 jours)
HT
Se préinscrire
Durée :35 heures (5 jours)
HT
Se préinscrire
Durée :35 heures (5 jours)
HT
Se préinscrire

Formation créée le 16/01/2023. Dernière mise à jour le 16/03/2023.

Version du programme : 1

Programme de la formation

Objectif de formation : Appréhender les enjeux et intérêts du Big Data, puis découvrir les différents outils.

Objectifs de la formation

  • Maîtriser les notions clés et les intérêts du Big Data vis-à-vis des enjeux métiers
  • Appréhender l'environnement technologique nécessaire pour créer et déployer un projet Big Data
  • Détenir les connaissances techniques pour manipuler et administrer des flux de données complexes, non structurés et massifs
  • Mettre en oeuvre des modèles d'analyses statistiques pour répondre aux besoins métiers
  • Manipuler un outil de data visualisation pour concevoir des analyses dynamiques

Profil des bénéficiaires

Pour qui
  • Dataminers
  • Chargés d'études statistiques
  • Développeurs
  • Chefs de projet
  • Consultants en informatique décisionnelle
Prérequis
  • Connaissances de base des modèles relationnels, des statistiques et des langages de programmation
  • Connaissances de base des concepts de la Business Intelligence

Contenu de la formation

  • Introduction : notions & enjeux du Big Data
    • Histoire et terminologie du Big Data
    • Le Big Data aujourd'hui : chiffres clés Monde et France
    • Tour d'horizon des enjeux du Big Data
    • Travaux pratiques : analyse d'une architecture Big Data
  • Technologies du Big Data
    • Étude de l'architecture et des composants d'Hadoop
    • Présentation des modes de stockage
    • Principes de fonctionnement de MapReduce, Spark, Storm...
    • Tour d'horizon des différentes distributions du marché
    • Installation d'une plateforme Hadoop
    • Datascientist : missions et défis
    • Introduction aux technologies spécifiques pour la data visualisation
    • Travaux pratiques : Implémentation d'une plateforme Big Data Hadoop
  • Traitement des données structurées & non structurées
    • Fonctionnement de Hadoop Distributed File System
    • Importation des données externes vers HDFS
    • Déployer des requêtes SQL avec HIVE
    • Utilisation de PIG pour le traitement de la donnée
    • Principe des ETL
    • Utilisation de streaming de données massive
    • Travaux pratiques : Mise en oeuvre de flux de données massives
  • Technique & méthodes Big Data analytics
    • Introduction au Machine Learning & à l'IA
    • Régression, Classification & Clustering
    • Travail en amont : préparation des données
    • Génération des modèles en R ou Python
    • Ensemble Learning
    • Présentation des outils du marché
    • Exercice : Mise en oeuvre d'analyses
  • Data visualisation & cas d'usage concrets
    • Définition du besoin de la data visualisation
    • Analyse & visualisation des données
    • Types de données & DataViz
    • Présentation des outils de DataViz du marché
    • Travaux pratiques : Implémentation & utilisation d'un outil de Data Visualisation pour concevoir des analyses dynamiques
  • Pour aller plus loin
    • Bonnes pratiques
Équipe pédagogique

Professionnel expert technique et pédagogique.

Suivi de l'exécution et évaluation des résultats
  • Émargement numérique
  • Mises en situation
  • Formulaires d’évaluation de la formation
  • Certificat de réalisation de l’action de formation
Ressources techniques et pédagogiques
  • Espace intranet de formation
  • Documents supports de formation projetés
  • Exposés théoriques
  • Étude de cas concrets
  • Mise à disposition en ligne de documents supports à la suite de la formation

Qualité et satisfaction

Taux de satisfaction des apprenants, nombre d'apprenants, taux et causes des abandons, taux de retour des enquêtes, taux d'interruption en cours de prestation...