Logo de l'organisme de formation

La formation au coeur de l'avenir technologique

Représentation de la formation : Data Science - Programmation R

Data Science - Programmation R

Formation à distance
Durée : 21 heures (3 jours)
Durée :21 heures (3 jours)
HT
Se préinscrire
Durée :21 heures (3 jours)
HT
Se préinscrire
Durée :21 heures (3 jours)
HT
Se préinscrire

Formation créée le 05/01/2022.

Version du programme : 1

Programme de la formation

Objectif de formation : Au terme de la formation l'apprenant aura pris en main le langage de programmation R et détiendra des compétences de base en Data Science grâce à lui.

Objectifs de la formation

  • Savoir utiliser la bibliothèque H2O
  • Manipuler les modèles de Machine Learning et de Deep Learning sous H2O
  • Reconnaître les cas d'utilisation avec Spark

Profil des bénéficiaires

Pour qui
  • Statisticiens
  • Consultants Big Data
  • Data analysts
  • Data scientists
Prérequis
  • Avoir des connaissances en Machine Learning
  • Avoir des bases en programmation R

Contenu de la formation

  • Introduction au Machine Learning
    • Présentation des notions de bases
    • Modèles & Machine Learning
    • Deep Learning
    • AutoML
  • Présentation d'H2O
    • Notions et cas d'usages
    • Installation
    • Introduction à R
    • Travaux pratiques : installation et première utilisation d'H2O
  • Arbres et forêts
    • Définitions
    • Arbres de décisions
    • Random Forest & H2O
    • Gradient Boosting Machine & H2O
    • Overfitting & train / validation / test
    • Validation croisée & H2O
    • Travaux pratiques : création d'arbres de décisions et études des résultats
  • Modèles linéaires
    • Définitions
    • Régression linéaire
    • Régression logistique
    • Naïve bayésien
    • Hyperparamètre
    • Travaux pratiques : création d'une régression et études des résultats
  • Data Manipulation
    • Chargement et exportation de la donnée sous H2O
    • Exploration de la donnée
    • Manipulation de la donnée
  • Deep learning H2O
    • Réseaux neuronaux
    • Deep learning & le Grid Search
    • Régression en Deep Learning
  • Architecture et sécurité sous H2O
    • H2O Stack logiciel
    • API REST
    • Interaction avec R
    • Sécurisation des modèles
    • SSL Sécurité
  • Présentation du Sparkling Water
    • Cas d'utilisation nominale
    • Construction de modèles
    • Le munging de données
    • Les processus en stream
    • Présentation des fonctionnalités
    • Les sources de données supportées
    • Formats de données supportées
    • Environnements d'exécutions Spark supportés
  • API H2O
    • Démarrage des services H2O
    • L'allocation mémoire
    • Conversion d'H2OFrame : RDD & DataFrame
    • Convertion du RDD et DataFrame au H2OFrame
    • Création d'un H2OFrame à partir d'une clé existante
    • Le mapping des types entre H2OFrame et Spark DataFrame
    • Appeler les algorithmes H2O
    • Utilisation de Spark Data Sources avec H2OFrame
    • H2OFrame : lecture & enregistrement
    • Chargement et sauvegarde des options
    • Spécification du mode d'enregistrement à appliquer
  • H2O en production
    • POJO & MOJO
    • MOJO Quick Start
    • POJO Quick Start
    • Illustrations de design patterns
    • Ressources supplémentaires
Équipe pédagogique

Professionnel expert technique et pédagogique.

Suivi de l'exécution et évaluation des résultats
  • Feuilles de présence.
  • Questions orales ou écrites (QCM).
  • Mises en situation.
  • Formulaires d'évaluation de la formation.
  • Certificat de réalisation de l’action de formation.
Ressources techniques et pédagogiques
  • Espace numérique de travail
  • Documents supports de formation projetés
  • Exposés théoriques
  • Etude de cas concrets
  • Quiz en salle
  • Mise à disposition en ligne de documents supports à la suite de la formation