Formation machine learning avec R - Pyranhia

Formation de 5 jours pour maîtriser le Machine Learning supervisé avec R (tidymodels, keras) : de la théorie aux projets concrets.
Auteur·rice

Pyranhia

Mots clés

Machine Learning, R, tidymodels, Keras, Deep Learning, Data Science, Formation francophone

Machine Learning avec R

Développez des modèles prédictifs performants en 5 jours.

5
jours intensifs

6
participants max

4
types de modèles

1
projet concret

Objectifs

Acquérir les bases du Machine Learning supervisé avec R pour concevoir, évaluer et déployer des modèles prédictifs fiables en s’appuyant sur les écosystèmes tidymodels et keras.

À l’issue de la formation, vous saurez choisir le bon modèle, éviter les pièges classiques et interpréter les résultats dans le cadre de problèmes réels.

Public visé

Développeurs, data‑scientists, analystes, managers techniques, personnes en reconversion.

Prérequis

Cette formation s’adresse à des personnes ayant déjà une première expérience avec R et des bases en statistiques.

Statistiques & logique

  • comprendre les notions de moyenne, médiane, variance et écart-type ;
  • distinguer variable quantitative et variable qualitative ;
  • savoir interpréter un tableau de données ;
  • comprendre la logique conditionnelle (“si”, “et”, “ou”).

Programmation R

  • être à l’aise avec les structures de base : data.frame, tibble, vecteurs ;
  • savoir manipuler des données avec dplyr : filter(), select(), mutate(), group_by(), summarise() ;
  • connaître les fonctions de base : summary(), str(), head(), mean() ;
  • avoir déjà créé un graphique avec ggplot2 (même basique) ;
  • utiliser le pipe |> ou %>%.

Environnement

  • savoir utiliser RStudio (console, éditeur de scripts, environnement) ;
  • avoir installé et chargé des packages avec install.packages() et library() ;
  • savoir sauvegarder et charger des données (CSV, RDS).

Question 1 : Manipulation de données

Vous avez un tableau penguins avec les colonnes species, bill_length_mm, body_mass_g. Que fait ce code ?

penguins |> 
  filter(species == "Adelie") |> 
  summarise(masse_moyenne = mean(body_mass_g))

Question 2 : Statistiques de base

Vous avez ces valeurs : 3, 5, 7, 9, 100. Laquelle de ces affirmations est vraie ?

Question 3 : Visualisation

Quel type de graphique ggplot2 utiliseriez-vous pour visualiser la relation entre deux variables quantitatives ?

Question 4 : Logique

Que retourne cette expression si x = 5 ?

(x > 3) & (x < 10)

Question 5 : Variables

Dans un dataset contenant des informations sur des voitures, laquelle de ces variables est qualitative ?

1-C | 2-B | 3-C | 4-A | 5-B

4/5 ou plus ? Vous êtes prêt·e pour cette formation !
Moins de 4/5 ? Consultez d’abord notre formation d’introduction à R

Ce que vous allez maîtriser

  • concepts fondamentaux : apprentissage supervisé vs non‑supervisé, régression vs classification, notions de prédicteur vs cible, prédictif vs explicatif ;
  • validation et évaluation : data‑split, cross‑validation, métriques d’évaluation ;
  • modèles classiques : arbres de décision et dérivés (Random Forest, Boosting) avec tidymodels ;
  • introduction au Deep Learning : réseaux de neurones multilayer perceptron (MLP), CNN avec keras, transfer learning ;
  • gestion des données complexes : jeux déséquilibrés, dataset shift, données spatiales ;
  • interprétation : comprendre quelles variables influencent le modèle et visualiser leur impact.

Informations pratiques

Format En ligne via Posit Connect – aucune installation requise
Capacité Maximum 6 participants pour un suivi personnalisé
Durée 5 jours : 4 jours de formation + 1 jour de mise en pratique (QCM + projet guidé)
Tarif 2000€ HT (2400€ TTC)
Prochaine session Calendrier 2026 à venir
Inscription contact@pyranhia.eu

Vous repartez avec

  • Code R complet et commenté de tous les ateliers
  • Supports de cours accessibles en ligne
  • 2 séances de suivi post-formation (30 min)
  • Certificat de participation

Programme

Jour 1 : Bases du ML & premiers modèles

  • Définitions clés : ML/DL/IA, supervision, régression/classification
  • Principes : train/test split, cross-validation, métriques essentielles
  • Atelier : régression logistique & régression linéaire

Jour 2 : Modèles avancés & optimisation

  • Réseaux de neurones (MLP) : architecture et applications
  • Méthodes basées sur les arbres : Random Forest, Boosting
  • Introduction au tuning d’hyperparamètres (learning rate, nombre d’arbres)

Jour 3 : Optimisation avancée, biais & interprétation

  • Optimisation avancée des hyperparamètres
  • Gestion des biais liés aux déséquilibres de donnée
  • Interprétation des modèles : importance des variables et effets des prédicteurs

Jour 4 : Deep Learning & vision

  • Classification d’images : features vs pixels, limites du MLP
  • CNN : convolutions, deep features, transfer learning
  • Entraînement pratique avec keras
  • Aperçu des Transformers

Jour 5 : Mise en pratique

  • QCM de validation des acquis
  • Projet pratique guidé : cycle complet de ML (préparation, modélisation, interprétation)
  • Support individualisé pour vos questions
  • Retour personnalisé sur votre projet