Manipuler ses données sous R (Réf INITR) Présentiel
Dernière mise à jour : 30/07/2025
Devenez autonome dans la gestion de vos données sous R : import, nettoyage, calculs, fusions… Cette formation vous apprend à manipuler efficacement un ou plusieurs fichiers grâce aux outils du tidyverse.
Public
Tout public
Prérequis
Aucun
Objectifs pédagogiques
- Importer et nettoyer ses données en étant autonome
- Calculer des métriques plus ou moins avancées pour résumer ses données
- Gérer une multitude de fichiers TYT
Contenu
- Importer et exporter ses données
- Présentation des fonctions d'import selon le type de fichier (excel, csv, rds, rdata)
- Contrôle de l'import des données (str, summary, contrôle de valeurs manquantes)
- Présentation des fonctions d'export selon le type de fichier (excel, csv, rds, rdata)
- Manipulations simples de données
- Rappels des commandes de base pour la manipulation de données (création, modification, suppression d'une variable)
- Introduction à l'environnement tidyverse et présentation du package dplyr
- Gestion des variables :
- Traitement des facteurs avec forcats
- Gestion des dates avec lubridate
- Manipulation des chaînes de caractères avec stringr
- Manipulations de base avec dplyr :
- Filtrer ses données avec filter
- Sélectionner des variables avec select
- Renommer des variables avec rename
- Ordonner son jeu de données avec arrange
- Utilisation du pipe %>% pour enchaîner les opérations et rendre son code plus lisible
- Manipulation avancée d'un fichier de données
- Conditions multiples et sélection avancée de données avec filter
- Présentation rapide des fonctions de statistiques descriptives communes (moyenne, médiane, …)
- Calcul de statistiques résumées sur le jeu de données avec summarise
- Agrégation : calcul de statistiques résumées par groupe avec group_by
- Format : pivoter ses données
- Manipulation de plusieurs fichiers de données
- Fusionner plusieurs fichiers complémentaires
- Empiler plusieurs fichiers identiques
Méthodes pédagogiques
- Exposés et échanges
- Manipulations, exercices pratiques
Evaluation des acquis
Questionnaire
Responsable pédagogique

DECHAUX Terence
Diplômé en 2018 du Master Ingénierie Statistique pour les sciences du vivant à l'université Paris Descartes, Terence intègre l'Institut de l'Elevage en tant qu'ingénieur statisticien. En plus de ses activités d'appui aux ingénieurs agronomes de Idele, il est chargé de diverses formations, notamment autour de R et R Shiny.
M'inscrire à la formation
Repas et hébergement
Déjeuners offerts. L'hébergement et les repas du soir ne sont ni gérés, ni pris en charge par l'Institut de l'Elevage.