Faire parler ses données grâce au Data mining (Réf RANMU) Présentiel
Dernière mise à jour : 24/07/2025
Dans cette formation, l'accent est mis sur les procédures de type Data Mining permettant de synthétiser, de la manière la plus objective possible, de vastes ensembles de données issues d'enquêtes ponctuelles ou d'exploitations de bases de données.
Public
Tout public
Prérequis
Avoir des connaissances de bases en statistique (moyenne, variance,...) ainsi qu'une pratique des fonctions de base du logiciel R (import de fichiers, manipulation des données et des objets R,...)
Objectifs pédagogiques
- Choisir les méthodes de Data Mining appropriées aux questions posées et à la nature des données
- Expliquer l'intérêt et les conditions d'application des méthodes présentées
- Appliquer, à l'aide du logiciel R, les différentes méthodes
- Interpréter les sorties de chaque méthode
Contenu
- Panorama des principales méthodes en Data Mining
- Les statistiques descriptives
- L'Analyse en Composantes Principales (ACP) et l'Analyse des Correspondances Multiples (ACM), méthodes décrivant une population sur un ensemble de variables et définissent des variables synthétiques discriminant de façon optimale les individus constituant cette population.
- La classification par analyse typologique (partitions directes, CAH) : formation de classes d'individus, de manière à ce que les individus d'une même classe soient les plus ressemblants possible sur un certain nombre de variables et que les classes construites soient les plus différentes possible
- Segmentation par arbre (CART et Random Forest) :
- les arbres de décision (régression) pour caractériser les classes (variations) d'une variable à expliquer, et de prédire cette variable pour de nouvelles observations
- la méthode des forêts aléatoires pour hiérarchiser l'importance des variables explicatives
Méthodes pédagogiques
- Exposés et échanges
- Manipulations et exercices pratiques sur des études de cas mises en œuvre avec le logiciel R
Evaluation des acquis
Questionnaire
Responsable pédagogique

BARON Alisson
Diplômée d’un Master Ingénierie Statistique pour les sciences du vivant à l’Université Paris Descartes, Alisson travaille trois ans en tant qu’ingénieure de recherche dans le secteur privé. Elle devient Data Scientist pour le service DATA’STAT d'Idele en 2021, assurant des formations et des appuis statistiques aux projets de recherche.
M'inscrire à la formation
Repas et hébergement
Déjeuners offerts. L'hébergement et les repas du soir ne sont ni gérés, ni pris en charge par l'Institut de l'Elevage.