Faire parler ses données grâce au Data mining (Réf RANMU) Présentiel

Dernière mise à jour : 24/07/2025

Dans cette formation, l'accent est mis sur les procédures de type Data Mining permettant de synthétiser, de la manière la plus objective possible, de vastes ensembles de données issues d'enquêtes ponctuelles ou d'exploitations de bases de données.

Public

Tout public

Prérequis

Avoir des connaissances de bases en statistique (moyenne, variance,...) ainsi qu'une pratique des fonctions de base du logiciel R (import de fichiers, manipulation des données et des objets R,...)

Objectifs pédagogiques

  • Choisir les méthodes de Data Mining appropriées aux questions posées et à la nature des données
  • Expliquer l'intérêt et les conditions d'application des méthodes présentées
  • Appliquer, à l'aide du logiciel R, les différentes méthodes
  • Interpréter les sorties de chaque méthode

Contenu

  • Panorama des principales méthodes en Data Mining
  • Les statistiques descriptives
  • L'Analyse en Composantes Principales (ACP) et l'Analyse des Correspondances Multiples (ACM), méthodes décrivant une population sur un ensemble de variables et définissent des variables synthétiques discriminant de façon optimale les individus constituant cette population.
  • La classification par analyse typologique (partitions directes, CAH) : formation de classes d'individus, de manière à ce que les individus d'une même classe soient les plus ressemblants possible sur un certain nombre de variables et que les classes construites soient les plus différentes possible
  • Segmentation par arbre (CART et Random Forest) :
    • les arbres de décision (régression) pour caractériser les classes (variations) d'une variable à expliquer, et de prédire cette variable pour de nouvelles observations
    • la méthode des forêts aléatoires pour hiérarchiser l'importance des variables explicatives

Méthodes pédagogiques

  • Exposés et échanges
  • Manipulations et exercices pratiques sur des études de cas mises en œuvre avec le logiciel R

Evaluation des acquis

Questionnaire

Responsable pédagogique

...

BARON Alisson

Diplômée d’un Master Ingénierie Statistique pour les sciences du vivant à l’Université Paris Descartes, Alisson travaille trois ans en tant qu’ingénieure de recherche dans le secteur privé. Elle devient Data Scientist pour le service DATA’STAT d'Idele en 2021, assurant des formations et des appuis statistiques aux projets de recherche.

M'inscrire à la formation



PARIS


HARDY Clotilde
Détail des créneaux de la session sélectionnée :
Finaliser l'inscription

Repas et hébergement

Déjeuners offerts. L'hébergement et les repas du soir ne sont ni gérés, ni pris en charge par l'Institut de l'Elevage.

Session sélectionnée

  • 27/11/25 → 28/11/25
    PARIS (75)
  • Détails :

    27/11/25 : 9:30 → 12:30
    13:30 → 17:30
    28/11/25 : 9:00 → 12:30
    13:30 → 17:00

Prochaines Sessions

Accessibilité

Sélectionnez le niveau de contraste souhaité
Adaptez la taille de la police
Sélectionnez la police de caractères souhaitée