XLSTAT rejoint le groupe Lumivero - En savoir plus.

Formations & Webinars

Addinsoft organise des sessions publiques (inter-entreprises) ou privées (intra-entreprise) pour tous les niveaux. Vous pouvez consulter nos programmes disponibles ou nous contacter pour une formation sur mesure. Toutes nos formations sont disponibles en classe virtuelle.

Analyses multivariées, classification (ACP, AFC, ACM, CAH, k-means, AFD)

Comment choisir la méthode d’analyse multivariée ou de classification selon le contexte ? Ce cours s’adresse aux analystes souhaitant étudier les liens entre plusieurs variables ou regrouper des objets avec des caractéristiques communes.

durée

4 jours
28 H

Prix

VOIR PLAQUETTE

Documents

arrow down

Cette formation s'adresse à des personnes souhaitant maîtriser les concepts et la mise en œuvre des analyses factorielles multivariées. Ces analyses ont pour objectif d’extraire des informations de données ; volumineuses en nombre de variables, volumineuses en nombre d'individus, non structurées, comportant des variables redondantes (confusions entre variables).

Thèmes principaux :

  • Analyse en Composantes Principales (ACP)
  • Analyse Factorielle des Correspondances Simples (AFC)
  • Analyse Factorielle des Correspondances Multiples (AFCM)
  • Classification Ascendante Hiérarchique (CAH)
  • k-means
  • Analyse Factorielle Discriminante (AFD)

Prérequis :

Il est nécessaire que les participants possèdent de bonnes connaissances sur les outils statistiques de base : corrélation, écart-type, variance, intervalles de confiance, tests d'hypothèses.

Programme :

Généralités sur les différentes méthodes d’analyses multidimensionnelles

  • Limites des statistiques classiques
  • Champs d'application des différentes méthodes d'analyses multidimensionnelles
  • Introduction sur le data mining  :
    • Objectifs de description
    • Objectifs de prédiction
  • Structure des jeux de données
  • Présentation de l'éventail des méthodes :
    • Analyse en Composantes Principales
    • Analyse Factorielle des Correspondances Simples et Multiples
    • Analyse Canonique des Corrélations
    • Analyse Factorielle Discriminante
    • Méthodes de classification : classification ascendante hiérarchique, k-means
  • Principes généraux des différentes méthodes - Notions de : 
    • Distance, 
    • Inertie et variance 
    • Axes factoriels

Notion de corrélation

  • Définition du coefficient de corrélation
  • Interprétation de la valeur du coefficient de corrélation
  • Les confusions : corrélation, causalité, pente…
  • Les différents coefficients de corrélation :
    • Coefficient de Pearson
    • Coefficient de Spearman

Mise en œuvre d'une Analyse en Composante Principales (ACP)

  • Structure du jeu de données et contexte d’application
  • Interprétation des sorties logiciel

Mise en œuvre d’une classification par une k-means

  • Présentation des objectifs de la méthode des k-means
  • Avantages et inconvénients de la CAH et des k-means
  • Détermination des clusters
  • Présentation des différentes versions de l'algorithme
  • Utilisation de la k-means en complément de l’ACP
  • Classification sur grand jeu de données
  • Conseils de mise en œuvre 
  • Interprétation des sorties logiciel

Mise en œuvre d'une Analyse Factorielle Discriminante (AFD)

  • Structure du jeu de données et contexte d’application
  • Objectifs détaillés de l'AFD
  • Notions de classement et de discrimination
  • Méthodologie de l’AFD
  • Comparaison avec l’ACP
  • Interprétation des sorties du logiciel : cercle factoriels, corrélations variables x axes
  • Qualité de l'AFD (de la discrimination obtenue) :
    • Tests univariés et multivariés (lambda de Wilks)
    • Graphique des individus
    • Matrice de confusion (et éventuellement courbe ROC)
  • Les confusions et erreurs à ne pas commettre
     

Profils des formateurs


Thierry Anthouard

Formateur en statistique

thierry-anthouard-xlstat-trainer.jpg

Responsable de la filière statistique du groupe Arkesys et formateur en statistique, Thierry Anthouard est passionné depuis toujours par le domaine de la statistique. C’est en 1992 qu’il a lancé le développement de la filière formation statistique du Groupe Arkesys. Son approche pédagogique “par l’exemple” lui permet de vulgariser la statistique et de la rendre accessible à tous les apprenants. Consultant dédié à l’accompagnement de clients grands comptes, il s’adapte à tout type de contexte et de problématique d’apprentissage.

Jérôme-Philippe Garsi

Formateur en statistique

jerome-philippe-garsi-xlstat-trainer.jpg

Formateur en statistique, Jérôme-Philippe Garsi bénéficie d’une expérience de 13 ans dans le domaine de la formation. Depuis son doctorat sur des questions cliniques, ses travaux visent principalement l'intérêt des populations, leur santé et leur bien-être. A l'aise quel que soit le public, il fait de la pédagogie et de la vulgarisation des connaissances scientifiques un impératif. Pour cela, il fait toujours preuve du plus grand soin de clarté aussi bien dans ses documents écrits que dans ses présentations orales.