Comment faire une Analyse Factorielle des Correspondances (AFC) avec XLSTAT ?

L'Analyse Factorielle des Correspondances (AFC) est une méthode très utilse pour analyser des tableaux croisés, et notamment des tableaux de contingence croisant deux variables qualitatives. Si l'on souhaite analyser les proximités entre les modalités de plus de deux variables qualitatives, on peut utiliser l'Analyse des Correspondances Multiples (ACM).

Une feuille Excel contenant les données et les résultats peut être téléchargée en cliquant ici. Les données correspondent à une enquête dans laquelle les personnes interrogées donnent leurs opinions sur un film qu'elles viennent de voir. On leur demande également leur tranche d'âge.

Une fois que XLSTAT est ouvert, choisissez XLSTAT/Analyse des données/Analyse Factorielle des Correspondances, ou cliquez sur le bouton correspondant de la barre d'outils "Analyse des données".

barca1f.gif

barca2f.gif

Une fois le bouton cliqué, la boîte de dialogue de l'analyse des correspondances apparaît. Vous pouvez alors sélectionner les données avec la souris sur la feuille Excel. Si vos données sont comme ici dans un tableau de contingence, sélectionnez l'option "Tableau croisé". Si vos données sont dans un tableau Individus/variables sélectionnez l'autre option. L'option "Libellés inclus" est activée parce que les noms des modalités en lignes et en colonnes sont également sélectionnés. Cliquez sur une cellule de votre feuille pour y placer les résultats de l'analyse. Cette cellule correspond à la position en haut et à gauche des tableaux (Feuil1!$J$4 dans notre exemple ; Feuil1 est le nom de la feuille des données). Vous pouvez également éditer les résultats dans une feuille séparée ou dans un nouveau classeur.

ca1f.gif

Dans l'onglet "Graphiques" les options suivantes ont été activées.

ca11f.gif

Une fois que vous avez cliqué sur OK, puis choisi les axes à utiliser pour les graphiques, les résultats sont affichés. De nombreuses détails sont disponibles y compris le test du Khi², qui permet de déterminer si l'on peut considérer les lignes et les colonnes comme indépendantes ou non. Comme on peut le voir ci-dessous, ici le test nous amène à rejeter l'hypothèse d'indépendance.

ca12f.gif

La qualité de la représentation graphique peut être évaluée grâce à l'histogramme ou au tableau des valeurs propres. Si la somme des deux premières (ou des n premières) valeurs propres représentent une grande partie de l'inertie totale, la qualité des graphiques est bonne. Dans notre cas cette qualité est très bonne dans la mesure où les deux premières valeurs propres totalisent 97 % de la variance totale.

ca2f.gif

Le principal intérêt de l'analyse des correspondances est la représentation graphique simultanée des modalités des deux variables. Lorsque la qualité de l'analyse est bonne (97% dans notre cas) la représentation graphique permet d'interpréter facilement les données. Nous pouvons ainsi remarquer que les jeunes de 16 à 24 ans ont des opinions sensiblement différentes des autres classes d'âges. Les personnes appartenant à la classe des 55-64 ans n'apprécient pas le film.

ca3f.gif

Cliquez ici pour accéder à d'autres tutoriels.