Analyse factorielle (FA) avec XLSTAT

Jeu de données pour Analyse Factorielle XLS177 Ko

Vidéo du tutoriel
  • Pro Logiciel de base de la suite XLSTAT

  • Pré-requis système

    • Windows:
      • Versions : 9x/Me/NT/2000/XP/Vista/Win 7
      • Excel : 97 et supérieures
      • Processeur : 32 ou 64 bits
      • Disque dur : 150 Mo
    • Mac OS X:
      • OS : OS X
      • Excel : X, 2004 et 2011
      • Disque dur : 150 Mo

Avantages

  • Pratique et simple d'utilisation
    Pratique et simple d'utilisation XLSTAT est parfaitement intégré à Microsoft Excel qui est le tableur le plus populaire au monde. Grâce à cette intégration, et au suivi de la même philosophie qu'Excel, l'utilisation de XLSTAT est aisée. Le logiciel est accessible dans un onglet dédié qui contient le menu de chaque module. Les analyses disponibles sont regroupées en menus fonctionnels. Les boîtes de dialogues sont pratiques et leur paramétrage est simple.
  • Partage aisé des données et résultats
    Partage aisé des données et résultats Un des plus grands avantages de XLSTAT est le fait que les données et résultats peuvent être partagés sans contrainte. En effet, données et résultats sont stockés dans Microsoft Excel et donc accessibles à tous. Il n'est pas nécessaire pour le receveur d'avoir une licence XLSTAT ou tout autre visionneur additionnel. Ceci facilite votre travail d'équipe et le rend plus économique. Enfin, les résultats sont transposables dans les autres logiciels de Microsoft Office dont PowerPoint ce qui vous permet de créer des présentations avec d'excellents graphiques en quelques minutes.
  • Modulaire
    Modulaire XLSTAT est un produit modulaire articulé autour de XLSTAT-Pro qui est le logiciel de base de XLSTAT. XLSTAT-Pro inclut déjà toutes les fonctionnalités les plus courantes en statistiques et analyses de données multivariées. Des fonctions plus avancées sont aussi disponibles dans des modules additionnels qui répondent à des demandes plus spécifiques. Ainsi, vous pouvez adapter le logiciel à vos propres besoins ce qui le rend plus rentable.
  • Didactique
    Didactique Les résultats de XLSTAT sont affichés pour chaque analyse et sont toujours disponibles pour une navigation plus simple. De plus, des informations utiles sont associées aux résultats afin de faciliter votre interprétation.
  • A un juste prix
    A un juste prix XLSTAT est un logiciel de statistique et d'analyse de données complet et modulaire qui s'adapte à tous les besoins analytiques d'une organisation. Son prix est très raisonnable ce qui vous permet de le rentabiliser presque immédiatement. Toutes les licences XLSTAT incluent un support et une assistance de première qualité.
  • Accessible en de nombreuses langues
    Accessible en de nombreuses langues Nous nous sommes assurés que XLSTAT puisse être accessible au plus grand nombre en distribuant le programme dans de nombreuses langues dont le français, l'anglais, l'allemand, l'espagnol, l'italien, le portugais, le polonais, le chinois et le japonais.
  • Automatisable et personnalisable
    Automatisable et personnalisable La plupart des fonctions disponibles dans XLSTAT peuvent être directement appelées depuis l'application Visual Basic de Microsoft Excel. Elles peuvent être intégrées à vos routines pour répondre aux besoins d'une application particulière. Ajouter des tableaux de résultats, des graphiques, ou modifier l'existant est simplifié. De plus, XLSTAT inclut des outils permettant de sauvegarder ou de recharger des paramètres automatiquement, mais aussi de générer du code VBA. Ceci permet de reproduire vos analyses depuis l'éditeur VBA. Cette automatisation des analyses routinières vous fera gagner du temps.

Jeu de données pour l'analyse factorielle

Une feuille Excel comprenant à la fois les données et les résultats de l'analyse peut être téléchargée en cliquant ici.

Les données proviennent de [Kendall M. (1975). Multivariate analysis. Griffin, London] et correspondent à 48 candidats pour un poste en entreprise ayant été évalués sur 15 critères :

  • Lettre de motivation
  • Présentation
  • Niveau d'études
  • Sympathie
  • Confiance en soi
  • Lucidité
  • Honnêteté
  • Sens commercial
  • Expérience
  • Charisme
  • Ambition
  • Compréhension
  • Potentiel
  • Motivation pour le poste
  • Adéquation

Parce que les corrélations entre les critères sont importantes, il est possible que la personne interviewant les candidats ait confondu certains critères ou que certains critères soient redondants. On a procédé à une analyse factorielle, afin de déterminer quels sont les critères (ou facteurs) latents.

Plusieurs méthodes d'analyse factorielle existent. Trois méthodes d'extraction des facteurs sont proposées par XLSTAT (composantes principales, facteurs principaux, et maximum de vraisemblance).

Nous utilisons ici la méthode des facteurs principaux dans le but de générer quatre facteurs, avant de procéder à une rotation varimax pour faciliter l'interprétation des résultats.

Paramétrer une analyse factorielle

Pour activer la boîte de dialogue de l'analyse factorielle, lancez XLSTAT, puis sélectionnez la commande XLSTAT / Analyse de données / Analyse Factorielle, ou cliquez sur le bouton équivalent de la barre d'outils Analyse des données.

barfaf.gif

Une fois le bouton cliqué, la boîte de dialogue apparaît. Vous pouvez alors sélectionner les données sur la feuille Excel.

fa1f.gif

Dans l'onglet Options la rotation Varimax sur les deux premiers facteurs a été choisie.

fa1-1f.gif

Les options de sorties et de graphiques suivantes sont activées.

fa1-2f.giffa1-3f.gif

Une fois que vous avez cliqué sur le bouton OK, les calculs commencent puis les résultats sont affichés.

Interpréter les résultats d'une analyse factorielle

Les premiers résultats sont les statistiques descriptives simples des variables sélectionnées, puis la matrice de corrélation pour ces mêmes variables. On note que certaines corrélations sont importantes (0.883 pour Compréhension et Lucidité). On remarque que le juge est probablement influencé par l'expérience et le charisme du candidat lorsqu'il détermine l'Adéquation entre le candidat et le poste.

Le alpha de Cronbach standardisé est ensuite calculé. Il vaut ici 0.914, ce qui indique qu'il y a probablement de la redondance dans les variables sélectionnées.

L'agorithme utilisé pour le calculs des facteurs principaux est itératif. Dans notre cas, l'algorithme a convergé au bout de 41 itérations pour atteindre une précision de 0,0001 sur le critère du changement maximum de communalité entre deux itérations. La méthode consiste à essayer de reproduire la matrice des corrélations. La matrice des corrélations reproduites et des corrélations résiduelles permet de mesurer cas par cas si les corrélations sont bien reproduites ou non.

Dans le tableau ci-dessous sont affichées les valeurs propres issues de l'analyse factorielle. Nous constatons qu'avec quatre facteurs on conserve 74.5 % de la variabilité des données initiales.

fa2f.gif

Remarque : les valeurs propres affichées ci-dessus sont celles qui correspondent à l'analyse factorielle par la méthode des facteurs prinicpaux. Avec l'analyse en composantes principales on obtiendrait pour les 10 premiers facteurs :

fa3f.gif

La rotation varimax change la façon dont chaque facteur représente une part de la variance. La rotation varimax rend l'interprétation plus aisée en maximisant la variance du carré des coordonnées des variables par colonne. Pour un facteur donné, les coordonnées élevées le sont encore plus, les coordonnées faibles le sont encore plus, et les coordonnées intermédiaires deviennent soit plus élevées, soit plus faibles. Le % de variance correspondant au premier reste bien entendu inchangé, même si au niveau de chacun des deux axes pris en compte pour la rotation les % sont inchangés.

fa4f.gif

On peut ensuite analyser les coordonnées des variables après la rotation varimax. Ces résultats sont utilisés pour interpréter le sens des facteurs après rotation.

fa5f.gif

D'après le tableau ci-dessus, on remarque que le premier facteur est fortement lié à l'Ambition, à la Confiance en soi, au Sens commercial et à la Lucidité. Le second facteur est quant à lui lié à la Lettre de motivation, à l'Expérience, et à l'Adéquation. De ces résultats, on déduit que les candidats qui ont des coordonnées élevées sur le premier facteur sont des commerciaux prometteurs, tandis que ce que l'on destinerait à des postes de management auraient plutôt des coordonnées élevées sur le second et le troisième facteurs.

Le graphique ci-dessous donne la position des variables sur les axes F1 et F2.

fa6f.gif

Le alpha de Cronbach est ensuite calculé pour chaque facteur, en prenant pour chaque facteur, les variables dont la valeur absolue de la coordonnée (ou loading) est maximale pour ce facteur. Le alpha est proche de 1 pour les facteurs après rotation. Ceci semble confirmer que ces deux facteurs ont un caractère unidimensionnel, traduisant un facteur latent.

Un tableau suivant fournit les coordonnées des individus sur les axes factoriels après la rotation varimax.

fa7f.gif

XLSTAT affiche la carte factorielle en deux dimensions. Le graphique ci-dessous correspond à la carte factorielle sur F1 et F2.

fa8f.gif

Les meilleurs candidats sont probablement les individus 40 et 39. S'ils refusent l'offre, les candidats 8, 20,22,23,24 seraient une alternative.

Regardez une démonstration de ce tutoriel dans la vidéo suivante.