Analyse Procrustéenne Généralisée avec XLSTAT

Jeu de données pour Analyse Procrustéenne Généralisée XLS263 Ko

Vidéo du tutoriel
  • ADA Logiciel d'Analyse de Données Avancée sur tableaux multiples

  • Pré-requis système

    • Windows:
      • Versions : 9x/Me/NT/2000/XP/Vista/Win 7
      • Excel : 97 et supérieures
      • Processeur : 32 ou 64 bits
      • Disque dur : 150 Mo
    • Mac OS X:
      • OS : OS X
      • Excel : X, 2004 et 2011
      • Disque dur : 150 Mo
  • MX Logiciel d'analyse de données d'étude marketing et d'analyse sensorielle

  • Pré-requis système

    • Windows:
      • Versions : 9x/Me/NT/2000/XP/Vista/Win 7
      • Excel : 97 et supérieures
      • Processeur : 32 ou 64 bits
      • Disque dur : 150 Mo
    • Mac OS X:
      • OS : OS X
      • Excel : X, 2004 et 2011
      • Disque dur : 150 Mo

Avantages

  • Pratique et simple d'utilisation
    Pratique et simple d'utilisation XLSTAT est parfaitement intégré à Microsoft Excel qui est le tableur le plus populaire au monde. Grâce à cette intégration, et au suivi de la même philosophie qu'Excel, l'utilisation de XLSTAT est aisée. Le logiciel est accessible dans un onglet dédié qui contient le menu de chaque module. Les analyses disponibles sont regroupées en menus fonctionnels. Les boîtes de dialogues sont pratiques et leur paramétrage est simple.
  • Partage aisé des données et résultats
    Partage aisé des données et résultats Un des plus grands avantages de XLSTAT est le fait que les données et résultats peuvent être partagés sans contrainte. En effet, données et résultats sont stockés dans Microsoft Excel et donc accessibles à tous. Il n'est pas nécessaire pour le receveur d'avoir une licence XLSTAT ou tout autre visionneur additionnel. Ceci facilite votre travail d'équipe et le rend plus économique. Enfin, les résultats sont transposables dans les autres logiciels de Microsoft Office dont PowerPoint ce qui vous permet de créer des présentations avec d'excellents graphiques en quelques minutes.
  • Modulaire
    Modulaire XLSTAT est un produit modulaire articulé autour de XLSTAT-Pro qui est le logiciel de base de XLSTAT. XLSTAT-Pro inclut déjà toutes les fonctionnalités les plus courantes en statistiques et analyses de données multivariées. Des fonctions plus avancées sont aussi disponibles dans des modules additionnels qui répondent à des demandes plus spécifiques. Ainsi, vous pouvez adapter le logiciel à vos propres besoins ce qui le rend plus rentable.
  • Didactique
    Didactique Les résultats de XLSTAT sont affichés pour chaque analyse et sont toujours disponibles pour une navigation plus simple. De plus, des informations utiles sont associées aux résultats afin de faciliter votre interprétation.
  • A un juste prix
    A un juste prix XLSTAT est un logiciel de statistique et d'analyse de données complet et modulaire qui s'adapte à tous les besoins analytiques d'une organisation. Son prix est très raisonnable ce qui vous permet de le rentabiliser presque immédiatement. Toutes les licences XLSTAT incluent un support et une assistance de première qualité.
  • Accessible en de nombreuses langues
    Accessible en de nombreuses langues Nous nous sommes assurés que XLSTAT puisse être accessible au plus grand nombre en distribuant le programme dans de nombreuses langues dont le français, l'anglais, l'allemand, l'espagnol, l'italien, le portugais, le polonais, le chinois et le japonais.
  • Automatisable et personnalisable
    Automatisable et personnalisable La plupart des fonctions disponibles dans XLSTAT peuvent être directement appelées depuis l'application Visual Basic de Microsoft Excel. Elles peuvent être intégrées à vos routines pour répondre aux besoins d'une application particulière. Ajouter des tableaux de résultats, des graphiques, ou modifier l'existant est simplifié. De plus, XLSTAT inclut des outils permettant de sauvegarder ou de recharger des paramètres automatiquement, mais aussi de générer du code VBA. Ceci permet de reproduire vos analyses depuis l'éditeur VBA. Cette automatisation des analyses routinières vous fera gagner du temps.

Analyse Procrustéenne Généralisée

L' Analyse Procrustéenne Généralisée (AGP, ou Generalized Procrustes Analysis ou GPA en anglais) est souvent utilisée en analyse sensorielle avant une cartographie des préférences pour réduire les effets d'échelle et obtenir une configuration bi ou tri-dimensionnelle consensuelle (ou configuration moyenne).

Cette méthode est aussi utilisée en marketing pour comparer les proximités entre les termes utilisés par différents experts pour décrire des produits.

Jeu de données pour réaliser une Analyse Procrustéenne Généralisée

Une feuille Excel contenant les données et les résultats de ce tutoriel peut être téléchargée en cliquant ici.

Les données correspondent à une étude au cours de laquelle une équipe marketing souhaite comparer comment quatre fromages légèrement différents proposés par la R&D sont perçus.

Pour cela, on a demandé à 10 experts d'évaluer plusieurs choix chacun des fromages sans qu'ils puissent visuellement différencier les fromages. Les notes utilisées ici sont les moyennes obtenus par chaque fromage, pour chaque expert, suivant trois critères : l'acidité, l'étrangeté, la fermeté.

Notre but est de transformer les données de manière à éliminer les effets d'échelle (certains experts vont avoir tendance à noter sur une gamme de notes plus large que d'autres), de position (certains experts vont avoir tendance à utiliser des notes plus basses que d'autres, et inversement), pour obtenir une configuration consensuelle qui pourra ensuite être utilisée pour une analyse de type PREFMAP.

Paramétrer une Analyse Procrustéenne Généralisée

Pour activer la boîte de dialogue de l'Analyse Procrustéenne Généralisée, choisissez la commande XLSTAT-MX /Analyse Procrustéenne Généralisée ou cliquez sur le bouton GPA de la barre d'outils XLSTAT-MX ou XLSTAT-ADA.

bargpaf.gif

Une fois le bouton cliqué, la boîte de dialogue apparaît.

Vous pouvez alors sélectionner les configurations (une configuration correspond ici à l'ensemble des notes données par un expert).

Le nombre de configurations doit ensuite être saisi. Il y a ici 10 tableaux contigus correspondant aux dix experts.

Comme les 10 configurations ont chacun trois dimensions, l'option Egal est choisie pour le nombre de dimensions. Lorsque le nombre de dimensions varient pour les différentes configurations, il faut sélectionner une colonne contenant le nombre de dimensions des différentes configurations.

Les étiquettes des configurations et des produits sont aussi sélectionnées donc il faut sélectionnées les options Libellés des variables et Libellés des observations.

gpa1f.gif

Les options suivantes ont été choisies dans les différents onglets.

gpa12f.gifgpa13f.gifgpa14f.gif

Une fois que vous avez cliqué sur le bouton OK, les calculs commencent puis les résultats sont affichés.

Interpréter les résultats d'une Analyse Procrustéenne Généralisée

Le premier tableau correspond au tableau de PANOVA donnant l'efficacité relative des différentes transformations. On voit ici la mise à l'échelle a eu un impact prépondérant sur la réduction de la variabilité des configurations.

gpa2f.gif

Le second tableau et le graphique correspondant donnent les résidus par objet après les transformations de l'Analyse Procrustéenne Généralisée. On peut voir que le résidu le plus faible obtenu pour le fromage F3. Cela indique que ce produit fait l'objet d'un consensus.

gpa3f.gif

Le troisième tableau et le graphique correspondant donnent les résidus par configuration après les transformations de l'Analyse Procrustéenne Généralisée. On peut voir que le résidu le plus important correspond à l'expert n°2, ce qui indique que l'expert n°2 est le plus éloigné du consensus, autrement dit que les notes qu'il a données sont sensiblement différentes de celles des autres experts.

gpa4f.gif

Le graphique suivant permet de visualiser les facteurs de mise à l'échelle de l'Analyse Procrustéenne Généralisée. Un facteur plus petit que 1 indique que l'expert en question a eu tendance à utiliser une gamme de notes plus importante que les autres experts. Un facteur plus grand que 1 indique que l'expert en question a eu tendance à utiliser une gamme de notes moins importante que les autres experts. On peut voir ici que les experts 1 et 3 ont eu tendance à utiliser un intervalle de notation plus important que les autres experts.

gpa5f.gif

Un test de consensus est alors réalisé pour vérifier si la configuration consensus (calculée comme la configuration moyenne après les différentes transformations) correspond à un véritable consensus. Ce test de permutation permet de déterminer si la valeur observée de Rc (Rc correspond à la proportion de la variance totale expliquée par la configuration consensus) est sensiblement plus élevée que 95% des résultats obtenus après permutation.

gpa51f.gif

gpa52f.gif

Un autre test de permutation est utilisé pour vérifier combien de dimensions doivent être retenues pour l'affichage les résultats. Nous voyons ici que pour la troisième dimension, la valeur du F est inférieure au 95ième percentile de la distribution empirique. Ainsi nous pouvons conclure que deux dimensions sont suffisantes.

gpa53f.gif

Les résultats qui suivent concernent l'ACP qui est réalisée après l'Analyse Procrustéenne Généralisée. Il s'agit ici d'une ACP non normée. Alors que l'Analyse Procrustéenne Généralisée inclut déjà des rotations optimales appliquées à chacune des configurations pour obtenir un consensus, l'ACP permet d'appliquer une transformation à la configuration consensuelle de manière à obtenir une représentation optimale sur les premiers axes. La transformation de l'APC est ensuite appliquée à chacune des configurations correspondant à chaque expert. Les valeurs propres indiquent la proportion de la variabilité totale représentée sur chacun des axes factoriels. On peut voir que 99% de la variabilité est représentée sur les deux premiers axes. Lorsque la varaibilité est analysée au niveau de chaque expert, on peut voir que la situation est analogue pour l'ensemble des experts.

gpa6f.gif

gpa7f.gif

Les résultats sont ensuite divisés en deux parties: ceux qui concernent la configuration consensuelle, et ceux qui concernent chaque configuration individuelle. Les coordonnées des objets pour la configuration consensuelle peuvent ensuite être utilisées dans une analyse de type PREFMAP comme les coordonnées des produits sur la carte de préférence. Sur le cercle des corrélations on observe que l'Etrangeté est la plupart du temps situé sur la partie négative du premier axe, et que l'acidité et la fermeté sont souvent sur la partie positive, avec parfois une corrélation entre les deux. L'Etrangeté qui se trouve à l'origine du graphique correspond à l'expert 6 qui n'a pas fourni de note pour ce critère pour les 4 fromages.

gpa8f.gif

Les deux graphiques suivants sont les cartes factorielles, colorées respectivement selon les configurations ou selon les objets (ici les fromages). Les points sont tous proches du premier axe parce que 95% de la variabilité est concentrée sur le premier axe, et parce que XLSTAT affiche les résultats sur des graphiques orthonormés.

gpa9f.gifgpa10f.gif

Afin de rendre le graphique plus lisible, nous avons changé les options d'échelle (comme on peut le faire avec tout graphique Excel, éventuellement en utilisant l'outil AxesZoomer de XLSTAT). On obtient alors le graphique suivant :

gpa11f.gif

On peut voir que les fromages F1 et F3 sont nettement séparés sur le graphique, alors que la distinction entre F2 et F4 est moins évidente. Cela signifie que les experts parviennent à un consensus pour F1 et F3, alors que pour F2 et F4 la proximité des produits semblent rendre le consensus moins évident.