Comment obtenir une Visualisation en Coordonnées Parallèles avec XLSTAT ?
Un classeur Excel comprenant à la fois les données utilisées dans cet exemple et les résultats obtenus peut être téléchargé en cliquant ici. Les données correspondent à une extraction des résultats d'une enquête menée par le American Census Bureau. L'échantillon est tel que 50% des individus ont un revenu inférieur à 50k$ et l'autre moitié un revenu supérieur à 50k$. Tous les individus ont pour pays d'origine les Etats-Unis.
La Visualisation en Coordonnées Parallèles est une méthode graphique qui peut être très utile avant ou après une classification.
Le but est ici de visualiser rapidement si certains facteurs (l'âge, le nombre d'années d'études, la race, le sexe, le nombre d'heures travaillées par semaine), ont une influence sur le revenu des individus.
Une fois XLSTAT-Pro lancé, sélectionnez le menu XLSTAT/Visualisation des données/Visualisation en Coordonnées Parallèles, ou cliquez sur le bouton correspondant de la barre d'outils "Visualisation des données".

Une fois que vous avez cliqué sur le bouton, la boîte de dialogue de l'outil Visualisation en Coordonnées Parallèles apparaît. Sélectionnez alors les données sur la feuille Excel. Cet outil accepte que vous sélectionniez à la fois des variables numériques et nominales. L'information d'appartenance à des "Groupes" est utilisée pour la coloration des lignes. L'option "Lignes moyennes" permet de faire apparaître les lignes correspondant aux moyennes des variables numériques et aux modes des variables nominales. L'option "Remise à l'échelle" permet d'améliorer la visualisation en faisant en sorte que toutes les variables évoluent entre 0 et 100.

Une fois que vous avez cliqué sur le bouton OK, les calculs sont effectués, et un graphique apparaît dans une nouvelle feuille du classeur.

Sur ce graphique on voit que les hommes blancs plus âgés, travaillant beaucoup et ayant fait de longues études sont ceux qui sont le plus susceptibles de gagner plus de 50k$. Cependant on remarque que le nombre d'heures travaillées n'est vraiement discriminant, la différence entre les moyennes des deux groupes (50k$) n'étant pas très importante.
Cliquez ici pour accéder à d'autres tutoriels.