Obtenir une Visualisation en Coordonnées Parallèles avec XLSTAT
Jeu de données pour Visualisation en coordonnées parallèles XLS950 Ko
Jeu de données pour réaliser une Visualisation en Coordonnées Parallèles
Un classeur Excel comprenant à la fois les données utilisées dans cet exemple et les résultats obtenus peut être téléchargé en cliquant ici.
Les données correspondent à une extraction des résultats d'une enquête menée par le American Census Bureau.
L'échantillon est tel que 50% des individus ont un revenu inférieur à 50k$ et l'autre moitié un revenu supérieur à 50k$. Tous les individus ont pour pays d'origine les Etats-Unis.
But de la représentation en Coordonnées Parallèles
La Visualisation en Coordonnées Parallèles est une méthode graphique qui peut être très utile avant ou après une classification.
Le but est ici de visualiser rapidement si certains facteurs (l'âge, le nombre d'années d'études, la race, le sexe, le nombre d'heures travaillées par semaine), ont une influence sur le revenu des individus.
Paramétrer la Visualisation en Coordonnées Parallèles
Une fois XLSTAT-Pro lancé, sélectionnez le menu XLSTAT / Visualisation des données / Visualisation en Coordonnées Parallèles, ou cliquez sur le bouton correspondant de la barre d'outils Visualisation des données.

Une fois que vous avez cliqué sur le bouton, la boîte de dialogue de l'outil Visualisation en Coordonnées Parallèles apparaît.
Sélectionnez alors les données sur la feuille Excel. Cet outil accepte que vous sélectionniez à la fois des variables numériques et nominales.
L'information d'appartenance à des Groupes est utilisée pour la coloration des lignes.
L'option Lignes moyennes permet de faire apparaître les lignes correspondant aux moyennes des variables numériques et aux modes des variables nominales.
L'option Remise à l'échelle permet d'améliorer la visualisation en faisant en sorte que toutes les variables évoluent entre 0 et 1.

Passez à l'onglet Options et sélectionner l'option : Afficher autant de ligne que possible.

Interpretation de la Visualisation en Coordonnées Parallèles
Une fois que vous avez cliqué sur le bouton OK, les calculs sont effectués, et un graphique apparaît dans une nouvelle feuille du classeur.

Sur ce graphique on voit que les hommes blancs plus âgés, travaillant beaucoup et ayant fait de longues études sont ceux qui sont le plus susceptibles de gagner plus de 50k$.
Cependant on remarque que le nombre d'heures travaillées n'est vraiement discriminant, la différence entre les moyennes des deux groupes (50k$) n'étant pas très importante.
La vidéo ci-dessous vous montre comment réaliser ce tutoriel.