Générer des Box plots ou boîtes à moustache dans XLSTAT
Jeu de données pour Statistiques descriptives (y compris box plots et scattergrams) XLS35.5 Ko
Jeu de données pour générer un box plot / une boîte à moustache
Une feuille Excel contenant un exemple de données et de résultats peut être téléchargée en cliquant ici.
Les données correspondent à un échantillon de 150 fleurs (Iris) décrites par cinq variables (quatre numériques et une qualitative). Les fleurs appartiennent à 3 espèces différentes. Ce jeu de données bien connu, a été utilisé par Fisher pour illustrer l'analyse discriminante. Nous avons choisi d'analyser la variable "Long. Sépales" pour vérifier visuellement les différences entre espèces.
Générer un box plot / une boîte à moustache
Une fois XLSTAT lancé, choisissez la commande XLSTAT / Description des données / Statistiques descriptives ou cliquez sur le bouton Statistiques descriptives de la barre d'outils Description des données.


Une fois le bouton cliqué, la boîte de dialogue correspondant aux Statistiques descriptives apparaît.
Les données correspondant à la variable "Long. Sépales" sont sélectionnées avec la souris dans la feuille Excel.
Pour les Box plots / boîtes à moustache, les données doivent être des données quantitatives.
La variable "espèce" est choisie pour identifier les sous-échantillons (3 espèces de fleurs). L'option Libellés des échantillons est cochée parce que le nom des variables est inclus dans la sélection. L'option Feuille est choisie pour que l'affichage des résultats soit effectué sur une nouvelle feuille du même classeur.

Dans l'onglet Options, seules deux options sont activées. Les options Normaliser et Remettre à l'échelle permettent de comparer plusieurs variables utilisant différentes échelles.
L'option Comparer à l'échantillon total permet de comparer les sous-échantillons à l'échantillon total.

Dans l'onglet Graphiques, l'option Box plots est activée.
L'option Grouper les graphiques est activée pour que les trois box plots correspondant aux trois espèces d'iris soient affichés sur le même graphique.

Interprétation du Box plot ou d'une boîte à moustache
Les résultats et les graphiques sont affichés dans une nouvelle feuille nommée "Desc". Le premier tableau correspond aux statistiques descriptives.

Il apparaît clairement que la variable "Long. Sépales" est différente en fonction des espèces. On observe une valeur extrême dans la catégorie 3. Elle est représentée par un "o" (cette valeur est aussi le minimum - il faut supprimer la série correspondant aux minima et maxima pour voir le "o").

Regardez cette vidéo pour une démonstartion.