Comment générer des Box plots ?

Une feuille Excel contenant un exemple de données et de résultats peut être téléchargée en cliquant ici. Les données correspondent à un échantillon de 150 fleurs (Iris) décrites par cinq variables (quatre numériques et une qualitative). Les fleurs appartiennent à 3 espèces différentes. Ce jeu de données bien connu, a été utilisé par Fisher pour illustrer l'analyse discriminante. Nous avons choisi d'analyser la variable "Long. Sépales" pour vérifier visuellement les différences entre espèces.

Une fois XLSTAT lancé, choisissez la commande XLSTAT/Description des données/Statistiques descriptives ou cliquez sur le bouton "Statistiques descriptives" de la barre d'outils "Description des données".

barbp1f.gif

barbp2f.gif

Une fois le bouton cliqué, la boîte de dialogue correspondant aux "Statistiques descriptives" apparaît. Les données correspondant à la variable "Long. Sépales" sont sélectionnées avec la souris dans la feuille Excel. Pour les Box plots, les données doivent être des données quantitatives. La variable espèce est choisie pour identifier les sous-échantillons (3 espèces de fleurs). L'option "Libellés des échantillons" est cochée parce que le nom des variables est inclus dans la sélection. L'option "Feuille" est choisie pour que l'affichage des résultats soit effectué sur une nouvelle feuille du même classeur.

bp1f.gif

Dans l'onglet "Options", seules deux options sont activées. Les options "Normaliser" et "Remettre à l'échelle" permettent de comparer plusieurs variables utilisant différentes échelles. L'option "Comparer à l'échantillon total" permet de comparer les sous-échantillons à l'échantillon total.

bp2f.gif

Dans l'onglet "Graphiques", l'option Box plots est activée. L'option "Grouper les graphiques" est activée pour que les trois box plots correspondant aux trois espèces d'iris soient affichés sur le même graphique.

bp3f.gif

Les résultats et les graphiques sont affichés dans une nouvelle feuille nommée "Desc". Le premier tableau correspond aux statistiques descriptives.

bp4f.gif

Il apparaît clairement que la variable "Long. Sépales" est différente en fonction des espèces. On observe une valeur extrême dans la catégorie 3. Elle est représentée par un "o" (cette valeur est aussi le minimum - il faut supprimer la série correspondant aux minima et maxima pour voir le "o").

bp5f.gif

Cliquez ici pour accéder à d'autres tutoriels.