Comment faire un échantillonnage et un test de normalité avec XLSTAT ?
Un classeur Excel comprenant à la fois les données utilisées dans cet exemple et les résultats obtenus peut être téléchargé en cliquant ici. Dans ce tutoriel nous vous montrons comment générer un échantillon aléatoire tiré dans une loi Normale, puis dans une loi Uniforme , puis comment utiliser un test de normalité pour vérifier si les échantillons suivent une loi normale ou non. Rappelons que l'hypothèse de normalité est fréquente en statistique.
Dans un premier temps nous créons deux échantillons, le premier à partir d'une loi N(2,4) (de moyenne 2, et de variance 4), le second dans une loi Uniforme entre -1.5 et 5 (de moyenne 2 et de variance 49/12 =4.08). Pour cela l'outil "Echantillonnage d'une distribution" de la section "Préparation des données" est utilisé.
Une fois XLSTAT-Pro lancé, sélectionnez le menu XLSTAT/Préparation des données/Echantillonnage d'une distribution, ou cliquez sur le bouton correspondant de la barre d'outils "Préparation des données".

Une fois que vous avez cliqué sur le bouton, la boîte de dialogue de l'outil Echantillonnage d'une distribution apparaît. Sélectionnez alors la loi puis les paramètres de la loi, puis la taille de l'échantillon à générer. La boîte présentée ci-dessous correspond à la génération d'un échantillon de 1000 individus à partir d'une loi N(2,2).

Une fois que vous avez cliqué sur le bouton OK, l'échantillon est affiché. Un second échantillon est ensuite généré suivant une loi uniforme entre -1.5 et 5.
Ensuite nous voulons tester la normalité des deux échantillons générés. Sélectionnez le menu XLSTAT/Description des données/Tests de normalité, ou cliquez sur le bouton correspondant de la barre d'outils "Description des données".

Une fois que vous avez cliqué sur le bouton, la boîte de dialogue des Tests de normalité est affichée. Sélectionnez les deux échantillons. Activez ensuite l'option "Colonnes indépendantes" pour préciser que les échantillons sont indépendants. L'option Q-Q plot est activée afin de nous permettre de visualiser l'écart à la normalité des échantillons.

Une fois que vous avez cliqué sur le bouton OK, les calculs sont effectués et les résultats sont affichés sur une nouvelle feuille. Les résultats sont d'abord fournis pour le premier échantillon, puis pour le second.
Le premier résultat affiché est le Q-Q plot pour le premier échantillon. Le Q-Q plot permet de comparer la fonction de répartition de l'échantillon (en abscisse) à celle qu'aurait une loi normale de même moyenne et même variance (en ordonnées). Dans le cas d'un échantillon issu d'une distribution normale, on doit observer un alignement presque parfait avec la première bissectrice du plan. Dans le cas contraire des écarts doivent être observés.

Nous voyons ici que la fonction de répartition empirique est très proche de la bissectrice. Les tests de Shapiro-Wilk et de Jarque-Bera confirment que l'on ne peut pas rejeter l'hypthèse de normalité de l'échantillon. On notera qu'avec le test de Shapiro-Wilk, le risque de se tromper en rejetant l'hypothèse serait plus important qu'avec le test de Jarque-Bera.

Les résultats qui suivent concernent le second échantillon, avec dans un premier temps, le Q-Q plot. Contrairement à ce que nous avons observé pour le premier échantillon, nous remarquons ici un fort écart à la normalité.

Cet écart est confirmé par les tests ci-dessous qui permettent d'affirmer sans hésitation que l'on doit rejeter l'hypothèse de normalité de l'échantillon.

En conclusion, dans ce tutoriel, nous avons vu comment générer deux échantillons, l'un suivant une loi normale, l'autre suivant une loi uniforme. Nous avons ensuite pu confirmer la validité des tests de normalité de Shapiro-Wilk et Jarque-Bera sur ces deux échantillons : nous avons vu que les tests ont validé l'hypothèse de normalité pour le premier échantillon, alors qu'ils l'ont infirmée pour le second échantillon.
Cliquez ici pour accéder à d'autres tutoriels.