Comment faire un ajustement d'une loi de probabilité à des données ?
Une feuille Excel contenant les données et les résultats de cet exemple peut être téléchargée en cliquant ici. Les données correspondent aux résidus centrés réduits, obtenus dans le tutoriel sur l'ANCOVA.
Notre but est de tester l'hypothèse de normalité des résidus. Par contruction ces résidus ont pour moyenne 0 et pour variance 1. Nous voulons vérifier si ces résidus sont distribués selon une loi normale centrée réduite N(0,1).
Une fois XLSTAT lancé, choisissez la commande XLSTAT/Modélisation/Ajustement d'une loi de probabilité ou cliquez sur le bouton "Ajustement d'une loi de probabilité" de la barre d'outils "Modélisation".

Une fois le bouton cliqué, la boîte de dialogue apparaît. Vous pouvez alors sélectionner les données sur la feuille Excel. Les "Données" sont dans la colonne B. Nous laissons XLSTAT libre d'"estimer" les paramètres de la loi normale, mais nous pourrions aussi les "saisir" pour les fixer à 0 et 1, puisque nous savons que la loi doit avoir ces caractérisques. Nous activons les options de test de Kolmogorov-Smirnov et de test de conformité du khi², nécessaires pour tester notre hypothèse. Pour le test du khi², nous décidons qu'il sera effectué sur 10 classes d'amplitude constante.

Une fois que vous avez cliqué sur le bouton "OK", les calculs commencent puis les résultats sont affichés. Le premier tableau de résultats fournit quatre statistiques descriptives de la loi normale, tels qu'estimés sur l'échantillon et tel que calculés d'après la théorie. Si la moyenne et la variance sont égales (ce qui est toujours le cas pour une loi normale lorsque la méthode des moments ou du maximum de vraisemblance sont utilisées), on observe une différence au niveau des coefficients d'asymétrie (Skewness) et d'applatissement (Kurtosis).

Le test de Kolmogorov Smirnov permet de tester si la plus grande distance entre les fonctions de répartition empiriques et théoriques est au-delà d'une valeur critique ou non. Ce test est réputé plus adapté que le test de conformité du Khi² dans le cas des lois de probabilités (ou distributions) continues, ce qui est le cas avec la loi normale. D'après les résultats obtenus ici, au seuil de signification de 5%, on conclut qu'on ne peut pas rejeter l'hypothèse que les résidus suivent une loi N(0,1).
Le test de conformité du Khi² permet quant à lui de tester si la distance du Khi² entre la distribution empirique et la distribution théorique n'est pas au delà d'une valeur critique. Dans notre cas, il apparaît que la valeur observée est au-delà de la valeur critique. La conclusion est donc contraire à celle obtenue avec le test de Kolmogorov-Smirnov. En revanche, nous voyons que, dans le cas où la classe donnant la plus forte contribution au Khi² serait enlevée, la valeur du Khi² observé est proche de la valeur critique.
En regardant les contributions aux Khi² des 10 classes créées dans le tableau ci-dessous, on constate que les valeurs extrêmes repérées au cours de l'analyse des résidus dans le tutoriel sur l'ANCOVA sont bien responsables de l'adéquation moyenne entre la distribution théorique et la distribution empirique.


En conclusion, s'il semble que l'hypothèse de normalité soit acceptable (test de Kolmogorov-Smirnov). Les valeurs anormales ayant entraîné des résidus élevés avec une fréquence anormale sont responsables d'un rejet de l'hypothèse de normalité pour le test du Khi². La suppression de certaines des observations correspondantes (après explication, si possible, du pourquoi des valeurs anormales), devrait permettre d'obtenir un modèle plus robuste, et des résidus plus conformes à l'hypothèse de normalité.
Cliquez ici pour accéder à d'autres tutoriels.