Test d'ajustement multinomial

multinomial-goodness-of-fit-dialog-box.png

Principe du test d'ajustement multinomial

Le test d'ajustement multinomial permet de vérifier si la distribution d'un échantillon correspondant à une variable qualitative (ou quantitative discrétisée) est conforme à ce que l'on attend. On parle de test d'ajustement multinomial car il est fondé sur la loi multinomiale qui est l'extension de la loi binomiale au cas il y a plus de deux modalités possibles.

Soit k le nombre de valeurs possibles (modalités) pour la variable X. On désigne par p1, p2, …, pk les probabilités (ou densité) associées à chacune de ces valeurs.

Soit un échantillon de taille N pour lequel on obtient les effectifs suivants pour les différentes modalités : n1, n2, n3, …, nk.

  • L'hypothèse nulle du test est donnée par : H0 : la distribution des modalités est conforme à ce que l'on attend, autrement dit la distribution de l'échantillon n'est pas différente de celle de X.
  • L'hypothèse alternative du test est donnée par : Ha : la distribution des modalités n'est pas conforme à ce que l'on attend, autrement dit la distribution de l'échantillon n'est pas identique à celle de X.

Test d'ajustement multinomial dans XLSTAT

Différentes méthodes et statistiques ont été proposées pour ce test. Les possibilités offertes par XLSTAT sont :

Test du Khi²

On calcule la statistique suivante :

χ² = ∑(i=1…k) [(ni - Npi)2 / Npi]

Cette statistique suit asymptotiquement une loi du Khi à k-1 degrés de liberté.

Test Monte Carlo

Cette version du test permet de s'affranchir des calculs parfois lourds de la méthode exacte basée sur la loi multinomiale et d'éviter l'approximation par la loi du Khi² qui peut être de qualité moyenne sur les petits échantillons. Ce test consiste en un rééchantillonnage aléatoire de N observations dans une loi ayant les propriétés attendues. On calcule pour chaque rééchantillonnage la statistique c², puis une fois ce processus terminé, on évalue combien de fois la valeur observé sur l'échantillon de départ est dépassée. On en déduit ainsi la p-value.

ternary diagramneural network diagram

analysez vos données avec xlstat

essayez gratuitement pendant 14 jours