Tests non-paramétriques pour la comparaison de deux échantillons appariés

XLSTAT propose deux tests pour comparer la distribution de deux échantillons pour le cas où les échantillons sont appariés : le test du signe et le test de Wilcoxon signé.

Soit un échantillon E1, comprenant n observations (x1, x2, …, xn) et soit E2 un second échantillon apparié à E1, comprenant aussi n observations (y1, y2, …, yn). Soit (p1, p2, …, pn) les n paires de valeurs (xi, yi).

Test du signe

Soit N+ la statistique égale au nombre de paires telles que yi < xi, N0 la statistique égale au nombre de paires telles que yi=xi, et N- la statistique égale au nombre de paires telles que yi > xi. On montre alors que la statistique N+ suit une loi binomiale de paramètres (n-N0) et de probabilité ½. L'espérance et la variance de N+ sont alors :

E(N+) = (n - N0) / 2 et V(N+) = (n - N0) / 4

La p-value associée à la statistique N+ et au type de test choisi (bilatéral, unilatéral à droite ou unilatéral à gauche) peut donc être déterminée de manière exacte.

Remarque :

  1. Ce test est appelé test du signe car il est construit à partir du signe des différences à l'intérieur des n paires. Ce test peut donc être utilisé pour comparer des évolutions évaluées sur une échelle ordinale. Par exemple, on utilisera ce test pour déterminer si l'effet d'un médicament est positif, à partir d'une enquête où le patient doit simplement déclarer s'il se sent moins bien, pas mieux, ou mieux après la prise d'un médicament.
  2. L'inconvénient du test du signe est qu'il ne prend pas en compte l'importance de la différence entre chaque paire, information qui est pourtant souvent disponible.

Test de Wilcoxon signé

Wilcoxon a proposé un test qui permet de prendre en compte le niveau de différence à l'intérieur des paires. Ce test est appelé test de Wicoxon signé (Wilcoxon signed rank test), car le signe des différences intervient aussi. Comme pour le test du signe, on calcule les différences pour l'ensemble des paires, puis on les ordonne, puis on sépare les différences positives S1, S2, …, Sp des différences négatives R1, R2, …, Rm (p+m=n).

La statistique permettant de tester si les deux échantillons ont la même position ou non est définie comme la somme des Si :

Vs = ∑(i=1…p) Si

L'espérance et la variance de Vs sont :

E(Vs) = n(n+1) / 4 et V(Vs) = n(n + 1)(2n + 1) / 24