Tests non-paramétriques pour la comparaison de deux échantillons indépendants

"Tests non-paramétriques pour la comparaison de deux échantillons indépendants" inclus dans :
  • Pro Logiciel de base de la suite XLSTAT

  • Pré-requis système

    • Windows:
      • Versions : 9x/Me/NT/2000/XP/Vista/Win 7
      • Excel : 97 et supérieures
      • Processeur : 32 ou 64 bits
      • Disque dur : 150 Mo
    • Mac OS X:
      • OS : OS X
      • Excel : X, 2004 et 2011
      • Disque dur : 150 Mo

Avantages

  • Pratique et simple d'utilisation
    Pratique et simple d'utilisation XLSTAT est parfaitement intégré à Microsoft Excel qui est le tableur le plus populaire au monde. Grâce à cette intégration, et au suivi de la même philosophie qu'Excel, l'utilisation de XLSTAT est aisée. Le logiciel est accessible dans un onglet dédié qui contient le menu de chaque module. Les analyses disponibles sont regroupées en menus fonctionnels. Les boîtes de dialogues sont pratiques et leur paramétrage est simple.
  • Partage aisé des données et résultats
    Partage aisé des données et résultats Un des plus grands avantages de XLSTAT est le fait que les données et résultats peuvent être partagés sans contrainte. En effet, données et résultats sont stockés dans Microsoft Excel et donc accessibles à tous. Il n'est pas nécessaire pour le receveur d'avoir une licence XLSTAT ou tout autre visionneur additionnel. Ceci facilite votre travail d'équipe et le rend plus économique. Enfin, les résultats sont transposables dans les autres logiciels de Microsoft Office dont PowerPoint ce qui vous permet de créer des présentations avec d'excellents graphiques en quelques minutes.
  • Modulaire
    Modulaire XLSTAT est un produit modulaire articulé autour de XLSTAT-Pro qui est le logiciel de base de XLSTAT. XLSTAT-Pro inclut déjà toutes les fonctionnalités les plus courantes en statistiques et analyses de données multivariées. Des fonctions plus avancées sont aussi disponibles dans des modules additionnels qui répondent à des demandes plus spécifiques. Ainsi, vous pouvez adapter le logiciel à vos propres besoins ce qui le rend plus rentable.
  • Didactique
    Didactique Les résultats de XLSTAT sont affichés pour chaque analyse et sont toujours disponibles pour une navigation plus simple. De plus, des informations utiles sont associées aux résultats afin de faciliter votre interprétation.
  • A un juste prix
    A un juste prix XLSTAT est un logiciel de statistique et d'analyse de données complet et modulaire qui s'adapte à tous les besoins analytiques d'une organisation. Son prix est très raisonnable ce qui vous permet de le rentabiliser presque immédiatement. Toutes les licences XLSTAT incluent un support et une assistance de première qualité.
  • Accessible en de nombreuses langues
    Accessible en de nombreuses langues Nous nous sommes assurés que XLSTAT puisse être accessible au plus grand nombre en distribuant le programme dans de nombreuses langues dont le français, l'anglais, l'allemand, l'espagnol, l'italien, le portugais, le polonais, le chinois et le japonais.
  • Automatisable et personnalisable
    Automatisable et personnalisable La plupart des fonctions disponibles dans XLSTAT peuvent être directement appelées depuis l'application Visual Basic de Microsoft Excel. Elles peuvent être intégrées à vos routines pour répondre aux besoins d'une application particulière. Ajouter des tableaux de résultats, des graphiques, ou modifier l'existant est simplifié. De plus, XLSTAT inclut des outils permettant de sauvegarder ou de recharger des paramètres automatiquement, mais aussi de générer du code VBA. Ceci permet de reproduire vos analyses depuis l'éditeur VBA. Cette automatisation des analyses routinières vous fera gagner du temps.

Principe des tests non-paramétriques pour la comparaison de deux échantillons indépendants

Ces tests permettent de comparer la distribution de deux échantillons indépendants.

Afin de s'affranchir de l'hypothèse de normalité des échantillons nécessaire pour l'utilisation des tests paramétriques (test z, test t de Student, test F de Fisher, test de Levene, test de Bartlett), des tests non paramétriques ont été proposés.

Si l'on désigne par D la différence de position supposée des échantillons (en général on teste l'égalité, et D vaut donc 0), et par P1-P2 la différence de position des échantillons, trois types de tests sont possibles en fonction de l'hypothèse alternative choisie :

Tests non-paramétriques pour la comparaison de deux échantillons indépendants dans XLSTAT

Trois chercheurs, Mann, Whitney, et Wilcoxon, ont mis au point séparément un test non paramétrique très similaire qui permet de déterminer si, sur la base des rangs des échantillons, on peut considérer que les échantillons sont identiques ou non en terme de position. Ce test est souvent appelé test de Mann-Whitney, parfois test de Wilcoxon-Mann-Whitney, ou encore Wilcoxon Rank-Sum test (Lehmann, 1975).

On lit parfois que ce test permet de déterminer si les échantillons proviennent de populations ou de distributions identiques. Cela est totalement faux. Ce test permet uniquement d'étudier la position relative des échantillons. Par exemple, si on génère un échantillon de 500 observations tiré dans une loi N(0,1) et un échantillon de 500 observations tiré dans une loi N(0,4), le test de Mann-Whitney ne trouve aucune différence entre les échantillons.

Soit un échantillon E1, comprenant n1 observations (x1, x2, …, xn1) et soit E2 un second échantillon, comprenant n2 observations (y1, y2, …, yn2) et indépendant de E1. Soit N la somme de n1 et n2.

Statistique de Wilcoxon

Pour calculer la statistique de Wilcoxon Ws mesurant la différence de position entre le premier échantillon E1, et l'échantillon E2 auquel on soustrait D, on regroupe les valeurs obtenues pour les deux échantillons, puis on les ordonne. La statistique Ws est la somme des rangs de l'un des échantillons. Dans le cas de XLSTAT, la somme est calculée sur le premier échantillon.

On a alors pour l'espérance et la variance de Ws :

E(Ws) = 1/2 n1(N + 1) et V(Ws) = 1/12 n1n2(N + 1)

Statistique de Mann-Whitney

La statistique U de Mann-Whitney est quant à elle la somme du nombre de couples (xi, yi) où xi>yi, parmi tous les couples possibles. On montre que :

E(U) = n1n2/2 et V(U) = 1/12 n1n2(N + 1)

On peut noter que les variances de Ws et U sont identiques. En fait, on a la relation suivante entre U et Ws :

Ws = U + n1(n1 + 1) / 2

Les résultats proposés par XLSTAT sont ceux relatifs à la statistique U de Mann-Whitney.

Remarque : l'utilisation du test de Mann-Whitney constitue une alternative non paramétrique au test t de Student (équivalent à l'analyse de variance à 1 facteur dans le cas de deux échantillons). Comme pour le test t de Student, les échantillons peuvent être de tailles différentes.

Tutoriels

Aperçus