Puissance statistique pour les tests de comparaison des variances

Puissance statistique d’un test de comparaison des variances

XLSTAT propose plusieurs tests afin de comparer des variances comme par exemple le test de comparaison des variances de deux échantillons. XLSTAT permet de calculer la puissance ou le nombre d'observations nécessaires pour un test basé sur la distribution F de Fisher afin de comparer des variances.

Lorsqu'on teste une hypothèse à l'aide d'un test statistique, on a plusieurs éléments à choisir :

  • L'hypothèse nulle H0 et l'hypothèse alternative Ha.
  • Le test statistique à utiliser
  • L'erreur de première espèce (erreur de type I) que l'on appelle aussi alpha. Elle se produit lorsqu'on rejette l'hypothèse nulle alors qu'elle est vraie. Elle est fixée a priori pour chaque test et vaut 5%.

L'erreur de seconde espèce ou beta est moins étudiée mais elle revêt une grande importance. En effet, elle représente la probabilité que l'on ne rejette pas l'hypothèse nulle alors qu'elle est fausse. On ne peut pas la fixer a priori mais, on peut essayer de la minimiser, en jouant sur les autres paramètres du modèle. La puissance d'un test est calculée comme 1-beta et représente la probabilité que l'on rejette l'hypothèse nulle alors qu'elle est bien fausse. On voudra donc maximiser la puissance du test. XLSTAT permet de calculer cette puissance (ainsi que beta) lorsque les autres paramètres du test sont connus. D'autre part, il permet pour une puissance donnée d'évaluer la taille de l'échantillon nécessaire à l'obtention de cette puissance.

Les calculs de puissance en statistique se font généralement avant que l'expérience ne soit menée. On s'en sert principalement pour estimer le nombre d'observations nécessaire pour que l'expérience ait la qualité statistique requise.

XLSTAT permet de comparer deux variances.

Calcul de la puissance d’un test de comparaison des varainces

La puissance d'un test est généralement obtenue à l'aide de la distribution non centrale associée. Dans notre cas, nous utiliserons la distribution de Fisher.

Plusieurs hypothèses peuvent être testées, mais la plus commune est la suivante (cas bilatéral) :

  • H0 : La différence entre les variances est égale à 0
  • Ha : La différence entre les variances est différente de 0

Le résultat du calcul de la puissance nous permettra de donner le pourcentage d'expériences qui rejetteront l'hypothèse nulle. Le calcul se fait en utilisant la distribution de Fisher avec comme paramètre le rapport des variances et comme degrés de libertés, les tailles des échantillons – 1.

Calcul de la taille de l'échantillon à partir de la puissance statistique

Afin de calculer le nombre d'observations nécessaires, XLSTAT utilise un algorithme de recherche de racine d'une fonction appelé algorithme Van Wijngaarden-Dekker-Brent (Brent, 1973). Cet algorithme est adapté au cas où les dérivées de la fonction ne sont pas connues. On cherche ainsi N tel que

puissance_test(N)-puissance_recherchée=0

On obtient donc la taille N telle que la puissance soit la plus proche possible de la puissance recherchée.

Taille de l'effet (effect size) pour la puissance d’un test

Ce concept est très important dans les calculs de puissance. En effet, Cohen (1988) a développé ce concept qui va permettre de s'affranchir d'entrer tous les paramètres du modèle (qui sont d'ailleurs souvent inconnus). La taille de l'effet est une grandeur qui va permettre de calculer la puissance d'un test sans entrer tous les paramètres mais qui permettra de dire si l'effet des paramètres à tester est faible ou fort.

Dans le cadre des comparaisons de variances, il s'agit du rapport entre les deux variances à comparer.

XLSTAT permet d'entrer directement la taille de l'effet.