Puissance statistique pour l'ANOVA / ANCOVA / ANOVA à mesures répétées

Puissance statistique pour une analyse de la variance (ANOVA) ou covariance (ANCOVA)

XLSTAT-Pro propose des outils permettant d'appliquer un modèle d'analyse de la variance, d'analyse de la variance à mesures répétées et d'analyse de la covariance. XLSTAT-Power permet d'estimer la puissance ou de calculer le nombre d'observations nécessaires dans le cadre de ces méthodes. Lorsqu'on teste une hypothèse à l'aide d'un test statistique, on a plusieurs éléments à choisir :

  • L'hypothèse nulle H0 et l'hypothèse alternative Ha.
  • Le test statistique à utiliser
  • L'erreur de première espèce (erreur de type I) que l'on appelle aussi alpha. Elle se produit lorsqu'on rejette l'hypothèse nulle alors qu'elle est vraie. Elle est fixée a priori pour chaque test et vaut 5%.

L'erreur de seconde espèce ou beta est moins étudiée mais elle revêt une grande importance. En effet, elle représente la probabilité que l'on ne rejette pas l'hypothèse nulle alors qu'elle est fausse. On ne peut pas la fixer a priori mais, on peut essayer de la minimiser, en jouant sur les autres paramètres du modèle. La puissance d'un test est calculée comme 1-beta et représente la probabilité que l'on rejette l'hypothèse nulle alors qu'elle est bien fausse. On voudra donc maximiser la puissance du test. Le module XLSTAT-Power permet de calculer cette puissance (ainsi que beta) lorsque les autres paramètres du test sont connus. D'autre part, il permet pour une puissance donnée d'évaluer la taille de l'échantillon nécessaire à l'obtention de cette puissance.

Les calculs de puissance en statistique se font généralement avant que l'expérience ne soit menée. On s'en sert principalement pour estimer le nombre d'observations nécessaire pour que l'expérience ait la qualité statistique requise.

XLSTAT permet donc de comparer :

  • Dans le cas de l'ANOVA à un facteur ou à plusieurs facteurs et interactions, ainsi que dans le cas de l'ANCOVA :
    • H0 : Les moyennes des groupes associées au facteur testé sont toutes égales.
    • Ha : Il existe au moins une moyenne qui est différente des autres.
  • Dans le cas d'un facteur intra-sujets pour une ANOVA à mesures répétées :
    • H0 : Les moyennes des groupes associées au facteur intra-sujet sont toutes égales.
    • Ha : Il existe au moins une moyenne qui est différente des autres.
  • Dans le cas d'un facteur inter-sujets pour une ANOVA à mesures répétées :
    • H0 : Les moyennes des groupes associées au facteur inter-sujets sont toutes égales.
    • Ha : Il existe au moins une moyenne qui est différente des autres.
  • Dans le cas d'une interaction entre un facteur intra-sujets et un facteur inter-sujets pour une ANOVA à mesures répétées :
    • H0 : Les moyennes des groupes associées à l'interaction intra-inter sont toutes égales.
    • Ha : Il existe au moins une moyenne qui est différente des autres.

Taille de l'effet (effect size)

Ce concept est très important dans les calculs de puissance. En effet, Cohen (1988) a développé ce concept qui va permettre de s'affranchir d'entrer tous les paramètres du modèle (qui sont d'ailleurs souvent inconnus). La taille de l'effet est une grandeur qui va permettre de calculer la puissance d'un test sans entrer tous les paramètres mais qui permettra de dire si l'effet des paramètres à tester est faible ou fort. Dans le cadre de l'ANOVA et de l'ANCOVA, les conventions de grandeurs de la taille de l'effet f sont :

  • f=0,1, l'effet est faible.
  • f=0,25, l'effet est modéré.
  • f=0,4, l'effet est fort.

XLSTAT-Power permet d'entrer directement la taille de l'effet, mais permet aussi d'entrer des paramètres du modèle qui permettront de calculer la taille de l'effet. Nous en détaillons les calculs ci-dessous :

  • En utilisant les variances : On peut utiliser les variances du modèle afin de définir la taille de l'effet. En prenant VarExpl pour la variance expliquée par les facteurs que l'on désire tester et VarErr pour la variance de l'erreur ou variance résiduelle du modèle, on aura : f = √varexplained / varerror
  • En utilisant la méthode directe : On entre alors la valeur estimée de eta², qui est le rapport de la variance expliquée par la variance totale du modèle. Pour plus de détails sur cet indice on se référera à Cohen (1988) (chap.8.2). On aura : f = √η² / (1 – η²)
  • En utilisant les moyennes pour chaque groupe (uniquement dans le cas d'une ANOVA à un facteur ou d'une analyse inter-sujets d'une ANOVA à mesures répétées) : On sélectionne alors un vecteur comprenant les moyennes calculées pour chaque groupe. Il est aussi possible d'avoir des groupes de tailles différentes, dans ce cas, il faut aussi sélectionner un vecteur avec les différentes tailles (l'option classique suppose que tous les groupes ont des tailles égales). On aura : f = √Σi (mi - m)² / k / SDintra Avec mi moyenne pour le groupe i, m moyenne des moyennes, k nombre de groupes et SDintra écart-type intra-groupe.
  • Lorsqu'on effectue une analyse de la covariance (ANCOVA), il faut ajouter un terme dans le calcul de la taille de l'effet, on multiplie f par : f = √1 / (1 – ρ²) où rho² est la valeur théorique du carré de la corrélation multiple des variables explicative quantitative du modèle.

Une fois la taille de l'effet définie, on peut calculer la taille de l'échantillon nécessaire ou la puissance obtenue.

Calcul de la puissance statistique d’un test pour une ANOVA, ANCOVA ou une ANOVA avec mesures répétées

Les aides dédiées aux différentes méthodes donnent de plus amples détails sur chacune d'entre elles. Nous introduisons les notations suivantes :

  • NbGroup : Nombre de groupes que l'on désire tester.
  • N : taille de l'échantillon
  • NumeratorDF : Degré de liberté du numérateur, voir plus bas pour une explication détaillée.
  • NbRep : Nombre de répétitions (ou de mesures) dans le cadre d'une ANOVA à mesures répétées.
  • ρ : Corrélation entre les mesures dans le cadre d'une ANOVA à mesures répétées.
  • ε : Correction pour la non-sphéricité de Geisser-Greenhouse.
  • NbPred: Nombre de variables explicatives quantitatives dans le cadre d'une ANCOVA.

La puissance d'un test est généralement obtenue à l'aide de la distribution non centrale associée. Ainsi, pour le cas de l'ANOVA, la distribution non centrale de Fisher est utilisée. Pour chaque méthode, on donnera les premiers et seconds degrés de liberté ainsi que le paramètre de non centralité :

  • ANOVA à un effet : DF1 = NbGroup – 1; DF2 = N – NbGroup; NCP = f²N
  • ANOVA effets fixes et interactions : DF1 = NumeratorDF; DF2 = N – NbGroup; NCP = f²N
  • ANOVA à mesures répétées intra facteur : DF1 = NbRep – 1; DF2 = (N – NbGroup)(NbRep – 1); NCP = f²*N*NbRep*ε / (1 – ρ)
  • ANOVA à mesures répétées inter facteurs : DF1 = NbGroup – 1; DF2 = N – NbGroup; NCP = f²*N*NbRep / [1 + ρ(NbRep – 1)]
  • ANOVA à mesures répétées intra-inter facteurs : DF1 = (NbRep – 1)(NbGroup – 1); DF2 = (N – NbGroup)(NbRep – 1); NCP = f²*N*NbRep*ε / (1 – ρ)
  • ANCOVA : DF1 = NumeratorDF; DF2 = N – NbGroup – NbPred – 1; NCP = f²N

Calcul de la taille de l'échantillon

Afin de calculer le nombre d'observations nécessaires, XLSTAT utilise un algorithme de recherche de racine d'une fonction appelé algorithme Van Wijngaarden-Dekker-Brent (Brent, 1973). Cet algorithme est adapté au cas où les dérivées de la fonction ne sont pas connues. On cherche ainsi N tel que

puissance_test(N)-puissance_recherchée=0

On obtient donc la taille N telle que la puissance soit la plus proche possible de la puissance recherchée.

Calcul des degrés de liberté du numérateur

Dans le cadre d'une ANOVA à facteurs fixes et interactions ou d'une ANCOVA, XLSTAT-Power propose de renseigner le nombre de degrés de liberté du numérateur pour la loi de Fisher non centrale. Supposons que nous avons un modèle à 3 facteurs, A (2 groupes), B (3 groupes), C (3 groupes), 3 interactions de niveau 2 A*B, A*C et B*C et 1 interaction de niveau 3, A*B*C. On aura donc 18 groupes.

Pour tester les effets principaux, par exemple A, nous avons : NbGroups=18 et NumeratorDF=(2-1) =1. Pour tester les interactions, par exemple A*B, nous avons NbGroups=18 et NumeratorDF=(2-1)(3-1)=2. Si on désire tester l'interaction de niveau 3 (A*B*C), on prendra NbGroups=18 et NumeratorDF=(2-1)(3-1)(3-1)=4. Dans le cadre d'une ANCOVA, les calculs seront similaires.