Tests d'homogénéité

homogeneity-tests-flow.png

Principe des tests d’homogénéité

Les tests d'homogénéité rassemblent un grand nombre de tests pour lesquels l'hypothèse nulle est qu'une série temporelle est homogène entre deux temps donnés.

La variété des tests vient de ce que les hypothèses alternatives possibles sont nombreuses : changement de distribution, changements de moyenne (une ou plusieurs fois) ou présence de tendance.

Les tests d’homogénéité présentés dans cet outil correspondent à l'hypothèse alternative d'un unique décalage. Pour l'ensemble des tests, XLSTAT fournit des p-values en utilisant des rééchantillonnages Monte Carlo, les calculs exacts étant soit impossibles soit trop coûteux en temps de calcul.

Pour la présentation des différents tests, nous désignons par Xi (i=1, 2, …,T) une série de T variables dont on observe une valeur xi (i=1,2,3, …, T) à T temps successifs. Soit Let µ la moyenne des T valeurs observées, et soit σleur écart type biaisé (on divise par T).

Remarque 1 : Si l'on a une idée précise du temps de changement, les tests déjà existant dans la section des tests paramétriques ou non paramétriques peuvent être utilisés : par exemple si l'on suppose que les variables suivent des distributions normales, on peut utiliser le test z (variance connue) ou de Student (variance estimée) pour tester la présence d'un changement de moyenne à un temps t. Si l'on pense que la variance change, on peut utiliser un test de comparaison de variances (test de Fisher dans le cas normal par exemple, ou de Kolmogorov-Smirnov dans un cas plus général).

Remarque 2 : Les tests présentés ci-dessous sont sensibles à une tendance (linéaire par exemple). Avant d'appliquer ces tests, il faut donc bien être sûr de vouloir identifier un temps de rupture séparant deux périodes homogènes.

Test de Pettitt pour l’homogénéité

Le test de Pettitt est un test non paramétrique ne nécessitant aucune hypothèse quant à la distribution des données. Le test de Pettitt est une adaptation du test de Mann-Whitney basé sur les rangs, permettant d'identifier le temps auquel se produit un changement. Dans son article de 1979 Pettitt décrit l'hypothèse nulle comme étant que les T variables suivent une même distribution F, et l'hypothèse alternative comme étant qu'à un temps t se produit un changement de distribution. Néanmoins le test de Pettitt ne permet pas de détecter un changement de distribution s'il n'est pas assorti d'un changement de position. Par exemple, si avant le temps t, les variables suivent une distribution normale N(0, 1) et à partir du temps t une distribution N(0,3), le test de Pettitt ne détectera pas de changement, de la même manière qu'un test de Mann-Whitney ne permettrait pas de détecter un changement de position dans un tel cas. Il faudrait dans ce cas utiliser par une méthode s'appuyant exemple sur le test de Kolmogorov Smirnov. Nous reformulons donc ainsi les hypothèses nulle et alternatives :

  • H0 : les T variables suivent une ou plusieurs distributions ayant un même paramètre de position.
  • Test bilatéral : Ha : il existe un temps t à partir duquel les variables changent de paramètre de position.
  • Test unilatéral à gauche : Ha : il existe un temps t à partir duquel le paramètre de position des variables diminue de D.
  • Test unilatéral à droite : Ha : il existe un temps t à partir duquel le paramètre de position des variables augmente de D.

XLSTAT évalue la p-value ainsi qu'un intervalle autour de la p-value en calculant par rééchantillonnage les valeurs possible de la statistique K.

Test SNHT d'Alexandersson pour l’homogénéité

Le test SNHT (Standard normal homogeneity test) a été développé par Alexandersson (1986) pour détecter un changement dans une série de précipitations. Le test s'applique à une série de ratios comparant les observations d'une station de mesure à la moyenne de plusieurs stations. Les ratios sont ensuite centrés-réduits. La série des Xi correspond ici aux ratios standardisés. Les hypothèses nulle et alternative sont définies par :

  • H0 : les T variables Xi suivent une loi N(0,1).
  • Ha : entre les temps 1 et n les variables sont distribuées suivant une loi N(µ1, 1) et entre n+1 et T elles sont distribuées suivant une loi N(µ2,1).

XLSTAT évalue la p-value ainsi qu'un intervalle autour de la p-value en calculant par simulation les valeurs possible de la statistique To.

Test de Buishand pour l’homogénéité

Le test de Buishand (1982) peut être utilisé sur des variables suivant des distributions quelconques. Néanmoins ses propriétés ont été particulièrement étudiées pour le cas normal. L'article Buishand se concentre sur le cas du test bilatéral, mais pour la statistique Q présentée ci-dessous le cas unilatéral est aussi possible. Buishand a développé une seconde statistique R, pour laquelle seule une hypothèse bilatérale est possible. Dans le cas de la statistique Q, les hypothèses nulle et alternative sont définies par :

  • H0 : les T variables suivent une ou plusieurs distributions ayant une même moyenne.
  • Test bilatéral : Ha : Il existe un temps t à partir duquel les variables changent de moyenne.
  • Test unilatéral à gauche : Ha : Il existe un temps t à partir duquel la moyenne des variables diminue de D.
  • Test unilatéral à droite : Ha : Il existe un temps t à partir duquel la moyenne des variables augmente de D.

Dans le cas de la statistique R (R pour Range, l'amplitude), les hypothèses nulle et alternative sont définies par :

  • H0 : les T variables suivent une ou plusieurs distributions ayant une même moyenne.
  • Test bilatéral : Ha : Les variables ne sont pas homogènes en moyenne.

Remarque : le test de R ne permet pas de déterminer le temps de rupture.

Test du rapport de von Neumann pour l’homogénéité

Le rapport de von Neumann est très efficace pour comparer les distributions à chaque instant cependant le test de N ne permet pas de déterminer le temps de rupture.

ternary diagramneural network diagram

analysez vos données avec xlstat

essayez gratuitement pendant 14 jours