Test de Cochran-Mantel-Haenszel

Quand utiliser le test de Cochran-Mantel-Haenszel ?

Le test de Cochran-Mantel-Haenszel (CMH) sert à tester l’hypothèse d’indépendance sur une série de tableaux de contingence correspondant à une expérience croisant deux variables catégorielles, avec une variable de contrôle prenant plusieurs valeurs.

Exemple d'application du test de Cochran-Mantel-Haenszel

Imaginons le cas d'un laboratoire travaillant sur un nouvel antifongique. Dans le but de définir la dose et la forme galénique adéquate, une expérience est menée avec quatre niveaux de dose et sous deux conditionnements différents (pommade ou gel douche). Pour chaque niveau de dose, le test est effectué sur une vingtaine de patients, équitablement répartis pour chaque conditionnement. Pour chaque patient, on évalue si le traitement est efficace ou non. Les résultats se présentent donc sous la forme d'un tableau de contingence à trois dimensions, ou plus simplement sous forme de 4 tableaux de contingence à deux dimensions. La variable correspondant à la dose est appelée variable de contrôle.

On pourrait vouloir faire un test d'indépendance sur le tableau résultant de la somme des 4 tableaux de contingence, néanmoins on risquerait dans ce cas de conclure à l'indépendance pour la seule raison que le sous-tableau ayant l'effectif le plus important correspond à un cas d'indépendance, alors que pour les autres tableaux on a une dépendance, ou parce que des dépendances diverses sont annulées par la somme.

Principe du test de Cochran-Mantel-Haenszel

Cochran (1954) puis Mantel et Haenszel (1959) ont proposé un test permettant de tester s'il y a indépendance entre les deux lignes et les deux colonnes des tableaux de contingence, sachant que les tableaux sont indépendants entre eux, et en conditionnant par rapport aux sommes marginales de chacun, comme dans le test standard d'indépendance sur tableaux de contingence.

Le test communément appelé test de Cochran-Mantel-Haenszel (CMH) s'appuie sur la statistique M² définie par :

M² = [|Σk (n11k- n1+k/ n++k)|-1/2]² / [Σk (n1+k n2+k n+1k n+2k)/( n++k²( n++k²-1))]

Cette statistique suit asymptotiquement une loi du Khi² à 1 degré de liberté. Connaissant M², on peut donc connaître la p-value, et connaissant le risque de première espèce, alpha, on peut déterminer la valeur critique. Il est aussi possible comme pour le test d'indépendance sur un tableau de contingence de calculer la p-value exacte dans le cas où les tableaux de contingence sont de taille 2x2. L'utilisation de la valeur absolue et la soustraction de -1/2 ainsi que la division par (n²++k-1) au lieu de n²++k correspondent à une correction de continuité proposée par Mantel et Haenszel. Son utilisation est vivement conseillée. XLSTAT permet néanmoins de la désactiver.

On peut noter au numérateur que l'on mesure l'écart à l'indépendance pour chaque case en haut à gauche du tableau de contingence et que l'on fait ensuite la somme des écarts. Si les écarts vont dans un sens différent d'un tableau à l'autre on risque donc de conclure à l'indépendance alors qu'il y a une dépendance au niveau de chaque tableau (erreur de seconde espèce). Cette situation correspond au cas où l'on a une interaction de niveau trois entre les facteurs. Ce test est donc à utiliser avec précaution.

Le test de Cochran-Mantel-Haenszel a été généralisé par Birch (1965), Landis et al. (1978) et Mantel et Byar (1978) au cas de tableaux LxC où L et C peuvent être plus grands que 2. Le calcul de M² est plus complexe mais aboutit toujours à une statistique qui suit asymptotiquement une loi du Khi² à (L-1)(C-1) degrés de liberté.

Il est recommandé de réaliser en parallèle du test CMH une analyse des V de Cramer pour les différents tableaux de contingence afin d'avoir une idée de leur contribution respective à l'indépendance. XLSTAT affiche automatiquement pour chacun des tableaux de contingence, un tableau avec les V de Cramer, les Khi² et les p-values correspondantes (exactes pour les tableaux 2x2 et asymptotiques pour les tableaux de dimension supérieures) lorsque cela est possible, c'est-à-dire lorsqu'aucune somme marginale n'est nulle.