Analyse de Variance Multivariée (MANOVA)

Analyse de Variance Multivariée (MANOVA)

Qu'est-ce que la MANOVA ?

L’analyse de variance multivariée (MANOVA) utilise le même cadre conceptuel que l’ANOVA. Il s’agit d’une extension de l’ANOVA permettant de prendre en compte une combinaison de variables dépendantes plutôt qu’une variable dépendante unique. Dans le cadre de la MANOVA, les variables explicatives sont souvent appelées facteurs.

L’avantage de l’utilisation d’une MANOVA au lieu de plusieurs ANOVA simultanées réside dans le fait qu’elle prend en compte les corrélations entre les variables réponses et permet ainsi une meilleure utilisation des informations provenant des données. La combinaison des variables dépendantes peut représenter une variable non mesurable directement.

La MANOVA teste les effets de facteurs sur plusieurs variables réponses. Avec une MANOVA, il est donc possible de tester conjointement toutes les hypothèses testées par une série d’ANOVAs avec plus de chance d’observer un effet significatif.

De plus, faire plusieurs ANOVA au lieu d’une MANOVA augmente l’erreur de type I c’est à dire la probabilité de rejeter à tort l’hypothèse H0.

Enfin, plusieurs ANOVA séparées ne prennent pas en compte la covariation entre variables réponses tandis que la MANOVA n’est pas seulement sensible aux différences de moyenne entre niveaux de facteurs mais également à la covariance entre variables explicatives. Quand ces variables sont toutes étudiées en même temps, il y a plus de chances de détecter une possible corrélation entre certaines variables. Ce n’est pas le cas avec une ANOVA qui ne prend en compte qu’une seule variable réponse.

Prenons comme exemple illustratif une MANOVA à deux facteurs A et B. Le modèle MANOVA s’écrit de la manière suivante :

yijk = μ + αi + βj + αβij + εijk (1)

yijk est la kème observation du ième niveau du facteur A et du jème niveau du facteur B, et e est l’erreur du modèle.

Les hypothèses utilisées en MANOVA sont identiques à celles de la régression linéaire : les erreurs e suivent une même loi normale N(0,s) et sont indépendantes.

Si l’on souhaite utiliser les différents tests proposés dans les résultats il est recommandé de vérifier a posteriori que les hypothèses sous-jacentes sont bien vérifiées. La normalité des résidus peut être vérifiée en analysant certains graphiques ou en utilisant un test de normalité. L’indépendance des résidus peut être vérifiée en analysant certains graphiques ou en utilisant le test de Durbin-Watson.

Options

La MANOVA est surtout utilisée pour effectuer des tests multivariés dont le but est de vérifier si les paramètres correspondant aux différentes modalités d’un facteur sont significativement différents ou non. Par exemple, on peut tester les effets de quatre traitements appliqués à des plantes sur une qualité de production représentée par une combinaison de variables, en incluant ou non des effets d’interaction.

De nombreux tests ont été proposés à cet escient. La majorité de ces tests s’appuie sur la relation entre la matrice d’erreur E et la matrice qui symbolise l’hypothèse testée dans le modèle H, c'est-à-dire les valeurs propres de la matrice E-1H. XLSTAT propose les principaux tests parmi lesquels :

Test de Wilks Lambda 

Test de la trace de Hotelling-Lawley

Test de la trace de Pillai 

Test de la plus grande racine de Roy

Résultats

Statistiques descriptives : les tableaux de statistiques descriptives présentent pour toutes les variables sélectionnées des statistiques simples. Pour les variables dépendantes (en bleu) et les variables explicatives quantitatives, sont affichés le nombre d’observations, le nombre de données manquantes, le nombre de données non manquantes, la moyenne, et l’écart-type (non biaisé). Pour les variables explicatives qualitatives sont affichés le nom des différentes modalités ainsi que leur fréquence respective.

Matrices SSCP : ces tableaux sont affichés afin de vous permettre d’avoir un aperçu de l’effet des facteurs et interactions du modèle.

Si des tests multivariés ont été demandés, les résultats correspondant sont ensuite affichés. On peut retrouver les statistiques associées, les degrés de libertés ainsi que les p-values.