ANOVA à mesures répétées avec XLSTAT et les modèles mixtes

Jeu de données pour Modèles mixtes XLS45.0 Ko

Vidéo du tutoriel
  • Pro Logiciel de base de la suite XLSTAT

  • Pré-requis système

    • Windows:
      • Versions : 9x/Me/NT/2000/XP/Vista/Win 7
      • Excel : 97 et supérieures
      • Processeur : 32 ou 64 bits
      • Disque dur : 150 Mo
    • Mac OS X:
      • OS : OS X
      • Excel : X, 2004 et 2011
      • Disque dur : 150 Mo

Avantages

  • Pratique et simple d'utilisation
    Pratique et simple d'utilisation XLSTAT est parfaitement intégré à Microsoft Excel qui est le tableur le plus populaire au monde. Grâce à cette intégration, et au suivi de la même philosophie qu'Excel, l'utilisation de XLSTAT est aisée. Le logiciel est accessible dans un onglet dédié qui contient le menu de chaque module. Les analyses disponibles sont regroupées en menus fonctionnels. Les boîtes de dialogues sont pratiques et leur paramétrage est simple.
  • Partage aisé des données et résultats
    Partage aisé des données et résultats Un des plus grands avantages de XLSTAT est le fait que les données et résultats peuvent être partagés sans contrainte. En effet, données et résultats sont stockés dans Microsoft Excel et donc accessibles à tous. Il n'est pas nécessaire pour le receveur d'avoir une licence XLSTAT ou tout autre visionneur additionnel. Ceci facilite votre travail d'équipe et le rend plus économique. Enfin, les résultats sont transposables dans les autres logiciels de Microsoft Office dont PowerPoint ce qui vous permet de créer des présentations avec d'excellents graphiques en quelques minutes.
  • Modulaire
    Modulaire XLSTAT est un produit modulaire articulé autour de XLSTAT-Pro qui est le logiciel de base de XLSTAT. XLSTAT-Pro inclut déjà toutes les fonctionnalités les plus courantes en statistiques et analyses de données multivariées. Des fonctions plus avancées sont aussi disponibles dans des modules additionnels qui répondent à des demandes plus spécifiques. Ainsi, vous pouvez adapter le logiciel à vos propres besoins ce qui le rend plus rentable.
  • Didactique
    Didactique Les résultats de XLSTAT sont affichés pour chaque analyse et sont toujours disponibles pour une navigation plus simple. De plus, des informations utiles sont associées aux résultats afin de faciliter votre interprétation.
  • A un juste prix
    A un juste prix XLSTAT est un logiciel de statistique et d'analyse de données complet et modulaire qui s'adapte à tous les besoins analytiques d'une organisation. Son prix est très raisonnable ce qui vous permet de le rentabiliser presque immédiatement. Toutes les licences XLSTAT incluent un support et une assistance de première qualité.
  • Accessible en de nombreuses langues
    Accessible en de nombreuses langues Nous nous sommes assurés que XLSTAT puisse être accessible au plus grand nombre en distribuant le programme dans de nombreuses langues dont le français, l'anglais, l'allemand, l'espagnol, l'italien, le portugais, le polonais, le chinois et le japonais.
  • Automatisable et personnalisable
    Automatisable et personnalisable La plupart des fonctions disponibles dans XLSTAT peuvent être directement appelées depuis l'application Visual Basic de Microsoft Excel. Elles peuvent être intégrées à vos routines pour répondre aux besoins d'une application particulière. Ajouter des tableaux de résultats, des graphiques, ou modifier l'existant est simplifié. De plus, XLSTAT inclut des outils permettant de sauvegarder ou de recharger des paramètres automatiquement, mais aussi de générer du code VBA. Ceci permet de reproduire vos analyses depuis l'éditeur VBA. Cette automatisation des analyses routinières vous fera gagner du temps.

Jeu de données pour réaliser une ANOVA à mesures répétées avec les modèles mixtes

Une feuille Excel contenant les données et les résultats de cet exemple peut être téléchargée en cliquant ici.

Les données ont été obtenues sur un échantillon de 24 patients en dépression séparés en deux groupes (1 : contrôle / 2 : traitement). Cinq mesures ont été effectuées sur les patients (0 : avant le début du traitement, 1 : 1 mois après le début du traitement, 3 : 3 mois après et 6 : 6 mois après). La variable dépendante représente un score permettant d’évaluer l’état de dépression du patient.

Une ANOVA à mesures répétées est basée sur le même modèle qu’une ANOVA classique, dans notre cas, l’équation du modèle s’écrira : AnovaRepEq.gif

On aura donc deux facteurs fixes (les variables group et time) et un facteur d’interaction. La différence avec une analyse de la variance classique réside dans le fait que les erreurs eijk pourront être corrélées. En effet, nous ne pouvons pas supposer que les mesures sur un même sujet prises à des périodes différentes soient indépendantes.

XLSTAT utilise les modèles mixtes afin de faire une ANOVA sur mesures répétées. Ceci entraîne quelques différences avec l’ANOVA sur mesures répétées classique. Des options supplémentaires sont présentes, par exemple, l’utilisation de différentes structures sur la matrice de covariance des erreurs. Dans ce tutoriel, nous utiliserons la structure compound symmetry. Pour obtenir des détails sur les structures de covariance, veuillez consulter l’aide d’XLSTAT.

Le format des données :

Les données doivent être sous un format bien particulier dans le cas de l’utilisation d’une ANOVA sur mesures répétées avec les modèles mixtes, on aura : - une variable qualitative mesures répétées qui indiquera la mesure à laquelle on se trouve - une variable qualitative sujet qui indiquera le sujet traité

Ainsi, dans notre exemple ; chaque individu (sujet) apparaîtra dans quatre lignes. La figure suivante résume le format utilisé (on aura donc 4 colonnes et 96 lignes):

ANOVArep1.gif

Ainsi, si vos données sont au format : une colonne par mesure, il faudra modifier ce format de façon à obtenir le format précédent.

Paramétrer une ANOVA à mesures répétées avec les modèles mixtes

Une fois XLSTAT lancé et les données dans le bon format, choisissez la commande XLSTAT / Modélisation / ANOVA à mesures répétées ou cliquez sur le bouton ANOVA à mesures répétées de la barre d'outils Modélisation.

ANOVArep2f.gif

Une fois le bouton cliqué, la boîte de dialogue correspondant à l'ANOVA à mesures répétées apparaît. Dans le premier onglet, vous pouvez sélectionner les données sur la feuille Excel.

La Variable dépendante correspond à la variable expliquée (ou variable à modéliser), qui est dans ce cas précis le score (dv). Toutes les variables restantes sont qualitatives, sélectionnez les 3 variables "subj", "time" et "group".

L'option Libellés des variables est laissée activée car la première ligne des colonnes comprend le nom des variables.

Les variables sujet et répétée doivent être aussi sélectionnées parmi les variables explicatives.

ANOVArep3f.gif

Dans l'onglet Options, vous pouvez sélectionner la structure de la matrice de covariance des erreurs (pour des détails sur les options de cet onglet, voir l’aide d’XLSTAT).

Sélectionnez la structure compound symmetry. Nous choisissons la contrainte a1=0, ce qui implique que le modèle s'écrira de façon à considérer que le groupe des contrôles (group=1) aura l'effet de base.

Appliquer une contrainte en ANOVA est indispensable pour des raisons théoriques, mais cela ne change ni les résultats, ni la qualité de l'analyse.

Par ailleurs, nous allons prendre en compte des interactions, il faut donc activer l’option interactions.

ANOVArep4f.gif

Une fois que l'utilisateur a cliqué sur OK, une nouvelle fenêtre permettant de sélectionner les facteurs fixes, la variable répétée et la variable sujet apparaît :

ANOVArep5f.gif

Nous voulons effectuer une ANOVA à mesures répétées en utilisant comme effets fixes les variables "time", "group" et "time*group".

Le facteur répété est la variable "time". Le facteur associé aux sujets est la variable "subj" qui est associé au numéro du patient traité.

Note : XLSTAT ne permet pas de définir un facteur simultanément comme effet fixe et comme facteur sujet. Les variables associées au facteur répété et au facteur sujet doivent être différentes et doivent être qualitatives.

Une fois que l'utilisateur a cliqué sur OK, les calculs reprennent et les résultats sont affichés.

Interpréter une ANOVA à mesures répétées avec les modèles mixtes

Le premier tableau de résultats fournit les coefficients d'ajustement ainsi que des informations associés aux données.

ANOVArep6f.gif

Les coefficients du modèle sont obtenus en utilisant le maximum de vraisemblance restreint (REML), on obtient donc des indices différents de ceux de l’ANOVA classique. Les AIC, AICC, SBC et CAIC sont des indices qui permettent de comparer des modèles en utilisant différentes structures de matrices de covariance.

Le tableau suivant donne les paramètres de la matrice de covariance des erreurs (structure compound symmetry). Il y a ici deux paramètres estimés et tous deux sont significatifs.

ANOVArep7f.gif

Les résultats du test du rapport des vraisemblances permet de comparer le modèle classique lorsqu’on suppose que les mesures associées au même sujet à des moments différents sont indépendantes (matrice de covariance des erreurs diagonale) et le modèle avec la structure de covariance sélectionnée.

ANOVArep8f.gif

Nous voyons que la différence est significative et que l’on gagne donc à utiliser la structure compound symmetry. Nous voulons maintenant savoir si les variables contribuent toutes autant à expliquer la variabilité. Pour cela nous devons analyser les tableaux de résultats des tests de type III des effets fixes. Ces résultats sont équivalents aux Type III SS de l’ANOVA classique.

ANOVArep9f.gif

Le tableau des tests de type III des effets fixes permet de vérifier la significativité des effets fixes en utilisant un test F de Fisher. Nous voyons donc que tous les effets fixes sont significatifs. Le temps écoulé a l’effet le plus important.

Ainsi, nous pouvons donc dire que le traitement et le temps écoulé ont des effets sur les patients Le tableau suivant rassemble les paramètres du modèle, leur écart-type ainsi qu’un intervalle de confiance. Ces paramètres s’interprètent de la même façon que dans le cas d’une analyse de la variance classique.

ANOVArep10f.gif

En analysant les paramètres du modèle, on voit qu'aux temps 1, 3 et 6, l’effet sur le score est négatif et que le fait d’être traité a un effet négatif sur le score. Le tableau ci-dessus peut être utilisé pour étudier l'impact des variables sur le score, mais aussi pour prédire des valeurs dans des situations qui n'on pas été rencontrées. Ainsi, d'après le modèle, on peut déterminer qu’un patient traité aura un score moyen de 106,7 au temps 6, tout en sachant que l'influence de l'interaction ne peut être prise en compte.

Ainsi, nous avons put étudier un modèle d’ANOVA en prenant en compte le fait que certaines observations n’étaient pas indépendantes. D’autres sorties sont disponibles dans XLSTAT et nous permettront d’approfondir l'analyse comme, par exemple, les différents types de résidus ainsi que les graphiques associés aux résidus et aux moyennes obtenues par moindres carrés.