ANOVA à un facteur suivie de tests de comparaisons multiples

Jeu de données pour Analyse de la variance ou ANOVA XLS65.5 Ko

Vidéo du tutoriel
"Analyse de la variance ou ANOVA" inclus dans : Télécharger L'évaluation Plus d'info Commentaires utilisateurs
  • Pro Logiciel de base de la suite XLSTAT

  • Pré-requis système

    • Windows:
      • Versions : 9x/Me/NT/2000/XP/Vista/Win 7/Win 8
      • Excel : 97 et supérieures
      • Processeur : 32 ou 64 bits
      • Disque dur : 150 Mo
    • Mac OS X:
      • OS : OS X
      • Excel : X, 2004 et 2011
      • Disque dur : 150 Mo

Avantages

  • Pratique et simple d'utilisation
    Pratique et simple d'utilisation XLSTAT est parfaitement intégré à Microsoft Excel qui est le tableur le plus populaire au monde. Grâce à cette intégration, et au suivi de la même philosophie qu'Excel, l'utilisation de XLSTAT est aisée. Le logiciel est accessible dans un onglet dédié qui contient le menu de chaque module. Les analyses disponibles sont regroupées en menus fonctionnels. Les boîtes de dialogues sont pratiques et leur paramétrage est simple.
  • Partage aisé des données et résultats
    Partage aisé des données et résultats Un des plus grands avantages de XLSTAT est le fait que les données et résultats peuvent être partagés sans contrainte. En effet, données et résultats sont stockés dans Microsoft Excel et donc accessibles à tous. Il n'est pas nécessaire pour le receveur d'avoir une licence XLSTAT ou tout autre visionneur additionnel. Ceci facilite votre travail d'équipe et le rend plus économique. Enfin, les résultats sont transposables dans les autres logiciels de Microsoft Office dont PowerPoint ce qui vous permet de créer des présentations avec d'excellents graphiques en quelques minutes.
  • Modulaire
    Modulaire XLSTAT est un produit modulaire articulé autour de XLSTAT-Pro qui est le logiciel de base de XLSTAT. XLSTAT-Pro inclut déjà toutes les fonctionnalités les plus courantes en statistiques et analyses de données multivariées. Des fonctions plus avancées sont aussi disponibles dans des modules additionnels qui répondent à des demandes plus spécifiques. Ainsi, vous pouvez adapter le logiciel à vos propres besoins ce qui le rend plus rentable.
  • Didactique
    Didactique Les résultats de XLSTAT sont affichés pour chaque analyse et sont toujours disponibles pour une navigation plus simple. De plus, des informations utiles sont associées aux résultats afin de faciliter votre interprétation.
  • A un juste prix
    A un juste prix XLSTAT est un logiciel de statistique et d'analyse de données complet et modulaire qui s'adapte à tous les besoins analytiques d'une organisation. Son prix est très raisonnable ce qui vous permet de le rentabiliser presque immédiatement. Toutes les licences XLSTAT incluent un support et une assistance de première qualité.
  • Accessible en de nombreuses langues
    Accessible en de nombreuses langues Nous nous sommes assurés que XLSTAT puisse être accessible au plus grand nombre en distribuant le programme dans de nombreuses langues dont le français, l'anglais, l'allemand, l'espagnol, l'italien, le portugais, le polonais, le chinois et le japonais.
  • Automatisable et personnalisable
    Automatisable et personnalisable La plupart des fonctions disponibles dans XLSTAT peuvent être directement appelées depuis l'application Visual Basic de Microsoft Excel. Elles peuvent être intégrées à vos routines pour répondre aux besoins d'une application particulière. Ajouter des tableaux de résultats, des graphiques, ou modifier l'existant est simplifié. De plus, XLSTAT inclut des outils permettant de sauvegarder ou de recharger des paramètres automatiquement, mais aussi de générer du code VBA. Ceci permet de reproduire vos analyses depuis l'éditeur VBA. Cette automatisation des analyses routinières vous fera gagner du temps.

Jeu de données pour la réalisation d'une ANOVA à un facteur suivie de tests de comparaisons multiples

Une feuille Excel contenant les données et les résultats de cet exemple peut être téléchargée en cliquant ici.

Les données correspondent à une expérience où 4 dentifrices ont été chacun testés sur 6 personnes afin que soit mesuré leur impact sur la blancheur des dents. Tous les patients utilisaient auparavant le même dentifrice.

But de ce tutoriel sur l'ANOVA à un facteur suivie de tests de comparaisons multiples

En utilisant l'outil d'ANOVA de XLSTAT nous cherchons ici à déterminer s'il existe une différence significative entre les différents dentifrices, et si tel est le cas, quel est le dentifrice le plus efficace. Nous sommes dans un cas d'ANOVA à un facteur (le type de dentifrice) équilibrée puisque le nombre de répétitions est le même pour les différents groupes.

Paramétrer une ANOVA à un facteur suivie de tests de comparaisons multiples

Une fois XLSTAT lancé, choisissez la commande XLSTAT / Modélisation / Analyse de la Variance (ANOVA) ou cliquez sur le bouton ANOVA de la barre d'outils Modélisation.

barano1f.gif

Une fois le bouton cliqué, la boîte de dialogue correspondant à l'ANOVA apparaît.

Vous pouvez alors sélectionner les données sur la feuille Excel.

La Variable dépendante correspond à la variable expliquée, soit dans ce cas précis, à la "blancheur" des dents dont nous voulons expliquer la variabilité par la variable explicative qualitative "Dentifrice".

L'option Libellés des variables est laissée activée car la première ligne des colonnes comprend le nom des variables.

anova-un-facteur-1.gif

Dans l'onglet Options, nous choisissons la contrainte à a1=0, ce qui implique que le modèle s'écrira de façon à considérer que le dentifrice T1 aura l'effet de base.

Appliquer une contrainte en ANOVA est indispensable pour des raisons théoriques, mais cela ne change ni les résultats (prévisions, R², etc.), ni la qualité de l'analyse.

anova-un-facteur-2.gif

Dans l'onglet Sorties les options Comparaison par paires et Comparaison avec un contrôle sont activées.

Le test de Tukey est fiable et simple à interpréter.

Nous ajoutons la méthode REGWQ qui est très fiable, et le test de Dunnett qui permet de comparer toutes les modalités avec une modalité de contrôle.

Les tests de comparaison multiples sont un domaine complexe des statistiques. Si vous voulez approfondir le sujet, nous vous recommandons le livre de Jason C. Hsu.

anova-un-facteur-3.gif

Une fois que vous avez cliqué sur le bouton OK, les calculs commencent puis s'interrompent pour vous demander quelle est la modalité de contrôle. Nous choisissons T1.

anova-un-facteur-4.gif

Une fois que l'utilisateur a cliqué sur OK les calculs reprennent et l'affichage des résultats s'achève.

Interpréter les résultats d'une ANOVA à un facteur suivie de tests de comparaisons multiples

Le premier tableau de résultats fournit les coefficients d'ajustement. Le R² (coefficient de détermination) donne une idée du % de variabilité de la variable à modéliser, expliqué par les variables explicatives. Plus ce coefficient est proche de 1, meilleur est le modèle. Dans notre cas, 56% de la variabilité est expliquée par le type de dentifrice. Le reste de la variabilité est explicable par des effets qui ne sont ni recensés, ni mesurés dans cette analyse.

anova-un-facteur-5.gif

Le tableau d'analyse de la variance est un résultat qui doit être analysé attentivement (voir ci-dessous). C'est à ce niveau que l'on teste si l'on peut considérer que la variable explicative sélectionnée (le type de dentifrice) apporte une quantité d'information significative au modèle (hypothèse nulle H0) ou non. En d'autres termes, c'est un moyen de tester si la moyenne de la variable à modéliser suffirait à décrire les résultats obtenus ou non.

anova-un-facteur-6.gif

Le test du F de Fisher est utilisé. Etant donnée que la probabilité associée au F est dans ce cas de 0.001, cela signifie que l'on prend un risque de 0.1% en concluant que la variable explicative apporte une quantité d'information significative au modèle.

Le tableau suivant fournit les détails sur le modèle et est essentiel dès lors que le modèle doit être utilisé pour faire des prévisions ou des simulations. Dans notre cas particulier il n'a pas beaucoup d'intérêt. On remarquera simplement que l'intervalle de confiance pour l'effet du dentifrice T2 comprend la valeur 0, ce qui indique que le dentifrice T2 n'est pas significativement différent de T1.

anova-un-facteur-7.gif

Le diagramme en bâtons des coefficients standardisés permet de comparer visuellement les impacts relatifs des modalités, et de voir quels intervalles de confiance comprennent la valeur 0.

anova-un-facteur-8.gif

Le tabeau suivant présente l'analyse des résidus. Une attention particulière doit être portée aux résidus centrés réduits, qui, étant données les hypothèses liées à l'ANOVA, doivent être distribués suivant une loi normale N(0,1). Cela signifie, entre autres, que 95% des résidus doivent se trouver dans l'intervalle [-1.96, 1.96]. Etant donné le faible nombre de données dont on dispose ici, toute valeur en dehors de cet intervalle est révélatrice d'une donnée suspecte. Nous pouvons ici identifier une valeur suspecte (13ième observation) le résidu étant égal à -2.8279. Afin d'expliquer cette valeur, on pourra vérifier que le bon dentifrice a bien été donné à la personne en question, ou analyser la raison pour laquelle la réaction du patient au denditrice a été plus faible que pour les autres.

anova-un-facteur-9.gif

L'histogramme des résidus centrés réduits permet de repérer rapidement la présence de valeurs hors de l'intervalle [-1.96, 1.96].

anova-un-facteur-10.gif

Enfin, nous allons pouvoir répondre à notre question initiale: y a-t-il une différence significative entre les dentifrices, et si oui, comment peut-on les classer. Comme il est montré dans le tableau ci-dessous, le test de Tukey HSD (Honestly Significantly Different), a été appliqué à l'ensemble des couples de différences possible. Le risque de 5% que nous avons choisi est utilisé pour déterminer la valeur critique q, qui est comparée à la différence standardisée entre les moyennes. D'autres logiciels se basent sur la valeur "d" aussi fournie par XLSTAT. Seulement deux paires semblent être significativement différentes (T1, T3) et (T2,T3). En utilisant le résultat des tests, les dentifrices sont ensuite classés. On notera qu'il n'y a pas transitivité (> signifie pas significativement différent, et <> signifie significativement différent): T4 > T3 T4 > T2 mais T2 <> T3

anova-un-facteur-11.gif

La procédure REQWQ donne un résultat différent (voir ci-dessous), ce qui montre que l'on doit être prudent lorsque l'on utilise des procédures de comparaisons multiples. Trois couples de modalités sont ici singificativement différentes: contrairement à ce qui était le cas ci-dessus, T1 et T4 sont ici jugés comme étant significativement différents. Le tableau des regroupements fait donc ressortir trois groupes de modalités.

anova-un-facteur-12.gif

Le test de Dunnett a été calculé pour comparer chaque modalité avec la modalité T1. Le test de Dunnett fait aussi ressortir une différence significative entre T1 et T4.

anova-un-facteur-13.gif

En conclusion, les différentes pâtes dentifrice testées ont un impact significativement différent sur la blancheur des dents. Comme le dentifrice T1 est déjà sur le marché, afin de promouvoir le nouveau produit, les dentifrices T3 ou T4 pourront être sélectionnés pour être mis sur le marché.