Faire un test F de Fisher pour comparer la variance de deux échantillons

Jeu de données pour Comparaison des variances de deux échantillons XLS184 Ko

Vidéo du tutoriel
"Comparaison des variances de deux échantillons" inclus dans : Télécharger L'évaluation Plus d'info Commentaires utilisateurs
  • Pro Logiciel de base de la suite XLSTAT

  • Pré-requis système

    • Windows:
      • Versions : 9x/Me/NT/2000/XP/Vista/Win 7
      • Excel : 97 et supérieures
      • Processeur : 32 ou 64 bits
      • Disque dur : 150 Mo
    • Mac OS X:
      • OS : OS X
      • Excel : X, 2004 et 2011
      • Disque dur : 150 Mo

Avantages

  • Pratique et simple d'utilisation
    Pratique et simple d'utilisation XLSTAT est parfaitement intégré à Microsoft Excel qui est le tableur le plus populaire au monde. Grâce à cette intégration, et au suivi de la même philosophie qu'Excel, l'utilisation de XLSTAT est aisée. Le logiciel est accessible dans un onglet dédié qui contient le menu de chaque module. Les analyses disponibles sont regroupées en menus fonctionnels. Les boîtes de dialogues sont pratiques et leur paramétrage est simple.
  • Partage aisé des données et résultats
    Partage aisé des données et résultats Un des plus grands avantages de XLSTAT est le fait que les données et résultats peuvent être partagés sans contrainte. En effet, données et résultats sont stockés dans Microsoft Excel et donc accessibles à tous. Il n'est pas nécessaire pour le receveur d'avoir une licence XLSTAT ou tout autre visionneur additionnel. Ceci facilite votre travail d'équipe et le rend plus économique. Enfin, les résultats sont transposables dans les autres logiciels de Microsoft Office dont PowerPoint ce qui vous permet de créer des présentations avec d'excellents graphiques en quelques minutes.
  • Modulaire
    Modulaire XLSTAT est un produit modulaire articulé autour de XLSTAT-Pro qui est le logiciel de base de XLSTAT. XLSTAT-Pro inclut déjà toutes les fonctionnalités les plus courantes en statistiques et analyses de données multivariées. Des fonctions plus avancées sont aussi disponibles dans des modules additionnels qui répondent à des demandes plus spécifiques. Ainsi, vous pouvez adapter le logiciel à vos propres besoins ce qui le rend plus rentable.
  • Didactique
    Didactique Les résultats de XLSTAT sont affichés pour chaque analyse et sont toujours disponibles pour une navigation plus simple. De plus, des informations utiles sont associées aux résultats afin de faciliter votre interprétation.
  • A un juste prix
    A un juste prix XLSTAT est un logiciel de statistique et d'analyse de données complet et modulaire qui s'adapte à tous les besoins analytiques d'une organisation. Son prix est très raisonnable ce qui vous permet de le rentabiliser presque immédiatement. Toutes les licences XLSTAT incluent un support et une assistance de première qualité.
  • Accessible en de nombreuses langues
    Accessible en de nombreuses langues Nous nous sommes assurés que XLSTAT puisse être accessible au plus grand nombre en distribuant le programme dans de nombreuses langues dont le français, l'anglais, l'allemand, l'espagnol, l'italien, le portugais, le polonais, le chinois et le japonais.
  • Automatisable et personnalisable
    Automatisable et personnalisable La plupart des fonctions disponibles dans XLSTAT peuvent être directement appelées depuis l'application Visual Basic de Microsoft Excel. Elles peuvent être intégrées à vos routines pour répondre aux besoins d'une application particulière. Ajouter des tableaux de résultats, des graphiques, ou modifier l'existant est simplifié. De plus, XLSTAT inclut des outils permettant de sauvegarder ou de recharger des paramètres automatiquement, mais aussi de générer du code VBA. Ceci permet de reproduire vos analyses depuis l'éditeur VBA. Cette automatisation des analyses routinières vous fera gagner du temps.

Jeu de données pour faire un test F de Fisher pour comparer la variance de deux échantillons et but de ce tutoriel

Une feuille Excel contenant les données et les résultats de cet exemple peut être téléchargée en cliquant ici.

Les données proviennent de [Fisher M. (1936). The Use of Multiple Measurements in Taxonomic Problems. Annals of Eugenics, 7, pp 179 -188] et correspondent à 100 fleurs d'Iris, décrites par 2 variables quantitatives (longeur des sépales, largeur des sépales). Deux espèces font partie de cette étude : setosa et versicolor.

Le but de ce tutoriel est de savoir si les espèces ont le même type de sépales et donc de comparer les distributions de deux échantillons.

La première chose à faire est de tester si les échantillons suivent la distribution Normale car le test de comparaison des variances de Fisher est sensible à la non-normalité des données.

Les résultats sont accessibles dans les feuilles Excel Norm. Toutes les variables suivent une distribution Normale.

Nous pouvons donc lancer un test F pour tester l’égalité des variances. Si les variances sont égales, nous pourrons tenter de comparer les moyennes.

Paramétrer un test F de Fisher pour comparer la variance de deux échantillons

Pour faire un test de comparaison des variances de deux échantillons allez dans le menu Tests paramétriques et sélectionnez l’option Comparaison des variances de deux échantillons

F-test using XLSTAT - Statistical Analysis Software

Dans la boîte de dialogue Comparaison des variances de deux échantillons, dans l’onglet Général sélectionnez les données pour les échantillons 1 et 2. Pour l’Echantillon 1 prenez la colonne C qui contient la longueur des sépales pour la variété Versicolor et pour l’Echantillon 2 la colonne F correspondant à la la longueur des sépales pour la variété Setosa.

Le Format des données est Une colonne par échantillon comme chacune des colonnes correspond à un échantillon différent.

L’option Feuille est sélectionnée pour obtenir les résultats dans une nouvelles feuille du classeur.

Comme les colonnes ont un libellé dans la première cellule, l’option Libellés des colonnes est activée.

Nous choisissons le test F de Fisher.

F-test using XLSTAT - Data Analysis Software

Une fois ces paramètres choisis, passez à l’onglet Options.

Nous souhaitons tester l’égalité des variances donc l’hypothèse alternative adéquate est : Variance 1 / Variance 2 ≠ RR est égal à 1.

Le niveau de significativité par défaut est de 5%, gardez-le.

F-test using XLSTAT - Statistical Analysis Package

Les données ne comporte pas de données manquantes donc nous allons directement à l’onglet Sorties où vous sélectionnez la seule option possible : Statistiques descriptives.

F-test using XLSTAT - Statistical Analysis Software

Pressez le bouton OK, quand tout est prêt.

Interpréter les résultats d'un test F de Fisher pour comparer la variance de deux échantillons

Les résultats qui apparaissent dans une nouvelle feuille montre qu’il faut rejeter l’hypothèse H0 car la p-value est de 0,009 qui est inférieure à la limite de 0,05. Ainsi les variances ne peuvent être considérées comme étant égales. La longueur des sépales des deux populations - Versicolor et Setosa – ne suivent pas la même distribution.

Nous allons refaire le même processus pour la largeur des sépales.

Le seul changement à faire dans la procédure décrite ci-dessus est la sélection des données. Pour l’Echantillon 1 choisissez la colonne C et pour l’Echantillon 2 la colonne F.

F-test using XLSTAT - Statistics Software

Cette fois-ci les variances sont égales car la p-value du test (0,189) est supérieure à 0,05.

F-test using XLSTAT - Statistics Excel

Comme l’égalité des variance est démontrée nous pouvons faire un test de comparaison des moyennes.

Comme vous pouvez le remarquer dans la table des statistiques descriptives la moyenne de la largeur des sépales pour l’espèce Versicolor est plus petite que celle pour l’espèce Setosa. Ainsi nous allons faire un test unilatéral pour le test de comparaison des moyennes. Les tests unilatéraux sont en général plus précis.

Allez au menu Tests paramétriques / Tests t et z pour deux échantillons.

F-test using XLSTAT - Stats Excel

Dans l’onglet Général faites les mêmes sélections de variable que pour le test précédent.

Sélectionnez l’option Test t de Student comme nous ne connaissons pas la variance des deux populations.

F-test using XLSTAT - Statistics Excel

Dans l’onglet Options choisissez l’hypothèse alternative Moyenne 1 – Moyenne 2 < DD est égal à 0.

Nous pouvons Supposer l’égalité des variances comme nous l’avons démontré dans le test precedent.

F-test using XLSTAT - Statistics Excel

Cliquez sur OK.

Dans les résultats de ce test, on démontre que les deux moyennes sont significativement différentes, la moyenne de la largeur des sépales des iris Versicolor étant plus petite que celle de la moyenne des iris Setosa. Les largeurs des sépales des deux populations - Versicolor et Setosa – suivent donc des distributions différentes.

F-test using XLSTAT - Statistics Excel