Faire un échantillonnage d'une distribution et un test de normalité avec XLSTAT

Jeu de données pour Tests de normalité XLS246 Ko

Vidéo du tutoriel
  • Pro Logiciel de base de la suite XLSTAT

  • Pré-requis système

    • Windows:
      • Versions : 9x/Me/NT/2000/XP/Vista/Win 7
      • Excel : 97 et supérieures
      • Processeur : 32 ou 64 bits
      • Disque dur : 150 Mo
    • Mac OS X:
      • OS : OS X
      • Excel : X, 2004 et 2011
      • Disque dur : 150 Mo

Avantages

  • Pratique et simple d'utilisation
    Pratique et simple d'utilisation XLSTAT est parfaitement intégré à Microsoft Excel qui est le tableur le plus populaire au monde. Grâce à cette intégration, et au suivi de la même philosophie qu'Excel, l'utilisation de XLSTAT est aisée. Le logiciel est accessible dans un onglet dédié qui contient le menu de chaque module. Les analyses disponibles sont regroupées en menus fonctionnels. Les boîtes de dialogues sont pratiques et leur paramétrage est simple.
  • Partage aisé des données et résultats
    Partage aisé des données et résultats Un des plus grands avantages de XLSTAT est le fait que les données et résultats peuvent être partagés sans contrainte. En effet, données et résultats sont stockés dans Microsoft Excel et donc accessibles à tous. Il n'est pas nécessaire pour le receveur d'avoir une licence XLSTAT ou tout autre visionneur additionnel. Ceci facilite votre travail d'équipe et le rend plus économique. Enfin, les résultats sont transposables dans les autres logiciels de Microsoft Office dont PowerPoint ce qui vous permet de créer des présentations avec d'excellents graphiques en quelques minutes.
  • Modulaire
    Modulaire XLSTAT est un produit modulaire articulé autour de XLSTAT-Pro qui est le logiciel de base de XLSTAT. XLSTAT-Pro inclut déjà toutes les fonctionnalités les plus courantes en statistiques et analyses de données multivariées. Des fonctions plus avancées sont aussi disponibles dans des modules additionnels qui répondent à des demandes plus spécifiques. Ainsi, vous pouvez adapter le logiciel à vos propres besoins ce qui le rend plus rentable.
  • Didactique
    Didactique Les résultats de XLSTAT sont affichés pour chaque analyse et sont toujours disponibles pour une navigation plus simple. De plus, des informations utiles sont associées aux résultats afin de faciliter votre interprétation.
  • A un juste prix
    A un juste prix XLSTAT est un logiciel de statistique et d'analyse de données complet et modulaire qui s'adapte à tous les besoins analytiques d'une organisation. Son prix est très raisonnable ce qui vous permet de le rentabiliser presque immédiatement. Toutes les licences XLSTAT incluent un support et une assistance de première qualité.
  • Accessible en de nombreuses langues
    Accessible en de nombreuses langues Nous nous sommes assurés que XLSTAT puisse être accessible au plus grand nombre en distribuant le programme dans de nombreuses langues dont le français, l'anglais, l'allemand, l'espagnol, l'italien, le portugais, le polonais, le chinois et le japonais.
  • Automatisable et personnalisable
    Automatisable et personnalisable La plupart des fonctions disponibles dans XLSTAT peuvent être directement appelées depuis l'application Visual Basic de Microsoft Excel. Elles peuvent être intégrées à vos routines pour répondre aux besoins d'une application particulière. Ajouter des tableaux de résultats, des graphiques, ou modifier l'existant est simplifié. De plus, XLSTAT inclut des outils permettant de sauvegarder ou de recharger des paramètres automatiquement, mais aussi de générer du code VBA. Ceci permet de reproduire vos analyses depuis l'éditeur VBA. Cette automatisation des analyses routinières vous fera gagner du temps.

Jeu de données pour l'échantillonnage d'une distribution et test de normalité

Un classeur Excel comprenant à la fois les données utilisées dans cet exemple et les résultats obtenus peut être téléchargé en cliquant ici.

Dans ce tutoriel nous vous montrons comment générer un échantillon aléatoire tiré dans une loi Normale, puis dans une loi Uniforme , puis comment utiliser un test de normalité pour vérifier si les échantillons suivent une loi normale ou non. Rappelons que l'hypothèse de normalité est fréquente en statistique.

Dans un premier temps nous créons deux échantillons, le premier à partir d'une loi N(2,4) (de moyenne 2, et de variance 4), le second dans une loi Uniforme entre -1.5 et 5 (de moyenne 2 et de variance 49/12 =4.08). Pour cela l'outil "Echantillonnage d'une distribution" de la section "Préparation des données" est utilisé.

Faire un échantillonage d'une distribution

Une fois XLSTAT-Pro lancé, sélectionnez le menu XLSTAT / Préparation des données / Echantillonnage d'une distribution, ou cliquez sur le bouton correspondant de la barre d'outils Préparation des données.

barnormf.gif

Une fois que vous avez cliqué sur le bouton, la boîte de dialogue de l'outil Echantillonnage d'une distribution apparaît.

Sélectionnez alors la loi puis les paramètres de la loi, puis la taille de l'échantillon à générer. La boîte présentée ci-dessous correspond à la génération d'un échantillon de 1000 individus à partir d'une loi N(2,2).

norm1f.gif

Une fois que vous avez cliqué sur le bouton OK, l'échantillon est affiché. Un second échantillon est ensuite généré suivant une loi uniforme entre -1.5 et 5.

Test de la normalité

Ensuite nous voulons tester la normalité des deux échantillons générés. Sélectionnez le menu XLSTAT / Description des données / Tests de normalité, ou cliquez sur le bouton correspondant de la barre d'outils Description des données.

barnorm2f.gif

Une fois que vous avez cliqué sur le bouton, la boîte de dialogue des Tests de normalité est affichée.

Sélectionnez les deux échantillons. Activez ensuite l'option Colonnes indépendantes pour préciser que les échantillons sont indépendants. L'option Q-Q plot est activée afin de nous permettre de visualiser l'écart à la normalité des échantillons.

norm2f.gif

Une fois que vous avez cliqué sur le bouton OK, les calculs sont effectués et les résultats sont affichés sur une nouvelle feuille.

Interpretation des résultats des tests de normalité

Les résultats sont d'abord fournis pour le premier échantillon, puis pour le second.

Le premier résultat affiché est le Q-Q plot pour le premier échantillon. Le Q-Q plot permet de comparer la fonction de répartition de l'échantillon (en abscisse) à celle qu'aurait une loi normale de même moyenne et même variance (en ordonnées). Dans le cas d'un échantillon issu d'une distribution normale, on doit observer un alignement presque parfait avec la première bissectrice du plan. Dans le cas contraire des écarts doivent être observés.

norm3f.gif

Nous voyons ici que la fonction de répartition empirique est très proche de la bissectrice.

Les tests de Shapiro-Wilk et de Jarque-Bera confirment que l'on ne peut pas rejeter l'hypthèse de normalité de l'échantillon. On notera qu'avec le test de Shapiro-Wilk, le risque de se tromper en rejetant l'hypothèse serait plus important qu'avec le test de Jarque-Bera.

norm4f.gif

Les résultats qui suivent concernent le second échantillon, avec dans un premier temps, le Q-Q plot.

Contrairement à ce que nous avons observé pour le premier échantillon, nous remarquons ici un fort écart à la normalité.

norm5f.gif

Cet écart est confirmé par les tests ci-dessous qui permettent d'affirmer sans hésitation que l'on doit rejeter l'hypothèse de normalité de l'échantillon.

norm6f.gif

En conclusion, dans ce tutoriel, nous avons vu comment générer deux échantillons, l'un suivant une loi normale, l'autre suivant une loi uniforme. Nous avons ensuite pu confirmer la validité des tests de normalité de Shapiro-Wilk et Jarque-Bera sur ces deux échantillons : nous avons vu que les tests ont validé l'hypothèse de normalité pour le premier échantillon, alors qu'ils l'ont infirmée pour le second échantillon.