Réaliser un échantillonnage stratifié dans XLSTAT

Jeu de données pour Echantillonnage de données XLS46.0 Ko

Vidéo du tutoriel
  • Pro Logiciel de base de la suite XLSTAT

  • Pré-requis système

    • Windows:
      • Versions : 9x/Me/NT/2000/XP/Vista/Win 7
      • Excel : 97 et supérieures
      • Processeur : 32 ou 64 bits
      • Disque dur : 150 Mo
    • Mac OS X:
      • OS : OS X
      • Excel : X, 2004 et 2011
      • Disque dur : 150 Mo

Avantages

  • Pratique et simple d'utilisation
    Pratique et simple d'utilisation XLSTAT est parfaitement intégré à Microsoft Excel qui est le tableur le plus populaire au monde. Grâce à cette intégration, et au suivi de la même philosophie qu'Excel, l'utilisation de XLSTAT est aisée. Le logiciel est accessible dans un onglet dédié qui contient le menu de chaque module. Les analyses disponibles sont regroupées en menus fonctionnels. Les boîtes de dialogues sont pratiques et leur paramétrage est simple.
  • Partage aisé des données et résultats
    Partage aisé des données et résultats Un des plus grands avantages de XLSTAT est le fait que les données et résultats peuvent être partagés sans contrainte. En effet, données et résultats sont stockés dans Microsoft Excel et donc accessibles à tous. Il n'est pas nécessaire pour le receveur d'avoir une licence XLSTAT ou tout autre visionneur additionnel. Ceci facilite votre travail d'équipe et le rend plus économique. Enfin, les résultats sont transposables dans les autres logiciels de Microsoft Office dont PowerPoint ce qui vous permet de créer des présentations avec d'excellents graphiques en quelques minutes.
  • Modulaire
    Modulaire XLSTAT est un produit modulaire articulé autour de XLSTAT-Pro qui est le logiciel de base de XLSTAT. XLSTAT-Pro inclut déjà toutes les fonctionnalités les plus courantes en statistiques et analyses de données multivariées. Des fonctions plus avancées sont aussi disponibles dans des modules additionnels qui répondent à des demandes plus spécifiques. Ainsi, vous pouvez adapter le logiciel à vos propres besoins ce qui le rend plus rentable.
  • Didactique
    Didactique Les résultats de XLSTAT sont affichés pour chaque analyse et sont toujours disponibles pour une navigation plus simple. De plus, des informations utiles sont associées aux résultats afin de faciliter votre interprétation.
  • A un juste prix
    A un juste prix XLSTAT est un logiciel de statistique et d'analyse de données complet et modulaire qui s'adapte à tous les besoins analytiques d'une organisation. Son prix est très raisonnable ce qui vous permet de le rentabiliser presque immédiatement. Toutes les licences XLSTAT incluent un support et une assistance de première qualité.
  • Accessible en de nombreuses langues
    Accessible en de nombreuses langues Nous nous sommes assurés que XLSTAT puisse être accessible au plus grand nombre en distribuant le programme dans de nombreuses langues dont le français, l'anglais, l'allemand, l'espagnol, l'italien, le portugais, le polonais, le chinois et le japonais.
  • Automatisable et personnalisable
    Automatisable et personnalisable La plupart des fonctions disponibles dans XLSTAT peuvent être directement appelées depuis l'application Visual Basic de Microsoft Excel. Elles peuvent être intégrées à vos routines pour répondre aux besoins d'une application particulière. Ajouter des tableaux de résultats, des graphiques, ou modifier l'existant est simplifié. De plus, XLSTAT inclut des outils permettant de sauvegarder ou de recharger des paramètres automatiquement, mais aussi de générer du code VBA. Ceci permet de reproduire vos analyses depuis l'éditeur VBA. Cette automatisation des analyses routinières vous fera gagner du temps.

Jeu de données pour un échantillonnage stratifié

Le jeu de données utilisé dans ce tutoriel correspond à la liste des employés d'une compagnie ainsi que certaines données sur leur genre (homme/femme) et leur type de temps de travail (plein temps/temps partiel). L'équipe des ressources humaines veut conduire une enquête sur les conditions de travail dans l'entreprise qui sera représentative de l'opinion générale sans interroger la totalité des employés. Ils vont donc faire un échantillonnage stratifié.

Il y a 46% de femme et 54% d'homme dans l'entreprise. Les employés à temps partiel sont majoritairement des femmes 25 % du total contre 9% pour les hommes.

data-sampling-descriptive-statistique.png

Un classeur Excel contenant à la fois les données et les résultats peut être téléchargé ici.

Paramétrer un échantillonnage stratifié

Ouvrez la boîte de dialogue Echantillonnage de données qui est accessible via le menu Préparation des données.

data-sampling-menu.png

Sélectionnez toutes les données disponibles en sélectionnant les quatre colonnes (employés, genre, temps de travail, strate).

Choisissez l'option Aléatoire stratifié (2). Cette option prend en compte les proportions dans chaque strate.

Nous voulons sélectionner seulement 20 employés pour répondre à l'enquête. Entrez la valeur "20" pour le Taille de l'échantillon.

Dans le champs Strates, vous pouvez soit sélectionner la colonne "Strate" du jeu de données soit les variables qui doivent définir les strates ici les deux variables "Genre" et "Temps de travail".

Le nom des variables est inclus dans le jeu de donnée il faut donc cocher la case Libellés des variables.

Par contre, il n'est pas nécessaire de changer l'ordre des résultats donc on ne sélectionne pas l'option Mélanger.

Quand vous avez fini de paramétrer la boîte de dialogue, cliquez sur OK.

data-sampling-dialog-box.png

Résultats d'un échantillonnage stratifié

Les résultats de l'échantillonnage stratifié apparaissent dans une nouvelle feuille Excel "Echantillonnage des données". Vous trouvez une table de 20 échantillons, vous n'aurez probablement pas les mêmes résultats car il y a un tirage au hasard des échantillons à inclure. Cependant vous devez avoir le même nombre d'échantillon par starter, soit :

  • 4 femmes employées à plein temps,
  • 5 femmes employées à temps partiel,
  • 9 hommes employés à temps plein,
  • 2 hommes employés à temps partiel.

data-sampling-result.png

Ci-dessous vous avez les statsitiques descriptives qui sont calculées sure l'échantillon stratifié. Celles-ci sont comparés aux statistiques de la population : 

  • un échantillon de 20% pour représenter les 22% de femme employées à temps plein de la population,
  • un échantillon de 25% pour représenter les 25% de femme employées à temps partiel de la population,
  • un échantillon de 45% pour représenter les 44% d'homme employés à temps plein de la population,
  • un échantillon de 10% pour représenter les 9% d'homme employés à temps partiel de la population.

data-sampling-result-2.png