Calculer la taille de l'échantillon nécessaire dans le cadre d'une régression linéaire avec XLSTAT-Power

Jeu de données pour Puissance statistique pour la régression linéaire XLS23.0 Ko

Vidéo du tutoriel
"Puissance statistique pour la régression linéaire" inclus dans : Télécharger L'évaluation Plus d'info Commentaires utilisateurs
  • Power Logiciel de calcul de la puissance statistique

  • Pré-requis système

    • Windows:
      • Versions : 9x/Me/NT/2000/XP/Vista/Win 7
      • Excel : 97 et supérieures
      • Processeur : 32 ou 64 bits
      • Disque dur : 150 Mo
    • Mac OS X:
      • OS : OS X
      • Excel : X, 2004 et 2011
      • Disque dur : 150 Mo

Avantages

  • Pratique et simple d'utilisation
    Pratique et simple d'utilisation XLSTAT est parfaitement intégré à Microsoft Excel qui est le tableur le plus populaire au monde. Grâce à cette intégration, et au suivi de la même philosophie qu'Excel, l'utilisation de XLSTAT est aisée. Le logiciel est accessible dans un onglet dédié qui contient le menu de chaque module. Les analyses disponibles sont regroupées en menus fonctionnels. Les boîtes de dialogues sont pratiques et leur paramétrage est simple.
  • Partage aisé des données et résultats
    Partage aisé des données et résultats Un des plus grands avantages de XLSTAT est le fait que les données et résultats peuvent être partagés sans contrainte. En effet, données et résultats sont stockés dans Microsoft Excel et donc accessibles à tous. Il n'est pas nécessaire pour le receveur d'avoir une licence XLSTAT ou tout autre visionneur additionnel. Ceci facilite votre travail d'équipe et le rend plus économique. Enfin, les résultats sont transposables dans les autres logiciels de Microsoft Office dont PowerPoint ce qui vous permet de créer des présentations avec d'excellents graphiques en quelques minutes.
  • Modulaire
    Modulaire XLSTAT est un produit modulaire articulé autour de XLSTAT-Pro qui est le logiciel de base de XLSTAT. XLSTAT-Pro inclut déjà toutes les fonctionnalités les plus courantes en statistiques et analyses de données multivariées. Des fonctions plus avancées sont aussi disponibles dans des modules additionnels qui répondent à des demandes plus spécifiques. Ainsi, vous pouvez adapter le logiciel à vos propres besoins ce qui le rend plus rentable.
  • Didactique
    Didactique Les résultats de XLSTAT sont affichés pour chaque analyse et sont toujours disponibles pour une navigation plus simple. De plus, des informations utiles sont associées aux résultats afin de faciliter votre interprétation.
  • A un juste prix
    A un juste prix XLSTAT est un logiciel de statistique et d'analyse de données complet et modulaire qui s'adapte à tous les besoins analytiques d'une organisation. Son prix est très raisonnable ce qui vous permet de le rentabiliser presque immédiatement. Toutes les licences XLSTAT incluent un support et une assistance de première qualité.
  • Accessible en de nombreuses langues
    Accessible en de nombreuses langues Nous nous sommes assurés que XLSTAT puisse être accessible au plus grand nombre en distribuant le programme dans de nombreuses langues dont le français, l'anglais, l'allemand, l'espagnol, l'italien, le portugais, le polonais, le chinois et le japonais.
  • Automatisable et personnalisable
    Automatisable et personnalisable La plupart des fonctions disponibles dans XLSTAT peuvent être directement appelées depuis l'application Visual Basic de Microsoft Excel. Elles peuvent être intégrées à vos routines pour répondre aux besoins d'une application particulière. Ajouter des tableaux de résultats, des graphiques, ou modifier l'existant est simplifié. De plus, XLSTAT inclut des outils permettant de sauvegarder ou de recharger des paramètres automatiquement, mais aussi de générer du code VBA. Ceci permet de reproduire vos analyses depuis l'éditeur VBA. Cette automatisation des analyses routinières vous fera gagner du temps.

XLSTAT-Pro propose un outil permettant d'appliquer un modèle de régression linéaire. XLSTAT-Power permet d'estimer la puissance ou de calculer le nombre d'observations nécessaires associée aux variations du R² dans le cadre d'une régression linéaire.

Calcul de la taille d'un échantillon et puissance d'un test

Lorsqu'on teste une hypothèse à l'aide d'un test statistique, on a plusieurs éléments à choisir :

  1. L'hypothèse nulle H0 et l'hypothèse alternative Ha
  2. Le test statistique à utiliser
  3. L'erreur de première espèce (erreur de type I) que l'on appelle aussi alpha. Elle se produit lorsqu'on rejette l'hypothèse nulle alors qu'elle est vraie. Elle est fixée a priori pour chaque test et vaut 5%.

L'erreur de seconde espèce ou beta est moins étudiée mais elle revêt une grande importance.

En effet, elle représente la probabilité que l'on ne rejette pas l'hypothèse nulle alors qu'elle est fausse. On ne peut pas la fixer a priori mais, on peut essayer de la minimiser, en jouant sur les autres paramètres du modèle. La puissance d'un test est calculée comme 1-beta et représente la probabilité que l'on rejette l'hypothèse nulle alors qu'elle est bien fausse.

Les calculs de puissance en statistique se font généralement avant que l'expérience ne soit menée. On s'en sert principalement pour estimer le nombre d'observations nécessaires pour que l'expérience ait la qualité statistique requise.

Jeu de données pour le calcul de la taille de l'échantillon nécessaire dans le cadre d'une régression linéaire et but de ce tutoriel

Dans une future étude, on désire étudier le poids d'enfants en fonction de la taille et de l'âge des enfants (comme dans le tutoriel suivant sur la régression linéaire multiple).

On veut donc savoir si le R² de ce modèle est significativement différent de 0. On aura donc deux variables explicatives ou prédicteurs et on voudrait savoir combien d'enfants doivent être interrogés afin d'obtenir une puissance de 0,9. Comme nous ne connaissons pas encore les paramètres de nos échantillons, nous allons utiliser le concept de taille de l'effet (effect size). Cohen (1988) a introduit ce concept qui permet de donner un ordre de grandeur pour l'importance de l'effet. On testera donc 3 tailles d'effets : 0,02 pour un effet faible, 0,15 pour un effet modéré et 0,35 pour un effet fort. On s'attend à ce que plus la taille de l'effet est grande, plus la taille d'échantillon nécessaire sera petite.

Une feuille Excel contenant les résultats de cet exemple peut être téléchargée en cliquant ici.

Paramétrer le calcul de la taille de l'échantillon nécessaire dans le cadre d'une régression linéaire

Une fois XLSTAT lancé, cliquez sur l'icône Power et choisissez la fonction régression linéaire.

pwrreg1f.gif

Une fois le bouton cliqué, la boîte de dialogue apparaît.

Vous devez alors choisir l'objectif Trouver la taille de l'échantillon, puis sélectionner le test R² différent de 0.

L'alpha est de 0,05.

La puissance recherchée est de 0,9.

Le nombre de prédicteurs ou de variables explicatives est de 2. Plutôt que de rentrer des paramètres, on sélectionne l'option Taille de l'effet et on prend 0,02 pour un effet faible.

pwrreg2f.gif

Dans l'onglet graphique, l'option graphique de simulation est activée et on représentera la taille de l'échantillon 1 sur l'axe vertical et la puissance sur l'axe horizontal. La puissance varie entre 0,8 et 0,95 par intervalle de 0,01.

pwrreg3f.gif

Une fois que vous avez cliqué sur le bouton OK, les calculs sont effectués, puis les résultats sont affichés.

Interpréter les résultats du calcul de la taille de l'échantillon nécessaire dans le cadre d'une régression linéaire

Le premier tableau rassemble les paramètres utilisés en entrée. Dans notre cas, uniquement le nombre de prédicteurs.

pwrreg4f.gif

Le second tableau rassemble les résultats du calcul ainsi qu'une interprétation des résultats.

pwrreg5f.gif

On voit qu'il faut 636 observations pour obtenir une puissance la plus proche possible de 0,9.

Le tableau suivant rassemble les calculs obtenus pour chaque valeur de la puissance comprise entre 0,8 et 0,95.

pwrreg6f.gif

Le graphique de simulation montre l'évolution de la taille de l'échantillon en fonction de la puissance. On voit que pour une puissance de 0,8, il suffit d'un peu plus de 485 observations et que pour une puissance de 0,95 on arrive à 775 observations.

pwrreg7f.gif

Pour des tailles d'effet de 0,15 et 0,35, on obtient les résultats suivants :

pwrreg8f.gifpwrreg9f.gif

La taille de l'échantillon va donc baisser car le R² va s'éloigner de 0 et on voit que pour une forte différence, 39 observations seront suffisantes.

Ainsi si on suppose que la qualité d'explication de la taille d'un enfant par les variables poids et âge est fort (R² proche de 1), il suffira donc de 39 observations pour obtenir une puissance de 0,9.

XLSTAT-Power est donc un outil puissant aussi bien pour rechercher la taille de l'échantillon requise pour une analyse que pour calculer la puissance d'un test. Évidemment, si l'utilisateur dispose de plus d'informations sur ses échantillons, il pourra donner des détails sur les paramètres en entrée, plutôt que de rentrer la taille de l'effet. Il est aussi possible de tester l'effet de l'ajout de variables explicatives à un modèle.