Transformer les variables dans XLSTAT - Exemple de la transformation Box-Cox

Jeu de données pour Transformation de variables XLS967 Ko

Vidéo du tutoriel
  • Pro Logiciel de base de la suite XLSTAT

  • Pré-requis système

    • Windows:
      • Versions : 9x/Me/NT/2000/XP/Vista/Win 7
      • Excel : 97 et supérieures
      • Processeur : 32 ou 64 bits
      • Disque dur : 150 Mo
    • Mac OS X:
      • OS : OS X
      • Excel : X, 2004 et 2011
      • Disque dur : 150 Mo

Avantages

  • Pratique et simple d'utilisation
    Pratique et simple d'utilisation XLSTAT est parfaitement intégré à Microsoft Excel qui est le tableur le plus populaire au monde. Grâce à cette intégration, et au suivi de la même philosophie qu'Excel, l'utilisation de XLSTAT est aisée. Le logiciel est accessible dans un onglet dédié qui contient le menu de chaque module. Les analyses disponibles sont regroupées en menus fonctionnels. Les boîtes de dialogues sont pratiques et leur paramétrage est simple.
  • Partage aisé des données et résultats
    Partage aisé des données et résultats Un des plus grands avantages de XLSTAT est le fait que les données et résultats peuvent être partagés sans contrainte. En effet, données et résultats sont stockés dans Microsoft Excel et donc accessibles à tous. Il n'est pas nécessaire pour le receveur d'avoir une licence XLSTAT ou tout autre visionneur additionnel. Ceci facilite votre travail d'équipe et le rend plus économique. Enfin, les résultats sont transposables dans les autres logiciels de Microsoft Office dont PowerPoint ce qui vous permet de créer des présentations avec d'excellents graphiques en quelques minutes.
  • Modulaire
    Modulaire XLSTAT est un produit modulaire articulé autour de XLSTAT-Pro qui est le logiciel de base de XLSTAT. XLSTAT-Pro inclut déjà toutes les fonctionnalités les plus courantes en statistiques et analyses de données multivariées. Des fonctions plus avancées sont aussi disponibles dans des modules additionnels qui répondent à des demandes plus spécifiques. Ainsi, vous pouvez adapter le logiciel à vos propres besoins ce qui le rend plus rentable.
  • Didactique
    Didactique Les résultats de XLSTAT sont affichés pour chaque analyse et sont toujours disponibles pour une navigation plus simple. De plus, des informations utiles sont associées aux résultats afin de faciliter votre interprétation.
  • A un juste prix
    A un juste prix XLSTAT est un logiciel de statistique et d'analyse de données complet et modulaire qui s'adapte à tous les besoins analytiques d'une organisation. Son prix est très raisonnable ce qui vous permet de le rentabiliser presque immédiatement. Toutes les licences XLSTAT incluent un support et une assistance de première qualité.
  • Accessible en de nombreuses langues
    Accessible en de nombreuses langues Nous nous sommes assurés que XLSTAT puisse être accessible au plus grand nombre en distribuant le programme dans de nombreuses langues dont le français, l'anglais, l'allemand, l'espagnol, l'italien, le portugais, le polonais, le chinois et le japonais.
  • Automatisable et personnalisable
    Automatisable et personnalisable La plupart des fonctions disponibles dans XLSTAT peuvent être directement appelées depuis l'application Visual Basic de Microsoft Excel. Elles peuvent être intégrées à vos routines pour répondre aux besoins d'une application particulière. Ajouter des tableaux de résultats, des graphiques, ou modifier l'existant est simplifié. De plus, XLSTAT inclut des outils permettant de sauvegarder ou de recharger des paramètres automatiquement, mais aussi de générer du code VBA. Ceci permet de reproduire vos analyses depuis l'éditeur VBA. Cette automatisation des analyses routinières vous fera gagner du temps.

Jeu de données pour transformer les données avec la transfomation Box-Cox

Une feuille Excel contenant un exemple de données et de résultats peut être téléchargée en cliquant ici.

Les données correspondent à un échantillon de 47 lots qui ont été mesurés pour leur niveau de déchet. Nous voulons faire une régression linéaire pour expliquer le niveau de déchet par d’autres variables du procédé, cependant la variable Niveau de déchet ne peut pas être considérée comme suivant une loi Normale comme le montre les résultats ci-dessous.

statistical software

Dans ce tutoriel nous allons vous montrer comment vous pouvez transformer les variables dans XLSTAT et prendre l’exemple de la transformation Box-Cox sur la variable Niveau de déchet.

Transformer les données avec XLSTAT

Il y a plusieurs façons de transformer les données dans XLSTAT.

Tout d’abord vous pouvez prendre avantage de Microsoft Excel et utiliser les fonctions qui sont à votre disposition dans le menu Insérer une fonction. Vous pouvez accéder à ce menu en cliquant sur l’icône fx au-dessus de la feuille de calcul.

data analysis software

Ensuite vous pouvez sélectionner une des fonctions listées sous Finance, Math & Trig, Statistiques, Base de données ou XLSTAT (dernière option).

principal component analysis software

Ceci vous donne accès à un grand nombre de transformations générales.

Paramétrer la transformation Box-Cox

De plus, XLSTAT vous offre la possibilité d’utiliser des fonctions spécifiques. Vous les trouverez sous le menu Préparation des données / Transformation des variables (ci-dessous).

partial least squares software

Dans la boîte de dialogue qui s’ouvre, commencez par sélectionner la ou les variables à transformer. Dans cet exemple, il s’agit de la variable "Niveau de déchet" dans la colonne B. Comme cette sélection comporte le nom de la variable, cochez l’option Libellés des colonnes.

On peut aussi ajouter le libellé des échantillons en cliquant sur l’option Libellé des échantillons puis sélectionnez la colonne A qui contient l’information sur les numéros des lots.

Les résultats seront présentés dans une nouvelle feuille comme l’option Feuille est sélectionnée. Cependant, vous pouvez changer cela en sélectionnant une des deux autres options.

La transformation la plus générale est une normalisation par l’écart-type non-biaisé. Cependant, il y a d’autres options disponibles si vous cochez la case Autre.

statistical software

Allez ensuite dans l’onglet Transformations qui contient les options suivantes :

  • Normaliser (n) : pour normaliser les variables en utilisant l'écart-type biaisé.
  • Centrer : pour centrer les données.
  • 1 / Ecart-type (n-1) : pour diviser les données par l'écart-type non biaisé.
  • 1 / Ecart-type (n) : pour diviser les données par l'écart-type biaisé.
  • Remettre à l'échelle de 0 à 1 : pour transformer les données de telle sorte qu'elles soient comprises entre 0 et 1.
  • Remettre à l'échelle de 0 à 100 : pour transformer les données de telle sorte qu'elles soient comprises entre 0 et 100.
  • Binariser (0/1) : pour transformer les données de telle sorte que les données égales à 0 soient égales à 0, et les données différentes de 0 soient égales à 1.
  • Signe (-1/0/1) : pour transformer les données de telle sorte que les données égales à 0 soient égales à 0, les données négatives soient égales à -1 et les données positives soient égales à 1.
  • Arcsin : pour calculer l'arc-sinus des données sélectionnées.
  • Transformation Box-Cox : pour augmenter la normalité des données. Vous pouvez soit imposer une valeur de Lambda, soit décider que XLSTAT doit l'optimiser.
  • Winsorize : pour éliminer les données ne correspondant pas à un intervalle donné par deux percentiles : soit p1 et p2 deux valeurs comprises entre 0 et 1, telles que p1<p2. Si une valeur x de l'échantillon est inférieure à q1, le quantile correspondant à p1 obtenu à partir de l'échantillon, ou supérieure à q2 le quantile correspondant à p2, alors la valeur est transformée en q1 dans le premier cas et en q2 dans le second cas.

Choisissez l’option Transformation Box-Cox comme nous voulons tenter de rendre la variable "Niveau de déchet" proche d’une distribution Normale. Aussi sélectionnez l’option Optimiser pour laisser XLSTAT déterminer la valeur optimale de Lambda.

statistical software

Le dernier onglet Données manquantes vous permet de décider comment traiter les données manquantes. Avec l’option choisie par défaut, vous obtiendrez un message d’erreur en cas de données manquantes. Nous allons garder cette option.

statistical analysis software

Cliquez sur le bouton OK pour lancer les calculs.

Interpréter les résultats de la transformation Box-Cox

Dans la feuille de résultat Transformation de variables vous trouverez la variable transformée ainsi que la valeur de Lambda utilisée.

statistical software

Vous pouvez faire un nouveau test de normalité sur les données transformées. Notez que maintenant l’hypothèse que la variable transformée Niveau de déchet suit une loi Normale n'est plus rejetée.

statistical software