Discrétiser une variable continue

Jeu de données pour Discrétisation XLS66.5 Ko

Vidéo du tutoriel
  • Pro Logiciel de base de la suite XLSTAT

  • Pré-requis système

    • Windows:
      • Versions : 9x/Me/NT/2000/XP/Vista/Win 7
      • Excel : 97 et supérieures
      • Processeur : 32 ou 64 bits
      • Disque dur : 150 Mo
    • Mac OS X:
      • OS : OS X
      • Excel : X, 2004 et 2011
      • Disque dur : 150 Mo

Avantages

  • Pratique et simple d'utilisation
    Pratique et simple d'utilisation XLSTAT est parfaitement intégré à Microsoft Excel qui est le tableur le plus populaire au monde. Grâce à cette intégration, et au suivi de la même philosophie qu'Excel, l'utilisation de XLSTAT est aisée. Le logiciel est accessible dans un onglet dédié qui contient le menu de chaque module. Les analyses disponibles sont regroupées en menus fonctionnels. Les boîtes de dialogues sont pratiques et leur paramétrage est simple.
  • Partage aisé des données et résultats
    Partage aisé des données et résultats Un des plus grands avantages de XLSTAT est le fait que les données et résultats peuvent être partagés sans contrainte. En effet, données et résultats sont stockés dans Microsoft Excel et donc accessibles à tous. Il n'est pas nécessaire pour le receveur d'avoir une licence XLSTAT ou tout autre visionneur additionnel. Ceci facilite votre travail d'équipe et le rend plus économique. Enfin, les résultats sont transposables dans les autres logiciels de Microsoft Office dont PowerPoint ce qui vous permet de créer des présentations avec d'excellents graphiques en quelques minutes.
  • Modulaire
    Modulaire XLSTAT est un produit modulaire articulé autour de XLSTAT-Pro qui est le logiciel de base de XLSTAT. XLSTAT-Pro inclut déjà toutes les fonctionnalités les plus courantes en statistiques et analyses de données multivariées. Des fonctions plus avancées sont aussi disponibles dans des modules additionnels qui répondent à des demandes plus spécifiques. Ainsi, vous pouvez adapter le logiciel à vos propres besoins ce qui le rend plus rentable.
  • Didactique
    Didactique Les résultats de XLSTAT sont affichés pour chaque analyse et sont toujours disponibles pour une navigation plus simple. De plus, des informations utiles sont associées aux résultats afin de faciliter votre interprétation.
  • A un juste prix
    A un juste prix XLSTAT est un logiciel de statistique et d'analyse de données complet et modulaire qui s'adapte à tous les besoins analytiques d'une organisation. Son prix est très raisonnable ce qui vous permet de le rentabiliser presque immédiatement. Toutes les licences XLSTAT incluent un support et une assistance de première qualité.
  • Accessible en de nombreuses langues
    Accessible en de nombreuses langues Nous nous sommes assurés que XLSTAT puisse être accessible au plus grand nombre en distribuant le programme dans de nombreuses langues dont le français, l'anglais, l'allemand, l'espagnol, l'italien, le portugais, le polonais, le chinois et le japonais.
  • Automatisable et personnalisable
    Automatisable et personnalisable La plupart des fonctions disponibles dans XLSTAT peuvent être directement appelées depuis l'application Visual Basic de Microsoft Excel. Elles peuvent être intégrées à vos routines pour répondre aux besoins d'une application particulière. Ajouter des tableaux de résultats, des graphiques, ou modifier l'existant est simplifié. De plus, XLSTAT inclut des outils permettant de sauvegarder ou de recharger des paramètres automatiquement, mais aussi de générer du code VBA. Ceci permet de reproduire vos analyses depuis l'éditeur VBA. Cette automatisation des analyses routinières vous fera gagner du temps.

Jeu de données pour discrétiser une variable continue et but de ce tutoriel

Une feuille Excel contenant un exemple de données et de résultats peut être téléchargée en cliquant ici.

Les données correspondent à un échantillon de patients avec des informations telles que leur poid et taille ainsi que leur indexe de masse corporel (BMI).

Dans cet exemple on veut regrouper les patients par groupe de BMI.

Paramétrer la discrétisation d'une variable continue

Une fois XLSTAT lancé, cliquez sur l’icône Préparation des données et choisissez la fonction Discrétisation ou dans la barre d'outils Préparation des données sélectionnez l'icone Discrétisation (ci-dessous).

barDiscretization_fr.png

Une fois le bouton cliqué, la boîte de dialogue apparaît. Vous pouvez alors sélectionner les données sur la feuille Excel, elles correspondent à la colonne "BMI" (colonne D).

Cochez l'option Libellés des Variables comme la sélection contient le nom de la variable (BMI).

Cochez aussi l'option Libellés des Observations et sélectionnez le "noms des patients" (colonne A).

Il y a plusieurs façons de grouper les patients :

  • Amplitude constante : choisissez cette méthode pour créer des classes de même amplitude.
  • Intervalles : choisissez cette méthode pour créer un nombre donné d'intervalles de même amplitude.
  • Effectifs égaux : choisissez cette méthode pour que les classes créées comprennent toutes le même nombre d'observations (dans la mesure du possible).
  • Automatique (Fisher) : choisissez cette méthode pour créer les classes en utilisant l'algorithme de Fisher.
  • Automatique (k-means) : choisissez cette méthode pour créer les intervalles en utilisant l'algorithme k-means.
  • Intervalles (définis par l'utilisateur) : choisissez cette méthode pour sélectionner une colonne contenant en ordre croissant la borne inférieure du premier intervalle, et la borne supérieure de tous les intervalles.
  • 80-20 : choisissez cette méthode pour créer deux classes, la première comprenant les 80 premiers % de la série, cette dernière étant classée en ordre croissant, la seconde contenant les 20% restant.
  • 20-80 : choisissez cette méthode pour créer deux classes, la première comprenant les 20 premiers % de la série, cette dernière étant classée en ordre croissant, la seconde contenant les 80% restant.
  • 80-15-5 (ABC) : choisissez cette méthode pour créer trois classes, la première comprenant les 80 premiers % de la série, cette dernière étant classée en ordre croissant, la seconde contenant les 15% suivant, et la troisième contenant les 5% restant. Cette classification est parfois appelées ABC.
  • 5-15-80 : choisissez cette méthode pour créer trois classes, la première comprenant les 5 premiers % de la série, cette dernière étant classée en ordre croissant, la seconde contenant les 15% suivant, et la troisième contenant les 80% restant.

Nous choisissons ici l'option Intervalles (définis par l'utilisateur). Il faut alors sélectionner les bornes correspondant aux limites de chaque classe de BMI.

Une colonne a été préparée à cet effet.

pls software

Ensuite allez à l'onglet Sorties et sélectionnez les barycentres, les Résultats par classe et les Résultats par objets.

acp logiciel

Enfin allez à l'onglet Graphiques et choisissez un histogramme avec des barres et en fréquence.

analyse de données logiciel

Quand vous avez fini les sélections cliquez sur le bouton OK.

Interpréter les résultats de la discrétisation d'une variable continue

Les résultats sont affichés dans une nouvelle feuille nommée "Discétisation".

Le premier résultat est un histogramme. Remarquez que la taille des barres correspond à la taille des classes.

En dessous vous avez un tableau qui présente la répartition des patients dans les différentes classes. Notez que la plupart sont dans la catégorie 3 qui indique un poids normal.

acp logiciel

Ensuite vous avez le barycentre des classes qui ne correspond pas forcément au centre de chaque classe.

Enfin vous avez un tableau qui correspond à l'attribution des patients aux différentes classes.

statistical software

La vidéo ci-dessous vous montre comment réaliser ce tutoriel et donne des explications sur les différentes options et les résultats obtenus.