Caractérisation de variables

Utilisez cet outil pour caractériser des variables quantitatives ou qualititaves nommés « éléments à caractériser », en explorant les liaisons qu'ils entretiennent avec des éléments caractérisants. Disponible dans Excel avec le logiciel XLSTAT.

Qu’est-ce que la Caractérisation de variables ?

Utilisez cet outil pour caractériser des éléments (variables quantitatives, qualitatives ou modalités de variables qualitatives) nommés « éléments à caractériser », en explorant les liaisons qu'ils entretiennent avec des éléments caractérisants (variables quantitatives, qualitatives ou modalités de variables qualitatives). Pour cela différents tests statistiques (paramétriques ou non paramétriques) sont utilisés.

Les différentes caractérisations de variables proposées dans cet outil sont :

1) Caractérisation d'une variable quantitative :

i) par d'autres variables quantitatives :

La caractérisation d'une variable quantitative par d'autres variables quantitatives s'effectue par l'intermédiaire du coefficient de corrélation. Pour chaque variable quantitative caractérisante, on teste si celui-ci est significativement différent de 0 via le test de corrélation de Pearson (paramétrique) ou Spearman (non paramétrique). Plus le coefficient de corrélation est significativement différent de 0, plus les 2 variables (quantitatives) sont liées.

ii) par des variables qualitatives :

La caractérisation d'une variable quantitative par des variables qualitatives s'effectue à l'aide de tests statistiques paramétriques ou non paramétriques. Si la p-value du test est inférieure à un seuil choisi on rejettera l'hypothèse d'indépendance entre les deux variables. Dans le cas paramétrique le test utilisé est le test de Fisher (comme en ANOVA). Dans le cas non paramétrique si la variable qualitative possède k=2 modalités, on utilise le test de Mann-Whitney, si la variable qualitative possède plus de 2 modalités, on utilise le test de Kruskal-Wallis.

iii) par des modalités d'une variable qualitative :

La caractérisation d'une variable quantitative par des modalités s'effectue par l'intermédiaire d'un test de comparaison de moyennes. Pour chaque modalité, on teste si la moyenne de la variable quantitative à caractériser au sein du groupe dont les individus possèdent cette modalité est significativement différente de la moyenne de la variable quantitative à caractériser dans tout l'échantillon. La caractérisation d'une variable quantitative par des modalités s'effectue à l'aide d'un indicateur appelé valeur test (Lebart, 2000). On calcule ensuite une p-value associée à cette valeur test, plus la p-value est proche de 0, plus la moyenne de la variable XX sur la modalité kk est différente de la moyenne générale.

2) Caractérisation d'une variable qualitative (à k modalités) :

i) par des variables quantitatives :

La caractérisation d'une variable qualitative par des variables quantitatives s'effectue à l'aide de tests statistiques paramétriques ou non paramétriques. Si la p-value du test est inférieure à un seuil choisi on rejettera l'hypothèse d'indépendance entre les deux variables. Dans le cas paramétrique le test utilisé est le test de Fisher (comme en ANOVA). Dans le cas non paramétrique si la variable qualitative possède k=2 modalités, on utilise le test de Mann-Whitney, si la variable qualitative possède plus de 2 modalités, on utilise le test de Kruskal-Wallis.

ii) par d'autres variables qualitatives :

La caractérisation d'une variable qualitative par d'autres variables qualitatives s'effectue à l'aide d'un test d'indépendance. Pour chaque variable qualitative caractérisante, on teste donc l'indépendance avec la variable qualitative à caractériser via le test d'indépendance du Chi² (paramétrique) ou le test exact de Fisher (non paramétrique).

3) Caractérisation d'une modalité d'une variable qualitative :

i) par des variables quantitatives :

La caractérisation d'une modalité par des variables quantitatives s'effectue à l'aide de la valeur test comme expliqué en 1-iii.

ii) par d'autres modalités :

La caractérisation d'une modalité par d'autres modalités s'effectue à l'aide de la valeur test pour les variables qualitatives (Lebart, 2000) et de sa p-value associée. Une modalité est considérée comme caractéristique de la classe si son abondance dans la classe est jugée significativement supérieure à ce qu'on peut attendre compte tenu de sa présence dans la population. en notant njk le nombre d'individu ayant la modalité j parmi les nk individus de la classe k, nj le nombre d'individus ayant la modalité j et n l'effectif total, l'abondance de la modalité jj est définie en comparant son pourcentage dans la kème classe nkj /nkà son pourcentage dans la population n/ n.

Options de la fonction Caractérisation de variables dans XLSTAT

Filtrer les éléments caractérisants : Activez cette option si vous voulez filter les éléments caractérisants à afficher. Plusieurs options de filtrage sont disponibles, en fonction de l'option choisie, vous devez choisir un seuil pour les p-values (ou valeurs test) à afficher ou bien un nombre pp d'éléments caractérisants à afficher.

Trier les éléments caractérisants : Activez cette option si vous voulez trier l'affichage des éléments caractérisants en fonction des p-values.

Niveau de signification : Entrez dans la cellule associée le niveau de signification que vous voulez.

Tests paramétrique : Activez cette option si vous souhaitez qu'un test paramétrique soit mis en œuvre.

Tests non naramétriques : Activez cette option si vous souhaitez qu'un test non paramétrique soit mis en œuvre.

Résultats de la fonction Caractérisation de variables dans XLSTAT

Statistiques descriptives : le tableau de statistiques descriptives présente pour toutes les variables sélectionnées des statistiques simples.

En fonction des éléments à caractériser et des éléments caractérisants, le tableau de résultats affiché sera différent. Cependant quel que soit le cas, la p-value sera toujours affichée.

Si vous avez sélectionné l'option Graphique des p-values un graphique de type diagramme en bâtons représentant la valeur des p-values est également affiché en dessous de chaque tableau.