Calculer une corrélation de Spearman et tester si elle est significative ou non

Jeu de données pour Tests de corrélation XLS59.5 Ko

Vidéo du tutoriel
  • Pro Logiciel de base de la suite XLSTAT

  • Pré-requis système

    • Windows:
      • Versions : 9x/Me/NT/2000/XP/Vista/Win 7
      • Excel : 97 et supérieures
      • Processeur : 32 ou 64 bits
      • Disque dur : 150 Mo
    • Mac OS X:
      • OS : OS X
      • Excel : X, 2004 et 2011
      • Disque dur : 150 Mo

Avantages

  • Pratique et simple d'utilisation
    Pratique et simple d'utilisation XLSTAT est parfaitement intégré à Microsoft Excel qui est le tableur le plus populaire au monde. Grâce à cette intégration, et au suivi de la même philosophie qu'Excel, l'utilisation de XLSTAT est aisée. Le logiciel est accessible dans un onglet dédié qui contient le menu de chaque module. Les analyses disponibles sont regroupées en menus fonctionnels. Les boîtes de dialogues sont pratiques et leur paramétrage est simple.
  • Partage aisé des données et résultats
    Partage aisé des données et résultats Un des plus grands avantages de XLSTAT est le fait que les données et résultats peuvent être partagés sans contrainte. En effet, données et résultats sont stockés dans Microsoft Excel et donc accessibles à tous. Il n'est pas nécessaire pour le receveur d'avoir une licence XLSTAT ou tout autre visionneur additionnel. Ceci facilite votre travail d'équipe et le rend plus économique. Enfin, les résultats sont transposables dans les autres logiciels de Microsoft Office dont PowerPoint ce qui vous permet de créer des présentations avec d'excellents graphiques en quelques minutes.
  • Modulaire
    Modulaire XLSTAT est un produit modulaire articulé autour de XLSTAT-Pro qui est le logiciel de base de XLSTAT. XLSTAT-Pro inclut déjà toutes les fonctionnalités les plus courantes en statistiques et analyses de données multivariées. Des fonctions plus avancées sont aussi disponibles dans des modules additionnels qui répondent à des demandes plus spécifiques. Ainsi, vous pouvez adapter le logiciel à vos propres besoins ce qui le rend plus rentable.
  • Didactique
    Didactique Les résultats de XLSTAT sont affichés pour chaque analyse et sont toujours disponibles pour une navigation plus simple. De plus, des informations utiles sont associées aux résultats afin de faciliter votre interprétation.
  • A un juste prix
    A un juste prix XLSTAT est un logiciel de statistique et d'analyse de données complet et modulaire qui s'adapte à tous les besoins analytiques d'une organisation. Son prix est très raisonnable ce qui vous permet de le rentabiliser presque immédiatement. Toutes les licences XLSTAT incluent un support et une assistance de première qualité.
  • Accessible en de nombreuses langues
    Accessible en de nombreuses langues Nous nous sommes assurés que XLSTAT puisse être accessible au plus grand nombre en distribuant le programme dans de nombreuses langues dont le français, l'anglais, l'allemand, l'espagnol, l'italien, le portugais, le polonais, le chinois et le japonais.
  • Automatisable et personnalisable
    Automatisable et personnalisable La plupart des fonctions disponibles dans XLSTAT peuvent être directement appelées depuis l'application Visual Basic de Microsoft Excel. Elles peuvent être intégrées à vos routines pour répondre aux besoins d'une application particulière. Ajouter des tableaux de résultats, des graphiques, ou modifier l'existant est simplifié. De plus, XLSTAT inclut des outils permettant de sauvegarder ou de recharger des paramètres automatiquement, mais aussi de générer du code VBA. Ceci permet de reproduire vos analyses depuis l'éditeur VBA. Cette automatisation des analyses routinières vous fera gagner du temps.

Jeu de données pour calculer une corrélation de Spearman et tester sa significativité

Une feuille Excel contenant les données et les résultats de cet exemple peut être téléchargée en cliquant ici.

Les données utilisées dans cet exemple correspondent à une étude lors de laquelle un type de chips a été évalué par 100 consommateurs. Chaque consommateur a donné son avis sur l'échelle allant de 1 à 5 pour quatre attributs (salé, sucré, acidité, croustillant) - 1 correspond à "très peu", et 5 à "très", puis a indiqué sa préférence sur une échelle de 1 à 10. Notre but est d'évaluer les corrélations entre les quatre attributs et la préférence.

Paramétrer le calcul d'une corrélation de Spearman et tester sa significativité

Les corrélations sont calculées dans plusieurs fonctions de XLSTAT. Cependant deux fonctions sont y consacrées : la fonction Description des données / Matrices de similarité/dissimilarité, et la fonction Tests de Corrélation/Association / Tests de corrélation.

Dans ce tutoriel, nous utilisons l'outil Tests de Corrélation/Association / Tests de corrélation.

Une fois XLSTAT lancé, choisissez la commande "Tests de Corrélation/Association/Tests de corrélation" ou cliquez sur le bouton correspondant de la barre d'outils "Tests de Corrélation".

barcorrspf.gif

Une fois le bouton cliqué, la boîte de dialogue apparaît. On peut alors sélectionner les données dans le champs Tableau observations/variables.

La première ligne du tableau comprenant des en-têtes, nous laissons l'option Libellés des variables activée.

Comme les données ne sont pas continues mais ordinales, nous choisissons d'utiliser le coefficient de corrélation de Spearman au lieu du coefficient de corrélation de Pearson qui est utilisé pour les données continues.

corrsp1f.gif

Dans l'onglet Sorties, nous choisissons les résultats que nous voulons voir affichés.

corrsp2f.gif

Dans l'onglet Graphiques sont sélectionnées les cartes de corrélations que nous voulons afficher.

corrsp3f.gif

Une fois que vous avez cliqué sur le bouton OK, les calculs commencent et les résultats sont affichés.

Interpréter les résultats du calcul d'une corrélation de Spearman et du test sur sa significativité

Après les statistiques descriptives concernant les différentes variables sélectionnées, XLSTAT affiche la matrice des corrélations de Spearman.

corrsp4f.gif

Les corrélations entre les préférences et les attributs sont la plupart du temps proches de 0. La corrélation entre la préférence et l'attribut "Croustillant" est un peu plus haute avec 0.466. Ceci suggère que le seul critère pour lequel il les consommateurs aiment plus si il est plus élevé, est le caractère croustillant. Pour les autres critères il est probable qu'il existe un niveau optimal intermédiaire, au-delà duquel les consommateurs font par de leur insatisfaction.

Les valeurs affichées en gras sont significatives à un niveau de signification de 0.05. Cela signifie que le risque de se tromper en rejetant l'hypothèse nulle selon laquelle les corrélations ne sont pas différentes de 0 est inférieur à 5%. Les p-values correspondantes (le risque estimé) sont affichées dans le tableau suivant. Plus la p-valeur est faible, plus la corrélation est significativement différente de 0. Remarque : le p-values sont calculées sur la base d'un test bilatéral.

corrsp5f.gif

XLSTAT est parmi les quelques logiciels produisant des cartes de corrélation. Les cartes de corrélation permettent de voir des structures dans les corrélations. Cela a certes plus d'intérêt lorsqu'il y a beaucoup de variables, mais nous profitons de cet exemple pour montrer expliquer comment ces cartes peuvent être utilisées.

La première représentation s'appuie sur une échelle de couleurs allant du bleu au rouge (échelle froid-chaud) pour l'affichage des corrélations. La couleur bleu correspond à une corrélation proche de -1 et la couleur rouge correspond à une corrélation proche de 1. Le vert correspond à une corrélation proche de 0.

corrsp6f.gif

La deuxième carte de corrélation utilise les couleurs noire et blanche pour identifier respectivement les corrélations positives et négatives. La diagonale est afficher en gris.

corrsp7f.gif

La troisième carte de corrélation utilise des motifs pour figurer le signe et l'intensité des corrélations : - les lignes partant du bas à gauche vers le haut à droite correspondent aux corrélations positives, et vice-versa ; - plus les lignes sont serrées, plus la corrélation est proche de 0.

corrsp8f.gif

Remarque : si vous voulez simplement calculer le coefficient de corrélation entre deux échantillons, vous pouvez utiliser directement dans la feuille Excel la fonction XLSTAT_Spearman. Exemple : sur la feuille « Data », entrez dans la cellule G2, « =XLSTAT_Spearman (A2 : A101, B2 : B101) ».