Analyse de données de préférences

Utilisez cette fonction pour analyser des données de préférences rapidement et efficacement. Disponible dans Excel avec le logiciel XLSTAT.

Description de l'analyse de données de préférences 

Les données de préférences (dites aussi données hédoniques ou données de liking) font parties des plus collectées en analyse sensorielle. Elles consistent simplement à demander aux différents sujets/consommateurs de donner une note aux produits, avec généralement une échelle prédéfinie sur laquelle ces derniers doivent répondre.

Si le principe des données de préférences est très simple, l'analyse de ces données est assez riche. La première étape est une description des données de liking, avec leur distribution par produit, les différences entre les sessions, la visualisation des données... Une seconde étape, plus poussée, consiste à réaliser des tests de comparaisons entre les produits ainsi qu'à construire une cartographie interne des préférences. La dernière étape est basée sur l'étude des accords entre les sujets avec la comparaison de groupes de sujets ou encore la classification de ces derniers.

Paramétrage de l'analyse de données de préférences dans XLSTAT

Données de préférences : sélectionnez les données correspondant aux différents sujets. Si la première ligne de la sélection comprend des en-têtes, l'option « Libellés des variables » en format vertical ou « Libellés des sujets » en format horizontal doit être activée. Si vous êtes en format vertical et que vous sélectionnez plusieurs colonnes, ces dernières seront moyennées.

Si le format est horizontal :

Libellés des produits : activez cette option si vous voulez utiliser des libellés des produits pour l'affichage des résultats. Si l'option « Libellés des sujets » est activée, la première cellule de la sélection doit comprendre un en-tête. Si vous n'activez pas cette option, des libellés seront automatiquement créés.

Si le format est vertical :

Produits : sélectionnez les produits correspondants aux lignes des données de préférences. Si l'option « Libellés des variables » est activée, la première cellule de la sélection doit comprendre un en-tête.

Sujets : sélectionnez les sujets correspondants aux lignes des données de préférences. Si l'option « Libellés des variables » est activée, la première cellule de la sélection doit comprendre un en-tête.

Sessions : sélectionnez les sessions correspondants aux lignes des données de préférences. Si l'option « Libellés des variables » est activée, la première cellule de la sélection doit comprendre un en-tête.

Options de l'analyse de données de préférences dans XLSTAT

Centrer les sujets : Activez cette option pour que les sujets soient centrés (moyenne de chaque sujet ramenée à 0).

Réduire les sujets : Activez cette option pour que les sujets soient réduits (variance de chaque sujet ramenée à 1).

Intervalle de confiance (%) : entrez l'étendue en pourcentage de l'intervalle de confiance à utiliser pour les différents tests, et pour le calcul des intervalles de confiance. Valeur par défaut : 95.

Classification des sujets : Activez cette option pour réaliser une classification des sujets (détails section "Classification des sujets"). Dans un second temps, déterminez si vous voulez que XLSTAT définisse automatiquement une troncature, et donc le nombre de classes à retenir, ou si vous voulez définir vous-même le nombre de classes à créer.

Résultats de l'analyse de données de préférences dans XLSTAT

Différences entre les sessions : le tableau des différences entre les sessions (écarts-types si vous avez plus de deux sessions) est affiché. Il permet de voir les éventuelles erreurs des sujets ou de saisie (notamment si une valeur est élevée).

Moyenne des différences entre sessions pour chaque produit : le tableau des moyennes des différences entre les sessions par produit est affiché suivi du graphique associé. Ces résultats permettent de déterminer si certains produits ont donné lieu à des écarts entre les sessions.

Moyenne des différences entre sessions pour chaque sujet : le tableau des moyennes des différences entre les sessions par sujet est affiché suivi du graphique associé. Ces résultats permettent de déterminer si certains sujets ont donné lieu à des écarts entre les sessions.

Données au format horizontal : les données au format horizontal sont affichées. Ces dernières sont sans données manquantes (elles sont estimées par l'option choisie). Ces données vous permettent de choisir vous-même certaines options en les rentrant dans une cartographie interne des préférences, une classification ascendante hiérarchique...

Si vous avez sélectionné des groupes, les résultats suivants seront affichés groupe par groupe. De plus, si vous avez sélectionné l'option "Centrer les sujets", certains résultats seront donnés avant et après centrage des sujets.

Moyennes des produits : le tableau des moyennes des produits ainsi que le diagramme en bâtons associé sont affichés. Ce résultat permet de déterminer à quel point les produits sont appréciés.

Box plots des données de préférences par produit : les box plots des données de préférences pour chaque produit sont affichés. Ces derniers permettent de visualiser la dispersion des données de préférences au sein d'un produit et de comparer les dispersions entre les produits.

Visualisation des données : un graphique permettant de visualiser directement les données des différents sujets est affiché. Vous pouvez choisir le sujet à mettre en lumière afin de vérifier ses données ou de le comparer aux autres.

ANOVA : ce tableau permet d'évaluer le pouvoir explicatif du facteur produit. Le pouvoir explicatif est évalué en comparant l'ajustement (au sens des moindres carrés) du modèle final avec l'ajustement du modèle rudimentaire composé d'une constante égale à la moyenne de la variable dépendante (Données de préférences). En d'autres termes, si la p-value est significative, nous rejetons l'hypothèse stipulant que toutes les moyennes des produits sont égales.

Graphiques des moyennes : ces graphiques permettent de comparer visuellement les moyennes des produits avec les intervalles de confiance associés.

Produit/Tukey (HSD) : les résultats des tests de comparaisons multiples des moyennes des produits sont affichés, afin de déterminer les produits différents les uns des autres ainsi que ceux similaires. Les groupes des produits sont ensuite donnés.

Cartographie interne des préférences : les résultats de la cartographie interne des préférences sont affichés. Ils démarrent par les valeurs propres des facteurs ainsi que les pourcentages d'inertie que chacun représente, avant d'afficher les coordonnées des sujets et les coordonnées des produits. Toutes ces coordonnées sont également affichées dans des graphiques. Remarque : si un sujet n'a pas une qualité de représentation supérieure à 50% (somme des cosinus carrés du sujet sur les axes > 0.5), alors il n'est pas affiché.

Différences pour chaque produit : les résultats de l'ANOVA, des tests de comparaisons multiples entre classes et les graphiques associés sont affichés pour chacun des produits.

Classification des sujets : les résultats de la classification des sujets sont affichés. Ils se composent tout d'abord du dendrogramme obtenu, éventuellement du dendrogramme tronqué si celui-ci a été demandé, et des classes des sujets construites par la coupure du dendrogramme.

Exemple d'une analyse de données de préférences dans XLSTAT

Un exemple d'utilisation d'analyse de données de préférences est disponible sur le site Internet d'Addinsoft.

ternary diagramneural network diagram

analysez vos données avec xlstat

essayez gratuitement pendant 14 jours