Analyse de sentiments

Utilisez cet outil pour déterminer l'opinion d'un document en anglais grâce à la librairie Syuzhet. Disponible dans Excel avec le logiciel XLSTAT.

Description d'une analyse de sentiments

L'analyse de sentiment est le processus d'extraction de l'intention émotionnelle d'un auteur à partir d'un texte (Ted Kwarler, 2017). Elle permet de catégoriser un commentaire, un livre ou un document en général. Un document peut être catégorisé comme une opinion positive, négative ou neutre.

Quand utiliser l'analyse de sentiment ?

L'analyse de sentiment aide les entreprises à comprendre les critiques et les retours des clients, les critiques des produits, à analyser les commentaires sur les sites web (comme les tweets ou posts) ou encore les discussions politiques. En général, l'analyse de sentiment répond à la question : "Comment les personnes (clients) se sentent-ils par rapport à quelque chose ?".

Qu'utilise l'analyse de sentiment ?

L'analyse de sentiment utilise un dictionnaire où les termes ont un score ou sont catégorisés (positif, négatif ou neutre). Chaque dictionnaire utilise sa propre échelle c'est pourquoi XLSTAT propose quatre dictionnaires de sentiment afin d'assigner un sentiment à chaque terme :

  • Analyse de sentiment avec le dictionnaire de Bing : 6789 termes anglais sont labellisés comme "négatif", "neutre" ou "positif" dans le dictionnaire de Bing. Un terme catégorisé comme "négatif" obtient un score de -1, s'il est catégorisé comme "neutre" il obtient un score de 0 enfin il obtient 1 lorsqu'il est catégorisé en "positif".

  • Analyse de sentiment avec le dictionnaire de Syuzhet : 10748 termes anglais sont notés entre -1 et 1 dans le dictionnaire de Syuzhet. Un terme est dit "négatif" lorsque son score est inférieur à 0, et au contraire il est dit "positif" lorsque son score est supérieur à 0.

  • Analyse de sentiment avec le dictionnaire de AFINN : 3382 termes anglais sont notés entre -5 et 5 dans le dictionnaire d'AFINN. Un terme est dit "négatif" lorsque son score est inférieur à 0, et au contraire il est dit "positif" lorsque son score est supérieur à 0.

  • Analyse de sentiment avec le dictionnaire NRC (échelle d'émotions) : ce dictionnaire catégorise 13901 termes anglais avec huit émotions basiques (colère, peur, anticipation, confiance, surprise, tristesse, joie et dégoût) et deux sentiments (négatif ou positif).

En plus d'un dictionnaire de sentiment, l'analyse de sentiment a besoin de documents qui ont subi une tokenisation. XLSTAT propose d'utiliser en amont l'outil d'Extraction de caractéristique afin d'obtenir la matrice documents-termes.

Comment est calculé le score du document ? 

Le score de chaque terme présent dans un document est multiplié par sa fréquence puis les scores sont sommés afin d'obtenir le score du document.

OPTIONS De l'analyse de sentiment DANS XLSTAT

Fréquences des termes : sélectionnez les fréquences des termes dont une colonne correspond aux fréquences d'un terme dans chaque document. Si l'option « Libellés des colonnes » est activée, la première cellule de la sélection doit comprendre un en-tête.

Dictionnaire de sentiment : choisissez parmi quatre dictionnaires de sentiment.

Scores personnalisés : sélectionnez deux colonnes contenant un terme et son score. Si vous utilisez le dictionnaire de Bing, vous devez entrer "negative", "neutral" ou "positive". Cette option permet de définir le sentiment d'un terme indépendamment du dictionnaire choisi précédemment. Si l'option « Libellés des colonnes » est activée, la première cellule de la sélection doit comprendre un en-tête. Pour cette sélection, les données manquantes sont lues comme "neutre" ou zéro. Remarque : non disponible pour le dictionnaire NRC.

Fréquences et scores des termes : activez cette option pour afficher un tableau montrant la fréquence totale et le score de chaque terme inclus dans la sélection de fréquence des termes. Remarque : non disponible pour le dictionnaire NRC.

Fréquences et émotion(s) associée(s) des termes : activez cette option pour afficher un tableau montrant la fréquence totale et les émotions associées à chaque terme inclus dans la sélection de fréquence des termes. Remarque : seulement disponible pour le dictionnaire NRC.

  • Afficher les termes ayant un sentiment seulement : activez cette option pour afficher les termes ayant un sentiment seulement. Les termes avec un sentiment neutre, ce qui signifie que leur score est égal à zéro ou qu'ils ne sont associés à aucune émotion, ne sont pas affichés.

Fréquences globales des émotions : activez cette option pour afficher la fréquence totale de chaque émotion présente dans tous les documents. Remarque : seulement disponible pour le dictionnaire NRC.

Scores des documents : activez cette option pour afficher un tableau montrant le score de chaque document selon le dictionnaire de sentiment choisi dans l'onglet Général. Remarque : non disponible pour le dictionnaire NRC.

  • Trier par score (décroissant) : activez cette option pour trier les scores des documents dans l'ordre décroissant.

Fréquences des émotions par document : activez cette option pour afficher un tableau indiquant la fréquence de chaque émotion dans chaque document. Remarque : seulement disponible pour le dictionnaire NRC.

Interprétation du résultat : activez cette option pour afficher sous les tableaux de résultats, une courte interprétation.

Fréquence des termes : activez cette option pour afficher un diagramme en barre montrant la fréquence totale des termes.

  • Fréquence minimum : entrez la fréquence minimum qu'un terme doit avoir pour être affiché dans le graphique. Nous vous suggérons d'augmenter la fréquence minimum lorsque le nombre de termes augmente.

Scores des termes : activez cette option pour afficher un diagramme en barre montrant les scores des termes.

Score des documents : activez cette option pour afficher un diagramme en barre montrant les scores des documents. Si l'option Trier par score (décroissant) est activée alors le diagramme est aussi trié.

Distribution des scores des documents : activez cette option pour afficher un histogramme montrant la distribution des scores des documents.

Fréquences globales des émotions : activez cette option pour afficher un diagramme en barre montrant la fréquence totale des émotions. Remarque : seulement disponible pour le dictionnaire NRC.

Nuage de mots basé sur les sentiments : activez cette option pour afficher un nuage de mot où les termes sont colorés selon leur sentiment (positif, négatif ou les émotions associées).

  • Termes maximums : entrez le nombre maximum de termes à inclure dans le nuage de mot basé sur les sentiments.

Interprétation du résultat : activez cette option pour afficher sous les graphiques une courte interprétation.

RÉSULTATS D'une analyse de sentiments DANS XLSTAT

Résultats associés aux scores des documents : le tableau et le graphique associés aux scores des documents sont affichés pour donner un aperçu du sentiment de chaque document selon l'échelle du dictionnaire de sentiment utilisé. Si l'option Trier par score (décroissant) n'est pas activée, vous pouvez voir l'évolution du score des documents, spécialement s'ils sont entrés dans un ordre chronologique.

Résultats associés aux documents et les émotions associées : avec l'échelle des émotions (NRC), un tableau est affiché pour montrer les fréquences de chaque émotion dans un document. Ce tableau peut être complété avec les scores des documents obtenus avec un autre dictionnaire de sentiment, ce qui permet de mettre des mots naturels sur le sentiment ou l'intensité d'une opinion présente dans un document.

Résultat associé à la distribution des scores des documents : l'histogramme affiché aide à connaître la fréquence des scores. Dans le cas où les scores sont centrés en 0, cela signifie que les documents ont en moyenne une majorité de mots neutres. D'un autre côté, si les scores sont centrés en une valeur supérieure (resp. inférieure) à 0, cela signifie que les documents ont en moyenne au moins un mot positif (resp. négatif).

Résultats associés aux fréquences des termes : le tableau et graphique associés aux fréquences des termes sont affichés pour donner un aperçu de la fréquence totale des termes, en d'autres termes cela montre le nombre d'occurrences d'un terme parmi tous les documents.

Résultats associés aux scores des termes : le tableau et graphique associés aux scores des termes sont affichés pour donner un aperçu du sentiment de chaque terme selon l'échelle du dictionnaire de sentiment. Avec l'échelle d'émotions, un terme peut être associé à zéro, un ou plusieurs termes. Les termes neutres ont une cellule vide dans la colonne "Score". Les scores personnalisés sont affichés en gras.

ternary diagramneural network diagram

analysez vos données avec xlstat

essayez gratuitement pendant 14 jours