Heat map

Heat map et données OMICS

Dans le cadre de l’exploration des matrices individus/caractères (données OMICS), la heat map permet de détecter d’éventuels groupements de caractères (gènes, protéines, métabolites) s’exprimant de manière similaire et caractérisant des groupements d’individus (échantillons) similaires. Par exemple, un groupement d’échantillons de rein malade peut être caractérisé par une forte expression d’un groupe particulier de gènes, en comparaison avec d’autres échantillons.

Construction d'une heat map dans XLSTAT

Les caractères et les individus sont classifiés de manière indépendante grâce à une classification ascendante hiérarchique centrée sur des distances euclidiennes, et précédée par une classification k-means (nuées dynamiques) si la matrice est très volumineuse.  Les lignes et les colonnes de la matrice de données sont par la suite permutées par rapport à ces deux classifications, ce qui rapproche les lignes similaires les unes des autres et les colonnes similaires les unes des autres. Enfin, une heat map reflétant les données de la matrice est affichée : les valeurs sont remplacées par des intensités de couleur.

Filtrage non spécifique

Avant de lancer les analyses, il est intéressant d’éliminer les caractères dont l’expression est peu variable à travers les individus. Dans les heat maps, le filtrage non-spécifique a deux avantages principaux :

-        Le calcul se focalise moins sur les caractères probablement peu exprimés différentiellement, ce qui réduit du temps de calcul.

-        La lisibilité des graphiques est améliorée.

Deux méthodes sont disponibles dans XLSTAT :

-        L’utilisateur indique un seuil de variabilité (écart interquartile ou écart type). Les caractères dont la variabilité est plus faible que ce seuil sont éliminés en amont des analyses.

-        L’utilisateur spécifie un pourcentage de caractères avec une faible variabilité (écart interquartile ou écart type) à éliminer en amont des analyses.

Résultats

Statistiques descriptives : les tableaux de statistiques descriptives présentent les statistiques simples pour tous les individus. Le nombre d'observations, le nombre de données manquantes, le nombre de données non manquantes, la moyenne, et l'écart-type (non biaisé) sont affichés.

heat map :le dendrogramme des caractères est affiché verticalement (lignes) et le dendrogramme des individus est affiché horizontalement (colonnes). Au milieu, une heat map reflétant les valeurs de données s’affiche.

Les groupements de caractères similaires sont caractérisés par des rectangles de couleur homogène traversant la heat map horizontalement.

Les groupements d’individus similaires sont caractérisés par des rectangles de couleur homogène traversant la heat map verticalement.

Les groupements d’individus similaires caractérisés par des groupements de caractères similaires apparaissent sous forme de rectangles ou carrés homogènes à l’intersection de groupements de caractères et de groupements d’individus.

Bibliographie

Hahne F., Huber W., Gentleman R. and Falcon S. (2008). Bioconductor Case Studies. Springer.



Fonctionnalités corollaires