ヒートマップ

ヒートマップとOMICS データ

OMICSの枠組みで、個体/特性のデータ行列を探索する際、相関する特性(すなわち、遺伝子、タンパク質、代謝産物)がどのように個体(すなわち、標本)に対応するかを検討することは興味深い。 たとえば、病気の腎組織の標本のクラスタは、他の標本と比較して、ある遺伝子のグループの発現によって特徴づけられるかもしれない。 XLSTATのヒートマップ・ツールは、 そのような探索の実行を可能にする。

XLSTATでの動作の仕方

行列のサイズによってはk-meansアルゴリズムを先行させ、ユークリッド距離に基づく主要な階層クラスタリングを用いて、特性と個体がそれぞれ独立にクラスタされます。データ行列の行と列が、対応するクラスタリングによって並べ替えられ、お互いに類似した列、お互いに類似した行をもたらします。 そして、ヒートマップが表示されて、並べ替えられた行列内のデータを反映します(データの値は、対応する色濃度に置き換えられます)。

非特異性フィルタリング

分析を始める前に、個体間での変動が少ない特性を除去することが好ましい。ヒートマップ分析での非特異性フィルタリングには、主に2つの利点がある:

-       あまり発現に差のない特性に焦点を当てない計算をすることで、計算時間を短縮できる。

-       病気の腎細胞標本のクラスタを識別できるようにして、色濃度によるヒートマップの可読性を改善する。

 XLSTATでは2つの手法が利用できる:

-        ユーザーが変動しきい値(四分位範囲または標準偏差)を指定して、低い変動の特性を分析に先立って除去する。

-        ユーザーがパーセンテージを指定して、低い変動(四分位範囲または標準偏差)を持つ特性を分析に先立って除去する。

結果

要約統計: 記述統計の表は、すべての個体に関する簡単な統計値を示す。オブザベーションの数、欠損値の数、非欠損値の数、平均、標準偏差が表示される。

ヒートマップ: 特徴のデンドログラムが垂直(行)に評され、個体のデンドログラムが水平(列)に表示される。ヒートマップがそのチャートに追加されて、データの値を反映する。

類似して発現する特性は、マップ上で均質な色の横長の長方形になる。

類似した個体は、マップ上で均質な色の縦長の長方形になる。

類似した発現の特性のクラスタで特徴づけられる類似した個体のクラスタは、マップ内で特性クラスタと個体クラスタの間の交差するところで、均質な色の長方形または正方形を検討することで検出できる。

参考文献

Hahne F., Huber W., Gentleman R. and Falcon S. (2008). Bioconductor Case Studies. Springer.