自己組織化マップ

自己組織化マップは、多変量データの次元を削減するために用いられる教師なし機械学習手法である。

自己組織化マップ は1980年代にKohonenが開発した教師なし機械学習の手法である。それらは、多変量データの次元を低次元空間、通常2次元に削減することができる。
オブザベーションは、類似したオブザベーションのノードに集められる。そして、ノードは、2次元のマップ上で、類似したノードが隣り合うようにクラスタされて拡げられる。
各ノードは、それが担うオブザベーションの数に関する情報、それらのオブザベーションのさまざまな入力変数の代表値に関する情報を格納している。これらの値は、変数ごとに1つずつのヒートマップの形式で見ることができる。ヒートマップを見ることにより、ノードのクラスタ・パターンやオブザベーションの背後が明らかになる。ヒートマップを比較して、ノードのクラスタの特徴に関する有用な情報を得ることができる。
XLSTAT-Rで開発されたSOM関数は、Rのkohonenパッケージのsom関数 (Ron Wehrens and Johannes Kruisselbrink)を飛び出す。