主座標分析

principal-coordinates-analysis-eigenvectors.png

主座標分析の原理

主座標分析(Principal Coordinate Analysis:しばしば PCoAとも呼ばれる)は, p 個の要素(個体,変数,オブジェクト, …)の間の類似行列をグラフィカルに表現することを目的としている.

このアルゴリズムは,3つのステップに分けられる:

  1. p 個の要素に関する距離行列を計算
  2. 行と列による行列の中心化
  3. 中心化された距離行列の固有値分解

再尺度化された固有ベクトルが,1, 2, p-1 次元による空間でp個のオブジェクトを表示するために使用できる主座標に対応する.

 PCA (主成分分析) と同様,固有値は,退縮された空間で表現されている合計変動のパーセンテージの観点から解釈できる.

XLSTATでの主座標分析の結果

  • デルタ1 行列: この行列は,固有値分解の計算に使用されたGowerのD1行列である.
  • 固有値およびイナーシャのパーセンテージ: この表は,固有値と対応するイナーシャのパーセンテージを表示する.
  • 主座標: この表は,グラフ間の近接が解釈できるグラフを作成するために使用されているオブジェクトの主座標を表示する.
  • 寄与率: この表は,あるオブジェクトが任意の軸にどれだけ寄与するかを評価することを助ける寄与率を表示する.
  • cos2乗: この表は,あるオブジェクトが任意の軸にどれだけ接近しているかを評価することを助ける平方余弦を表示する.

主座標分析と主成分分析

PCA と主座標分析は,わずかの次元を持つ空間でオブザベーションも表現できることでよく似ているが,後者は寄与される変動の観点から最適である.オブザベーション間のユークリッド距離の行列(非バイアス標準偏差を用いた列の標準化の後に計算された)に適用されたPCoAは,相関係数に基づくPCA と同じ結果を導く. PCoA で得られた固有値は,PCAで得られたそれの(p-1)倍に等しい.

主座標分析と多次元尺度法

主座標分析とMDS (Multidimensional Scaling:多次元尺度法) は,近接行列を持つオブジェクトを表現するという共通の目的を共有持っている.

MDSは,主座標分析と比較して 2つの欠点がある:

  • アルゴリズムがとても複雑で実行が遅い.
  • MDS で得られた軸は,変動の観点から解釈できない.

MDSは,主座標分析と比較して 2つの利点がある:

  • アルゴリズムは,近接行列に欠損値があることを許す.
  • MDS の非計量バージョンは,距離の順位のみが重要な行列をより簡単に明瞭に取り扱う方法を提供する.
ternary diagramneural network diagram

Excelで動作する統計解析ソフトウェア。

14日間無償トライアルあり。