主成分分析 (PCA)

主成分分析の原理

主成分分析(PCA : Principle Component Analysis)は,最もよく使われる多変量解析手法の1つである.

主成分分析は,初期の次元から情報の最大量(ここで情報量とは,散布図の合計分散を通して測定される)を保持するように,p 個の変数によるp-次元の空間から k-次元の空間(ここで k < p)にオブザベーションを写像する写像手法とみなすことができる.最初の 2 また 3軸に関連づけられた情報が,散布図の合計変動の十分なパーセンテージを表現するなら,オブザベーションは2- 3-次元のグラフで表現することが可能になり,解釈がより簡単になる.

主成分分析の使用

主成分分析には複数の使用法がある:

  • あとで測定する変数の数を制限することを可能にするため,変数間の相関を調査し可視化する;
  • 初期変数の線形結合で非相関因子を得て,それを線形回帰やロジスティック回帰,判別分析などのモデリング手法で使用するため;
  • オブザベーションの均一なまたは特殊なグループを識別するために,オブザベーションを2- または 3-次元空間に可視化する.

主成分分析の入力データ

XLSTAT は,主成分分析アルゴリズムで使用する行列に不複数の選択肢を提供する:

  • Pearson (n) および (n-1)
  • Covariance (n) および (n-1)
  • Spearman
  • Kendall
  • Polychoric

主成分分析の回転

因子上で回転を適用できる.Varimax, Quartimax, Equamax, Parsimax, Quartimin および Oblimin および Promaxを含む複数の手法が利用できる.

XLSTATでの主成分分析の結果

相関/共分散行列

この表は,後の計算で使用するデータを示す.相関のタイプは,ダイアログ・ボックスの "一般" タブで選ばれたオプションによる. 相関では,有意な相関が太字で表示される.

Bartlettの球形検定

Bartlett の球形検定の結果が表示される.どの変数が有意な相関を持っていないかによって,仮説を確認したり棄却したりすることに用いる.

固有値

固有値と対応するグラフ(スクリー・プロット)が表示される. 固有値の数は,非ヌル固有値の数に等しくなる.

因子負荷量と相関

XLSTATは,新しい空間での因子負荷量を表示し,そして初期変数と新しい空間の成分との間の相関を表示する. 相関 は,(相関行列上の)正規化されたPCAの因子負荷量に等しくなる.追加変数が選択された場合,対応する座標と相関が表の最後に表示される.

寄与度

寄与度は,解釈の助けである.軸の構築に高い影響度を持つ変数は,寄与度の高い変数である.

変数の2乗余弦

他の因子手法と同様,写像効果による解釈エラーを避けるために,2乗余弦分析が用いられる.グラフ上で使用された軸に関連づけられた2乗余弦が低いなら,問題のオブザベーションまたは変数の位置は,解釈されるべきでない.

因子得点

新しい空間での因子得点 が表示される.追加のデータが選択された場合,それらは表の最後に表示される.

寄与度

寄与度の表は,主成分の構築でのオブザベーションの寄与度を示す.

オブザベーションの2乗余弦

2乗余弦の表は,オブザベーション・ベクトルと因子軸との間の2乗余弦を表示する.

回転による結果

回転がリクエストされると,まず因子負荷量に適用された回転行列 で回転の結果が表示される.続いて,回転に関与した各軸に関連づけられた修正変動パーセンテージがある.回転後の変数とオブザベーションの座標,寄与度,余弦が,続く表に表示される.

主成分分析でのXLSTATのグラフ

相関チャート

これらのチャートは,成分と初期変数の間の相関を示す.初期変数をベクトルの形式で表示することもできる.

オブザベーション・チャート:

オブザベーション・チャートは,新しい空間でのオブザベーションを表現する.

バイプロット

バイプロットは,新しい空間でオブザベーションと変数を同時に表現する.ここでも,初期変数はベクトル形式でプロットされる.さまざまな種類のバイプロットがある:

  • 相関バイプロット
  • 距離バイプロット
  • 対象バイプロット
  • 係数: 係数を選ぶ.この平方根が変数の座標時に乗じられる.この係数は,バイプロット中の変数ポイントの位置を,より読みやすくするように調整する.1 以外を設定すると,変数ベクトルの長さは,標準偏差(相関バイプロット)や寄与度(距離バイプロット)として解釈できなくなる.