主成分回帰 (PCR)

pcr-biplot-plot.png

主成分回帰の原理

主成分回帰(PCR :Principal Components Regression)は,3つのステップに分解できる回帰手法である:

  1. 最初のステップは,説明変数の表で主成分分析(PCA)を実行することである,,
  2. そして,選択された成分の上で,線形回帰とも呼ばれる最小2乗回帰(OLS 回帰)を実行する,
  3. 最後に,入力変数に対応するモデルのパラメータを計算する.

主成分回帰モデル

PCA は,変数によって記述されるn 個のオブザベーションを持つ表X を,q 個の成分で記述されるn 個のスコアを持つ表S に変換することを可能にする.ここで qp 以下で, (S’S) は反転可能である.変数Y に最も相関するr 個の成分のみがOLS 回帰ステップのために保持されるように,成分の上でさらなる選択が適用される.これにより,表 R が得られる.

Y と R の表の上でOLS 回帰が実行される.回帰から得られたパラメータによる解釈問題を避けるために, XLSTAT は,入力変数に対応するパラメータと信頼区間を得るために,結果を元の空間に変換して戻す.

PCR の結果: 相関チャートとオブザベーション・チャートとバイプロット

PCR はPCA上で構築されるので,伝統的な回帰を超える PCR の大きな利点は,データ構造を記述するグラフが利用可能なことである.相関および負荷量プロットのおかで,変数間の関係性を調査することが簡単である.それは,説明変数間および説明変数と従属変数の間の関係性である.得点プロットは, 標本の近接およびデータ集合の構造に関する情報を提供する.バイプロットは,これらのすべての情報を1つのグラフにまとめる.

主成分回帰による予測

主成分回帰は,予測モデルを構築するためにも使用できる. XLSTAT は,新しい標本の値を予測することを可能にする.

ternary diagramneural network diagram

Excelで動作する統計解析ソフトウェア。

14日間無償トライアルあり。