偏最小2乗回帰 (PLS)

偏最小2乗回帰(PLS : Partial Least Squares regression )は,速く,効率的で,共分散に基づく基準に最適である.これは,変数の数が多く,説明変数が相関している場合に推奨される.

最小2乗回帰の原理

PLS 回帰のアイデアは,p 個の変数で記述されるn 個のオブザベーションを持つ表から開始して, PLS1 および PLS2アルゴリズムにより, h 個の成分( h<p)の集合を作成することである.

いくつかのプログラムでは,PLS1 と PLS2を区別している.PLS1 は,従属変数が1つだけの場合に対応する.PLS2 は,複数の従属変数がある場合に対応する.XLSTAT で使用するアルゴリズムは, PLS1 を 単にPLS2の特殊ケースとして扱う.

偏最小2乗回帰モデルの式

 OLS および PCR 法の場合,モデルが複数の従属変数について計算されることが必要な場合,モデルの計算は,単に, 従属変数 の表Yの列でループになっているだけである.PLS回帰の場合は,Y の共分散構造も計算に反映される.

PLS 回帰モデルの式は次のように書かれる:

Y = ThC’h + Eh = XWh*C’h + Eh = XWh (P’hWh)-1 C’h + Eh

ここで Y は従属変数の行列, X は説明変数の行列, Th, Ch, W*h , Wh および Ph, は,PLS アルゴリズムによって生成された行列, Eh は残差の行列である.

X上のYの回帰係数の行列Bは, PLS 回帰アルゴリズムで生成されたh 個の成分を持ち,次次式で与えられる:

B = Wh(P’hWh)-1C’h

注意: PLS 回帰は, OLS および PCR が行うのと同様に,線形モデルを導く.

PLS 回帰の結果: 相関, オブザベーション・チャートおよびバイプロット

伝統的な回帰を超える PLS 回帰の大きな利点は,データ構造を記述するグラフが利用可能なことである.相関プロットと負荷量プロットのおかげで,変数間の関係性を調査することが簡単である.それは説明変数間または従属変数間,さらに説明変数と従属変数の間の関係性である. 得点プロットは,標本の近接とデータ集合の構造に関する情報を提供する.バイプロットは,これらのすべての情報を1つのグラフにまとめる.

偏最小2乗回帰による予測

PLS 回帰は,予測モデルを構築するためにも使用される. XLSTAT は,新しい標本の値を予測することを可能にする.

 PLS 回帰に関する一般的注記

PCA(PCRでの) または PLS 回帰から得られる成分の数が,説明変数の数と等しければ,この3つの手法- 偏最小2乗回帰,主成分回帰,最小2乗回帰- は同じ結果を提供する.

PLS 回帰から得られる成分は,可能な限りYを説明するように構築されるが,一方, PCRの成分は,可能な限りXを説明するために構築される. XLSTAT は, Yと最も相関している成分の選択を可能にすることにより,PCRのこの欠点を部分的に補償することを可能にしている.