一般化プロクラステス分析 (GPA)

generalized-procrustes-analysis-biplot.png

一般化プロクラステス分析を使用するとき

一般化プロクラステス分析は,官能データ分析においてスケール効果を低減して,合意的コンフィグレーションを得るために,プリファレンス・マッピング の前に使用される.これは,製品を記述するためにさまざまな専門家が使用する用語の間の近接を比較することもできる.

一般化プロクラステス分析の原理

p 次元(または属性/変数/基準/ディスクリプタ)でのn 個のオブジェクト(個人/ケース/製品)の記述に対応する行列n x pでコンフィギュレーションを定義する.

我々は,m個のコンフィギュレーション(以下コンフィグ)から計算された平均を合意コンフィグ(consensus configuration)と名づける.プロクラステス分析は,コンフィグに変換(拡大縮小,平行移動,回転,反転)を適用して,m個のコンフィグの合意コンフィグ(各変換後に更新されている)への距離を低減することを可能にする繰り返し手法である

3 つの基準により4 種類のチーズを評価する5 人の専門家の事例を考えよう.評点は,1 から10で行う.ある専門家は彼の表記では,下の方の評点にシフトする傾向があり,また別の専門家は極端な評点を使用する大胆さはなく,平均的な評点を与える傾向がある,ということを容易に考えることができる.平均的なコンフィグで作業をすることは,間違った解釈につながる可能性がある.1番目の専門家の評点を平行移動させることが必要か,もしくは2番目の専門家の評点を再尺度化すると,他の専門家の評点に近くなるかもしれいない,ということが容易にわかる.

合意コンフィグが得られると,2次元または3次元で最適な可視化を可能にするために,合意コンフィグでの主成分分析(PCA :Principal Components Analysis)を実行することが可能である.

2つの場合がある:

  1. p 次元の数と名称がm 個のコンフィグと同一である場合,伝統的なプロファイルでの官能分析を意味する.
  2. 次元のp の数とその名称が,1個のコンフィグからその他に変化するなら,自由プロファイルでの官能分析を意味し,そしてデータは,サイズ n x p(k), k=1,2, …, mのm個の一連の行列でのみ表現される.

XLSTATでの一般化プロクラステス分析のアルゴリズム

XLSTATは,2つの主要な利用可能なアルゴリズムを選択できる唯一の製品である: John Gower (1975)によって開かれた業績に基づくものと,もう1つはJacques Commandeur (1991)の論文で説明されているものである.どちらのアルゴリズムが(最小2乗の意味で)最良に機能するかはデータ集合によるが,Commandeurアルゴリズムが,唯一,欠損データを考慮できるものである;; ここでいう欠損値は,任意のコンフィグと任意のオブザベーションまたは行で,その値がコンフィグのすべての次元について記録されなかったということである. 後者のケースは,審査員の1人がある製品を評価しなかった場合に,官能データ分析で起こることがある.

XLSTATでの一般化プロクラステス分析の結果

PANOVA表

線形モデルの分散分析表の形式からヒントを得て,この表は,各変換の分散の進展への相対寄与度 を計算することを可能にします.この表では,変換の前と後の残差の分散,再尺度化,回転および平行移動ステップの分散の進展への寄与度が表示されます.Fisherの F 統計量の計算は,変換の相対寄与度を比較することを可能にします.対応する確率は,寄与度が有意であるか否かを決定することを可能にします.

残差

オブジェクトでの残差: この表と対応する棒グラフは,オブジェクトごとの残差分散の分布を可視化することを可能する.したがって,これはどのオブジェクでGPA があまり有効でなかったか,言い換えると,どのオブジェクトがコンセンサス・コンフィグから遠いかを識別することが可能である.

コンフィグでの残差: この表と対応する棒グラフは,コンフィグごとの残差分散の分布を可視化することを可能にする.したがって,これはどのコンフィグでGPA があまり有効でなかったか,言い換えると,どのコンフィグがコンセンサス・コンフィグから遠いかを識別することが可能である.

各コンフィグでの尺度係数

表またはプロットのいずれかに提示されている各コンフィグの尺度係数は,コンフィグに適用された尺度係数を比較することを可能にする.これは専門家がどのように評価尺度を使用しているかを理解するために,官能分析で使用される.

合意検定の結果

この表は,実行された並べ替えの数,コンセンサス・コンフィグによって説明される元の分散の比率に対応するRc の値,および並べ替えから得られたRc の分布を用いて計算されたRc に対応する変位値を表示する.GPA が有効か否かを評価するために信頼区間(通常95%)を設定でき,変位値が信頼区間を超えているなら,GPA はかなり分散を低減したと結論づけられる.

次元検定の結果

表は, PCAステップの最終時点で残された各因子について,実行された並べ替えの数, GPA後に計算されたF(ここでF は,コンフィグ間の分散におけるオブジェクト間の分散の比率),および並べ替えから得られたF の分布を用いて計算されたFに対応する変位値を表示する.ある次元がGPAの品質に有意に寄与するか否かを評価するために信頼区間(通常95%)を設定でき,変位値が信頼区間を超えているなら,その因子は有意に寄与していると結論づけられる.選択されたアルファ有意水準でのFisherの F分布に対応する臨界値およびp-値も指標として表示される. Fisherの F 分布からの結論が,並べ替え検定が示すものととても異なることがあります: FisherのF 分布の使用は,このケースでは不要なデータの正規性の仮定を必要とする.

合意コンフィグの結果

  • PCA前のオブジェクト座標: この表は,GPA変換の後でPCAの前のオブジェクト座標のコンフィグでの平均に対応する.
  • 固有値: PCAがリクエストされた場合,固有値の表と対応するスクリー・プロットが表示される.各軸に対応する合計変動のパーセンテージが,固有値から計算される.
  • 変数と因子の相関: これらの結果は,変換の前と後(GPA ,および,もしリクエストされたら PCA)のコンセンサス・コンフィグの変数間の相関に対応する. これらの結果は,常に相関円で解釈できるわけではないので,相関円では表示されない.
  • オブジェクト座標: この表は,変換後(GPA ,および,もしリクエストされたら PCA)のオブジェクト座標のコンフィグでの平均に対応する.これらの結果は,オブジェクト・グラフに表示される.

変換後のコンフィグの結果

  • コンフィグごとの分散,および次元ごとの分散: この表は,各軸に対応する合計変動のパーセンテージが,どのようコンフィグに分配されるかを可視化できる.
  • 変数と因子の相関:これらの結果は,すべてのコンフィグについて表示され,変換前と後(GPA ,および,もしリクエストされたら PCA)のコンフィグの変数間の相関に対応する. これらの結果は,相関円で表示される.
  • オブジェクト座標(コンフィグでのプレゼンテーション): この表の系列は,変換後(GPA ,および,もしリクエストされたら PCA)の各コンフィグについてのオブジェクト座標に対応する.これらの結果は,オブジェクト・グラフの最初の系列に表示される.
  • オブジェクト座標(オブジェクトでのプレゼンテーション): この表の系列は,変換後(GPA ,および,もしリクエストされたら PCA)の各コンフィグについてのオブジェクトオブジェクト座標に対応する.これらの結果は,オブジェクト・グラフの2番目の系列に表示される.
ternary diagramneural network diagram

Excelで動作する統計解析ソフトウェア。

14日間無償トライアルあり。