多次元検定 (Mahalanobis, …)

多次元検定の原理
XLSTAT に実装されている多次元検定は,複数の変数で記述される標本を比較するために使用する.Studentのt 検定のように2つ標本の平均を比較する代わりに,ここでは,複数の変数について測定された同じ標本の平均を同時に比較する.
変数の数だけ Student のt 検定を行う手順と比較して,ここで提案する手法は,変数の共分散の構造を用いる利点と全体的な結論を得る利点を持つ.Studentのt 検定によって,ある変数について,2つの標本が異なるとしても,全体的には,それらが類似しているという仮説を棄却することは不可能である.
マハラノビスの距離
マハラノビス距離は,p次元の共分散構造を考慮に入れながらp次元空間の2点の間の距離を計算することができる.
マハラノビス距離の2乗は次式で書ける:
dM² = (x1 - x2) ∑-1 (x1 - x2)
ここで, xi はベクトル x1 で ∑ は共分散行列である.
マハラノビス距離は,2つのグループ(または標本)を比較するのに使用できる.なぜならばHotelling T² 統計量が次式で定義される:
T² = [(n1*n2) ⁄ (n1 + n2)] dM
標本がすべての変数について正規分布であるならば,これはHotelling 分布に従う.
帰無仮説H0が2つの標本の平均が等しいとする場合の比較検定には,F 統計量が使用され,次式で定義される:
F = T² [n1+ n2 – (p-1)] ⁄ [(n1 + n2 – 2)*p]
標本がすべての変数について正規分布であれば,この統計量は,自由度p および n1+n2-p-1を持つFisherの F 分布に従う.
3つ以上の標本を比較したい場合,マハラノビス距離に基づく検定は,大域レベルで観察された差の可能性のある原因を同定するために使用できる.アルファ有意水準でのボンフェローニ補正を使用することを推奨する.
Wilksのラムダ
Wilksのラムダは,従属変数の組み合わせでの標本の平均間に差があるかないかを検定するために,多変量分散分析で使用するに統計的検定である.
グループ内共分散行列の等異質性の検定
Box 検定
Box 検定は,クラス内共分散行列の等質性の仮定を検定するのに使用する.2つの近似があり,1つはカイ2乗分布で,もう1つはFisher 分布である.
Kullbackの検定
Kullbackの検定は,クラス内共分散行列の等質性の仮定を検定するのに使用する.計算される統計量は,カイ2乗分布によって近似的に分布する.