クラスカル-ウォリス検定

Kruskal-Wallis 検定の原理

Kruskal-Wallis 検定 は,正規性の仮定が採用できない場合に,ANOVA の代替として,しばしば使用される.これは,k 個の標本 (k≥2)が同じ母集団から得られたか,位置パラメータについて同一の特性を持つ母集団から得られたかを検定 するために使用される.(位置パラメータは,概念的に中央値に近いが, Kruskal-Wallis 検定は,中央値によって与えれる位置だけよりも,多くの情報を考慮に入れる).

このノンパラメトリック検定は,k個の独立標本がある場合,標本が単一の母集団から得られたか,少なくとも1つの標本が他とは異なる母集団から得られたかを決定するために使用される.

Kruskal-Wallis検定の定義

:Miが標本 iの位置パラメータであるなら,Kruskal-Wallis 検定の帰無仮説 H0 と対立仮説 Haは,以下のようになる:

  • H0: M1 = M2 = … = Mk
  • Ha: Mi ≠ Mjであるような少なくと1つの対応(i, j)がある

Kruskal-Wallis 検定からのK 統計量の計算は, Mann-Whitney 検定と同様, k 個の標本(またはグループ)が混合されてからのオブザベーションの順位が関与する. K は,次式で定義される

K = 12/(N(N+1)) Σi=1..k [Ri²-3(N+1)]

ここで,ni は標本 iのサイズ,N はniの合計,Ri は標本 iの順位の合計である.k=2のとき,Kruskal-Wallis 検定はMann-Whitney 検定に相当し, K は Wsに相当する.同値がある場合,Mann-Whitney 検定の場合と同様,平均順位が対応するオブザベーションに使用される.

Kruskal-Wallis 検定でのp値の計算

任意のKの値に関するp値の計算では,XLSTATは3つのオプションを提供する:

  • 漸近 自由度(k-1)を持つカイ2乗分布によってKの分布の漸近をも用いてp値を計算する.この漸近はNが小さい場合を除いて良好である.
  • 正確 Kの真の分布に基づいてp値を計算する.これらの計算はとても重い.小さい標本(Nが20より小さい)でのみ使用することを推奨する.
  • モンテカルロ この計算は,N 個の値の無作為再標本化に基づく.ユーザーは実行うするシミュレーション(再標本化)の回数を選ばなければならない.p値の99% 信頼区間が提供される.もちろん,この区間はシミュレーションの回数が増えるほどより小さくなる.

仮説 H0 が棄却されなければならないようなp値の場合,少なくとも1つの標本(グループ)が他とは異なる.どの標本がH0の棄却に関与しているかを識別するには,多重比較手順が使用できる.

Kruskal-Wallis 検定のための多重比較法

Kruskal-Wallis検定では,3つの多重比較法が利用可能である:

  • Dunn (1963) 各処理の順位の平均の比較に基づく手法で,順位はKの計算のために使用される.正規分布が順位の平均の標準化された差の漸近分布として使用される.
  • Conover et Iman (1999) Dunnの手法に近く,この手法は Student 分布を使用する.これは順位の上で実行されるt 検定に対応する.
  • Steel-Dwass-Critchlow-Fligner (1984) このより複雑な手法は,Hollander (1999)によって推奨されている.これは処理の各組み合わせでの順位の再計算を必要とする. Wij 統計量が各組み合わせについて計算される.そして,XLSTATは漸近分布を用いて対応すp-値を計算する.

Dunn,Conover-Iman および Nemenyi 手法では, k(k-1)/2 通りの比較があることを考慮に入れるために,Bonferroni によって提案された有意水準の補正が適用できる.