平均比較のための検定力

power-compare-means-general-dialog-box.png

平均の比較のための検定力分析

平均を比較するには複数の検定があり,XLSTATでは,即ちいわゆる t 検定と z 検定を提供する.XLSTAT は,これらの検定の検出力(検定力)を計算し,十分な検出力を得るために必要なオブザベーションの数を計算できる.

統計的検定を用いて仮説を検定する際,なすべき複数の決定がある:

  • 帰無仮説  H0 および対立仮説  Ha.
  • 使用する統計的検定.
  • 第1種の過誤(type I error,アルファ過誤ともいう).帰無仮説を棄却したが,それが真である場合.これは各検定で事前に設定され,5%である.

第2種の過誤( type II error またはベータ過誤)は,あまり検討されないが,とても重要である.実は,これは帰無仮説が偽のときにそれを棄却しない確率を表している.我々はこれを前もって固定できないが,モデルの他のパラメータに基づいて,これを最小化しようとすることはできる.検定の検出力が1 - ベータとして計算され,帰無仮説が偽のときにそれを棄却する確率を表す.したがって,我々は検定の検出力を最大化したい.XLSTAT-Power モジュールは,他のパラメータが既知であるときの検出力(およびベータ)計算する.任意の検出力について,その検出力に達するために必要な標本サイズを計算することもできる.

統計的検出力の計算は,通常,実験を実施する前に行われる.検出力の計算の主な応用は,実験を適切に実施するために必要なオブザベーションを推定することである.XLSTAT は,次の比較ができる:

我々は,母集団の分散が推定されている場合は t-検定を用い,それが未知の場合は z-検定を用いる.それぞれの場合で,パラメータが異なり,ダイアログ・ボックスに表示される.

検出力の計算方法

検定の検出力は,通常,関連する非心分布を用いて得られる.したがって, t-検定では,非心スチューデント分布,z-検定では正規分布が用いられる.

1標本のT-検定または Z-検定に関する検出力

この検定の検出力は,非心パラメータ (NCP)による非心スチューデント分布を用いて得られる: NCP = |(X - X0)/SD) - √N|

 X0 は理論平均で,SDは 標準偏差.X - X0)/SD 部は,効果量(effect size)と呼ばれる.

2つの対応のある標本のT-検定または Z-検定

1標本の場合と同じ式を提供するが,標準偏差の計算が異なる: NCP = |(X1 - X2)/SDDiff) - √N|

ここで SDDiff= √(SD1² + SD2²) – 2 corr*SD1SD2 で, Corrは2標本の間の相関である.X1 - X2)/SDDiff 部は,効果量である..

2つの独立標本のT-検定またはZ-検定

2つの独立標本の場合,標準偏差の計算が異なり,オブザベーションの数の調和平均を用いる.

検定の検出力を用いた標本サイズの計算

必要なオブザベーションの数を計算するために,XLSTATは,ある関数の根を探索するアルゴリズムを用いる.それはVan Wijngaarden-Dekker-Brent アルゴリズム(Brent, 1973)と呼ばれる.このアルゴリズムは,関数の導関数が未知の場合に適応する.それは,次式の根を見つけようとする:

検出力 (N) - 期待検出力

そして,できるかぎりその検出力に近い検出力を持つようなサイズ N を得る.

検出力計算における効果量

このコンセプトは,検出力の計算でとても重要である. Cohen (1988) がこのコンセプトを開発した.効果量は,どのようなパラメータの投入もなしに,検定される効果が弱いか強いかを示して,検定の検出力を計算できるようにする量である.

平均の比較の文脈では,効果量の大きさの慣例は:

  • d=0.2, 効果が小さい.
  • d=0.5, 効果が中ぐらい.
  • d=0.8, 効果が強い.

XLSTAT では,効果量を直接入力できる.

ternary diagramneural network diagram

Excelで動作する統計解析ソフトウェア。

14日間無償トライアルあり。