線形回帰のための検定力

power-linear-regression-general-dialog-box.png

線形回帰のための統計的検出力

XLSTAT-Pro は 線形回帰モデルを適用するためのツールを提供している.XLSTAT-Power は,線形回帰の枠組みで検出力を推定したり,R ² の変動に関連づけて必要なオブザベーションの数を計算する.

統計的検定を用いて仮説を検定する際,なすべき複数の決定がある:

  • 帰無仮説H0  および対立仮説 Ha.
  • 使用する統計的検定.
  • 第1種の過誤(type I error,アルファ過誤ともいう).帰無仮説を棄却したが,それが真である場合.これは各検定で事前に設定され,5%である.

第2種の過誤( type II error またはベータ過誤)は,あまり検討されないが,とても重要である.実は,これは帰無仮説が偽のときにそれを棄却しない確率を表している.我々はこれを前もって固定できないが,モデルの他のパラメータに基づいて,これを最小化しようとすることはできる.検定の検出力が1 - ベータとして計算され,帰無仮説が偽のときにそれを棄却する確率を表す.

したがって,我々は検定の検出力を最大化したい.XLSTAT-Power モジュールは,他のパラメータが既知であるときの検出力(およびベータ)計算する.任意の検出力について,その検出力に達するために必要な標本サイズを計算することもできる.

統計的検出力の計算は,通常,実験を実施する前に行われる.検出力の計算の主な応用は,実験を適切に実施するために必要なオブザベーションを推定することである:

  • R² 値と 0.
  • モデルに新しい予測変数が追加されたときの R² 値の増加と0.

これは以下の仮説を検定することを意味する:

  • H0: R² が 0に等しい / Ha: R² が0と異なる
  • H0: R²の増加が 0に等しい/ Ha:R²の増加が0と異なる.

線形回帰での  R² の変動の効果量

このコンセプトは,検出力の計算でとても重要である. Cohen (1988) がこのコンセプトを開発した.効果量は,どのようなパラメータの投入もなしに,検定される効果が弱いか強いかを示して,検定の検出力を計算できるようにする量である:

  • f²=0.02, 効果が小さい.
  • f²=0.15, 効果が中ぐらい.
  • f²=0.35, 効果が強い.

XLSTAT-Power は効果量を直接入力できるが,効果量を計算することを助けるモデルのパラメータを入力することもできる.計算の詳細は以下のとおりである:

  • 分散を使用:我々は,効果の大きさを定義するためにモデルの分散を使用する .ただし,VarExplainedは我々が検定したい説明変数によって説明されている分散であり,VarErrorは誤差の分散または残差分散であり,次式を使用する: f² = varExplained/ varError.
  • UR² を使用(H0: R²=0の場合):我々は効果の大きさを定義するために,推定平方重相関値( rho²という)を入力する.次式を使用する: f² = ρ² / (1 - ρ)
  • 偏 R²を使用(H0: R²の増加=0の場合):我々は効果の大きさを定義するために予測変数をモデルを追加したときのR²の期待される差分である偏 R² を入力する.次式を使用する: f² = Rpart² / (1 - Rpart²)
  • 予測変数間の相関を使用(H0: R²=0の場合):説明変数と従属変数の間の相関を格納するベクトルCorrYおよび説明変数間の相関を格納する正方行列CorrXを選択しなければならない.次式を使用する: f² = CorrYT * CorrX-1 * CorrY / (1 - = CorrYT * CorrX-1 * CorrY)

効果量が定義されると,検出力と必要な標本サイズが計算できる.

線形回帰でのR² の変化のための統計的検出力の計算

検定の検出力は,通常,関連する非心分布を用いて得らる.この場合では,我々は検出力を計算するためにフィッシャー非心分布を使用する.この検定の検出力は,次の自由度を持つ非心フィッシャー分布を用いて得られる: DF1 は検定される変数の数で; DF2は,モデル中に含まれる説明変数の合計数プラス1が差し引かれた標本サイズで,非心パラメータは: NCP = f²N.

線形回帰での R² の変化のための標本サイズの計算

必要なオブザベーションの数を計算するには,XLSTATはある関数の根を探索するアルゴリズムを使用する.それはVan Wijngaarden-Dekker-Brent アルゴリズム(Brent, 1973)と呼ばれる.このアルゴリズムは,関数の導関数が未知の場合に適応する.それは,次式の根を見つけようとする:

検出力 (N) – 期待検出力

そして,検定ができるかぎり要求される検出力に近い検出力を持つようなサイズ N を得る.

ternary diagramneural network diagram

Excelで動作する統計解析ソフトウェア。

14日間無償トライアルあり。