ロジスティック回帰のための検定力

検定力分析を用いて,最適な検定力または標本サイズを確実にする.ロジスティック回帰のための検定力は,XLSTAT統計解析ソフトウェアを用いてExcel内で利用できる.

ロジスティック回帰のための統計的検出力

XLSTAT-Base は,ロジスティック回帰を適用するためのツールを提供する. XLSTAT-Power は,検出力を推定または,このモデルに関連するオブザベーションの必要な数を計算する.統計的検定を用いて仮説を検定する際,なすき複数の決定がある:

  • 帰無仮説  H0 および対立仮説 Ha.
  • 使用する統計的検定.
  • 第1種の過誤(type I error,アルファ過誤ともいう).帰無仮説を棄却したが,それが真である場合.これは各検定で事前に設定され,5%である.

第2種の過誤( type II error またはベータ過誤)は,あまり検討されないが,とても重要である.実は,これは帰無仮説が偽のときにそれを棄却しない確率を表している.我々はこれを前もって固定できないが,モデルの他のパラメータに基づいて,これを最小化しようとすることはできる.検定の検出力が1 - ベータとして計算され,帰無仮説が偽のときにそれを棄却する確率を表す.

したがって,我々は検定の検出力を最大化したい.XLSTAT-Power モジュールは,他のパラメータが既知であるときの検出力(およびベータ)計算する.任意の検出力について,その検出力に達するために必要な標本サイズを計算することもできる.

統計的検出力の計算は,通常,実験を実施する前に行われる.検出力の計算の主な応用は,実験を適切に実施するために必要なオブザベーションを推定することである.ロジスティック回帰の一般的な枠組みでは,その目的はあるイベント(通常Y=1)が起きる確率Pを説明したり予測したりすることである.Pは次式に等しい: P = exp(β0 + β1X1 + … + βkXk) / [1 + exp(β0 + β1X1 + … + βkXk) ] 次式を得る: log(P/(1-P)) = β0 + β1X1 + … + βkXk XLSTAT-Powerで使用される検定は, β1係数が 0に等しいという帰無仮説に基づく.それは, X1説明変数がモデルに効果を持たないことを意味する.

検定されるべき仮説は次である:

  • H0: β1 = 0
  • Ha: β1 ≠ 0

ロジスティック回帰の統計的検出力の計算

検出力は,変数のタイプに応じた近似を用いて計算される.X1は量的変数で正規分布に従うなら、近似のパラメータは次のとおりである:

  • P0 (ベースライン確率): すべての説明変数がそれらの平均値に設定されるとき Y=1 である確率.
  • P1 (代替確率): X1がその平均値を超える1標準誤差に等しく,他のすべての説明変数がその平均値にある確率.
  • オッズ比: X1がその平均値を超える1標準偏差に等しいときのY = 1である確率と,X1がその平均値にあるときのY = 1である確率との比.
  • は,X1とモデルに含まれる他のすべての説明変数との間の回帰で得られる.

X1が2値で二項分布に従うなら、近似のパラメータを次のとおりである.

  • P0 (ベースライン確率): X1=0のときのY=1 である確率.
  • P1 (代替確率): X1 =1のときのY=1 である確率.
  • オッズ比: X1 =1 のtきのY=1である確率と,X1 =0のときのY=1 である確率との比.
  • R²は,X1とモデルに含まれる他のすべての説明変数との間の回帰で得られる.
  • X1= 1のオブザベーションのパーセンテージ.

これらの近似は,正規分布に基づく.

統計的検出力を考慮に入れたロジスティック回帰の標本サイズの計算

必要なオブザベーションの数を計算するために,XLSTATは関数の根を探索するアルゴリズムを使用する.これはVan Wijngaarden-Dekker-Brent アルゴリズム(Brent, 1973)と呼ばれる.このアルゴリズムは,関数の導関数が未知の場合に適応する.それは,次式の根を見つけようとする:

検出力 (N) – 期待検出力

そして,検定ができるかぎり要求される検出力に近い検出力を持つようなサイズ N を得る.