Cox 比例ハザード・モデル

Cox 比例ハザード・モデルの原理

Cox 比例ハザードモデルの原理は,個体の生存時間を共変量にリンクさせることである.たとえば,医療分野では,我々は患者の生存時間に最も重要な影響力を持つ共変量がどれであるかを見つけようとしている.

Cox モデル

Cox モデル は,患者の生存と複数の説明変数の間の関係性を探索するためのよく知られている統計的手法である.Cox モデルは,修正後の他の説明変数の生存への治療効果の推定を提供する.これは,個体について,彼らの予後変数を与えて,死亡の危険度(またはリスク),または他の問題のイベントを推定することを可能にする.

Cox モデルの解釈は,各説明変数の係数の検討に係わる.ある説明変数の回帰係数が正値でることは,危険が高いことを意味する.逆に,負の回帰係数は,その変数の値が高いほど,患者の予後がよいことを暗示する.

 Coxの手法は,生存時間にどのような特別な分布も仮定しないが,むしろさまざまな変数の生存への効果が時間とともに一定であり,特別なスケールで加法的であることを仮定する.

 ハザード関数は,個体が区間の初めまで生存していたことを仮定して,小さな観察区間内で個体がイベント(たとえば,死亡)を経験する確率である.したがって,これは時間 tで死亡するリスクとして解釈できる. ハザード関数(l(t,X)と表記)は,下記の式を用いて推定される:

λ(t,X) = λ0(t) exp(βX)

最初の項は,時間のみに依存し,2番目の項は Xに従属する.我々は,2番目の項のみに興味がある.2番目の項のみを推定する場合,とても重要な仮説が検証されなければならない:比例ハザード仮説.これは,2つの異なるオブザベーションの間のハザード比が時間に依存することを意味する.Cox は,ハザード関数の時間依存項を考慮に入れない係数bを推定するために,偏尤度(partial likelihood )という尤度の修正版を開発した:

log[L(β)] = Σi=1..n βXi - log[Σj=t(j)≥ t(i) exp(βXj)]

モデルの b パラメータ(線形関数の係数)を推定するために,我々は偏尤度関数を最大化しようとする.線形回帰とは異なり,厳密な解析解は存在しない.いさがって,繰り返しアルゴリズムが 使用されなければならない.XLSTAT はNewton-Raphson アルゴリズムを使用する.ユーザーは,必要であれば繰り返しの最大数と収束しきい値を変更できる.

 Cox 比例ハザード・モデルでの層(Strata)

比例ハザード仮説を保持しない場合,モデルは層化できる.仮説がサブ標本で保持される場合,各サブ標本で偏尤度が推定され,推定偏尤度を得るためにこれらの偏尤度が合計される. XLSTATでは,層は質的変数を用いて定義される.

Cox 比例ハザード・モデルでの質的変数

質的共変量は,全分離表を用いて取り扱われる.モデルに独立変数を組み込むために,各質的変数の最初のモーダリティに関係づけられたバイナリ変数は,モデルから除去されなければならない.XLSTATでは,最初のモーダリティが常に選択されており,したがって,その効果が標準に対応する.その他のモーダリティの影響度が,削除されたモーダリティと相対的に得られる.

Cox 比例ハザード・モデルでの同値の取り扱い

比例ハザードモデルは,連続時間の生存データを取り扱うために,Cox (1972) によって開発された.しかしながら,実際の応用ではたびたび,いくつかのオブザベーションが同時に発生する.伝統的な偏尤度は適用できない.XLSTATでは,同値を取り扱うために,2つの代替アプローチを使用できる:

  • Breslowの手法 (1974) (デフォルト手法): 偏尤度は以下の形をとる: log[L(β)] = Σi=1..T β Σl=1..diXl - di log[Σj=t(j)≥ t(i) exp(βXj)],
    ここで T は時間の数で, di は時間t(i)に関連するオブザベーションの数.
  • Efronの手法 (1977): 偏尤度は以下の形をとる: log[L(β)] = Σi=1..T β Σl=1..diXl - Σr=0..di-1 log [Σj=t(j)≥ t(i) exp(βXj) – r/di Σj=1..di exp(βXj)], ここで T は時間の数で, di は時間t(i)に関連するオブザベーションの数.

同値がない場合は,偏尤度はCox の偏尤度に相当する.

Cox 比例ハザード・モデルでの変数選択

モデルの部分である変数を選択してCox 比例ハザード・モデルを改良することができる. XLSTAT は,変数を選択する2つのオプションを提供する:

  • フォワード選択: 選択プロセスは,モデルに最も大きな寄与率を持つ変数を追加して開始する.2番目の変数の投入確率が投入しきい値より大きいなら,それがモデルに追加される.このプロセスは,モデルに入れられる新しい変数がなくなるまで繰り返される.
  • バックワード選択: この手法は前者に似ているが,完全なモデルから開始する.

XLSTATでのCox 比例ハザード・モデルの結果

Cox 比例ハザード・モデルの適合度係数

適合度係数の表は,独立モデル(共変量の影響がなく,beta=0の場合に対応)および修正モデルに関する一連の統計量を表示する.

  • オブザベーション: 考慮に入れるオブザベーションの合計数;
  • DF: 自由度;
  • -2 Log(Like.): モデルに関係づけられた尤度関数の対数;
  • AIC: 赤池情報量基準;
  • SBC: Schwarzのベイズ情報量基準;
  • 繰り返し: 収束までの繰り返し数.

Cox 比例ハザード・モデルの検定

XLSTAT は,帰無仮説 H0: beta=0 を検定することができる:

帰無仮説H0 は,独立モデル(共変量の影響なし)と一致する. 我々は,修正モデルがこのモデルよりも有意に強力であることを確認しようとする.3つの検定が利用可能である:尤度比検定 (-2 Log(Like.)),スコア検定,Wald 検定.3つの統計量は,自由度が示されたカイ2乗分布に従う.

モデル・パラメータ

パラメータ推定,対応する標準偏差,Wald のカイ2乗,対応するp-値および信頼区間が,モデルの各変数について表示される.各変数のハザード比も信頼区間とともに表示される.

残差表は,各オブザベーションについて,時間変数,打ち切り変数,および残差の値(尤離度,マルチンゲール,シェーンフィールド,スコア).

Cox 比例ハザード・モデルで利用可能なグラフ

XLSTAT は,Cox 比例ハザード・モデルで下記のグラフを提供する:

  • 累積生存関数 (SDF),
  • -Log(SDF),
  • Log(-Log(SDF)),
  • 共変量の平均でのハザード関数,
  • 残差.