Kaplan-Meier 分析

kaplan-meier-analysis-general-dialog-box.png

Kaplan-Meier 分析とは

Kaplan Meier(product-limit法ともいう)解析は,生命表解析と共に生存解析の記述法に属する.生命表分析が最初に開発されたが,Kaplan-Meier 法が多くのケースで優れていることが示されてきた.

Kaplan-Meier 分析は,集団生存曲線と生存期間中央値のような本質的な統計量を素早く得ることができる.主要な結果がKaplan-Meier 表であるKaplan-Meier分析は, 観察区間が一定の生命表分析とは異なり,不規則な観察区間に基づいている.

Kaplan-Meier 分析の使用

Kaplan-Meier 分析は,任意の集団が時間によってそのどのように変化するかを分析するために用いられる.この手法は,ほとんど生存データと製品の品質データに適用される.個体または製品がなぜ変化するかの主な理由は3つある: いくつかの個体が死亡(製品が欠陥),その他のいくつかが治癒(修理)されたので,または(個体が場所から移動,研究が打ち切られたなどで)その追跡ができなくなったので,生存している母集団から消える.データの最初のタイプは,通常,"故障データ",または"イベント・データ"と呼び,一方,2つ目のは, "打ち切りデータ"と呼ぶ.

Kaplan Meier 分析は,集団をそれらの生存曲線で比較することを可能にする.たとえば,2つの異なる場所で生産された同じ製品の2つの標本の生存時間を比較することに興味があるかもしれない.検定は,生存曲線が同一の生存関数から生じているかどうかを確認することを実行できる.これらの結果は,あとで生存曲線をモデルし,故障の確率を予測することに使用できる.

Kaplan-Meier 分析でのデータ打ち切り

Kaplan-Meier 分析での打ち切りのタイプ

生存データの打ち切りには,複数のタイプがある:

  • 左側打ち切り(Left censoring): あるイベントが時間t=t(i)にレポートされ,そのイベントがt * t(i)で発生したことを知っている場合.
  • 右側打ち切り(Right censoring): あるイベントが時間t=t(i)にレポートされ,もし過去に発生したのなら,そのイベントがt * t(i)で発生したことを知っている場合.
  • 区間打ち切り(Interval censoring): あるイベントが時間t=t(i)にレポートされ,そのイベントが[t(i-1); t(i)]の間に発生したことを知っている場合.
  • 正確打ち切り(Exact censoring): あるイベントが時間t=t(i)にレポートされ,そのイベントが正確にt=t(i)で発生したことを知っている場合.

Kaplan-Meier 分析での独立打ち切り

Kaplan Meier 法は,オブザベーションが独立であることを必要とする.2つ目に,打ち切りは独立でなければならない:時間 t-1の調査で2つのランダムな個体を考え,その個体の1つが, 時間tで打ち切られ,その他が生存する場合,時間 tにおける両者の生存の確率は等しいはずである.独立打ち切りには,4つの種類がある:

  • 単純タイプ I: すべての個体が同時に打ち切られるか,または同等の個体が固定の期間追跡される.
  • 進行タイプ I: すべての個体が同じ日付で打ち切られる(たとえば,調査が打ち切られる場合).
  • タイプ II: n 個のイベントが記録されるまで,調査が続けられる.
  • 無作為: 打ち切りが発生する時間が生存時間に独立.

XLSTATでのKaplan-Meier 分析の結果

Kaplan-Meier 表

Tこの表は,分析から得られたさまざまな結果を表示する:

  • 区間開始ライン: 観察区間の下限.
  • 危険数(At risk): 危険のある個体の数sk.
  • イベント: 記録されたイベントの数.
  • 打ち切り: 打ち切られた記録データの数.
  • 故障率: "故障" した(イベントが起きた)個体の比率.
  • 生存率: "生存" した(イベントが起きなかった)個体の比率.
  • 生存分布関数 (SDF): 少なくとも興味の時間まで,ある個体が生存している確率.累積生存分布関数,または生存曲線ともいう.
  • 生存分布関数標準化誤差: 前者の標準誤差.
  • S生存分布関数信頼区間: 前者の信頼区間.

平均および中央値残留寿命

平均および中央値残留寿命は,2つの表を計算して表示する.

  1. 最初の表は,平均残留寿命,標準誤差,信頼範囲を表示する.
  2. 2番目の表は,中央値残留寿命(50%) を含む3 分位数での統計量(推定値および信頼範囲)を表示する.中央値残留寿命は,"故障"(死亡)する集団の半分についての残りの時間を計算することができるので,Kaplan-Meier解析の要となる結果の1つである.

Kaplan-Meier 分析での信頼区間

生存関数の信頼区間の計算は,3種類の方法を用いて行える:

  1. Greenwoodの手法
  2. 指数 Greenwoodの手法
  3. 対数変換法

これらの3つのアプローチは,同様な結果を与えるが,最後の手法は,標本が小さいときに好ましい.

Kaplan-Meier 分析のグラフ

XLSTAT は以下のグラフを提供する:

  • 生存分布関数 (SDF)
  • 生存分布関数(SDF)の–Log() に対応する-Log(SDF).
  • 生存分布関数(SDF)のLog(–Log())に対応する Log(-Log(SDF))

打ち切りデータが記録された時間をグラフ嬢で識別することもできる.

生存関数の等質性の検定

3種類の検定で生存関数の等質性の検定を計算することができる:

  • Log-rank 検定,
  • Wilcoxon 検定,
  • Tarone Ware 検定.

これらの検定は,カイ2乗検定に基づく.対応するp-値が低いほど,グループ間の差がより有意である.

ternary diagramneural network diagram

Excelで動作する統計解析ソフトウェア。

14日間無償トライアルあり。