生命表分析

生命表分析とは

生命表解析は,Kaplan Meier 解析とともに生存解析の記述手法に属す.生命表解析法が最初に開発されたが, Kaplan-Meier 解析法が多くのケースで優れていることが示されてきた.

生命表解析は,集団生存曲線と生存期間中央値のような本質的な統計量を素早く得ることができる.Kaplan Meier解析がデータ集合中にあるのと同じ観察区間が取られるのに対して,主要な結果が生命表(保険数理表ともいう)である生命表解析は,固定の観察区間で作業する.

生命表解析の使用

生命表解析は,任意の集団が時間でどのように変化するかを分析できる.この手法は,ほとんど生存データと生産品質データに適用される.個体または製品の集団が変化するには,3つの主な理由がある:

  • いくつかの個体が死滅(製品が 故障),
  • 調査されている集団のいくつかが治癒して(修理されて)消える,または追跡ができなくなって(個体がその場所から移動,調査が打ち切られるなど)消える.

最初のタイプのデータは,通常, "故障データ",または "イベント・データ"と呼ばれ,一方,2番目は "打ち切りデータ"と呼ばれる.

生命表法は,生存曲線を通して複数の集団を比較することができる.たとえば,2つの異なる場所で生産された同じ製品の2つの標本の生存時間を比較することは興味深いであろう.生存曲線が同一の生存関数から発生しているかどうかをチェックするために検定が実行される.これらの結果は,あとで生存曲線をモデルして,故障の確率を予測するために使用できる.

生命表解析でのデータ打ち切り

生命表解析での打ち切りのタイプ

生存データの打ち切りには複数の種類がある:

  • 左側打ち切り(Left censoring): あるイベントが時間t=t(i))にレポートされ,そのイベントがt * t(i)で発生したことを知っている場合.
  • 右側打ち切り(Right censoring): あるイベントが時間t=t(i)にレポートされ,もし過去に発生したのなら,そのイベントがt * t(i)で発生したことを知っている場合.
  • 区間打ち切り(Interval censoring): あるイベントが時間t=t(i)にレポートされ,そのイベントが[t(i-1); t(i)]の間に発生したことを知っている場合.
  • 正確打ち切り(Exact censoring): あるイベントが時間t=t(i)にレポートされ,そのイベントが正確にt=t(i)で発生したことを知っている場合.

生命表解析での独立打ち切り

生命表法は,オブザベーションが独立であることを要求する.さらに,打ち切りは独立でなければならない:時間 t-1の調査で2つの無作為の個体を考えるとして,個体の1つが時間tで打ち切られて,もう1つが生存している場合,両者が時間 tで生存する確率は等しいはずである.独立打ち切りには,4つの種類がある:

  • 単純タイプ I: すべての個体が同時に打ち切られるか,または同等の個体が固定の期間追跡される.
  • 進行タイプ I: すべての個体が同じ日付で打ち切られる(たとえば,調査が打ち切られる場合).
  • タイプ II: n 個のイベントが記録されるまで,調査が続けられる.
  • 無作為: 打ち切りが発生する時間が生存時間に独立.

XLSTATでの生命表解析の結果

生命表

生命表は,分析から得られるさまざまな結果を表示する:

  • 区間: 観察区間.
  • 危険数(At risk): 観察区間中に危険に曝されている個体の数.
  • イベント: 観察区間中に記録されたイベントの数.
  • 打ち切り: 観察区間中に記録された打ち切りデータの数.
  • 有効危険数: 区間の最初に危険に曝されていた個体から観察区間中に打ち切られた個体の数の半分を引いた数.
  • 生存率: 観察区間に"生存した" (イベントが発生しなかった)個体の集団. "有効に危険(effective at risk)"であった個体の中で生存した個体の比率.
  • 故障の条件つき確率: "有効に危険"であった固体の中で故障した(死亡した)個体の比率.
  • 条件つき確率の標準誤差: 前者の標準誤差.
  • 生存分布関数 (SDF): 少なくとも問題の観察区間まで生存する個体の確率. 生存関数(survivor function)ともいう.
  • 生存関数の標準誤差: 前者の標準誤差.
  • 確率密度関数: 区間の中間点での推定密度関数.
  • 確率密度の標準誤差: 前者の標準誤差.
  • ハザード率: 区間の痛感点での推定ハザード率.故障率ともいう.生存の故障率に対応する.
  • ハザード率の標準誤差: 前者の標準誤差.
  • 中央値残留寿命: 生存集団(危険に曝された個体)が半減するまでの残り時間.余命中央値(median future lifetime)ともいう.
  • 中央値残留寿命標準誤差: 前者の標準誤差.

生命表解析のグラフ

XLSTAT は以下のグラフを提供する:

  • 生存分布関数 (SDF)
  • 生存分布関数 (SDF)の–Log()である- Log(SDF)
  • 生存分布関数 (SDF)のLog(–Log()) であるLog(-Log(SDF))

I打ち切りデータが記録された時間をグラフの上で識別することもできる.

生命表関数の等質性の検定

3種類の検定で生存関数の等質性の検定を計算できる:

  • Log-rank 検定,
  • Wilcoxon 検定,
  • Tarone Ware 検定.

これらの検定は,カイ2乗検定に基づく.対応するp-値が低いほど,グループ間の差がより有意になる.