感度および特異度分析

sensitivity-and-specificity-contingency-table-and-statistics.png

感度および特異度分析とは

XLSTATの感度分析および特異度分析機能は,検定または検出手法に関連したとくに感度,特異度,オッズ比,予測値および尤度比を計算することができる. これらの指標は,テストの性能を評価することに使用できる.

医療では病気の診断に使用するテストの能力を評価するため,品質管理では製造された製品での不良の存在を検出するために使用できる.

手法の歴史

この手法は,最初,第2次世界大戦中に日本の戦闘機を検出する効率的な方法を開発するために開発された.そして, 現在では広く利用されている信号検出や医療により一般的に適用された.

感度および特異度分析の原理

我々は,しばしば2値の現象(たとえば,疾患の有無)を調査し,正確なイベントの発生(たとえば,疾患の存在)を効率的に検出するテストを開発したいことがある.

V を追跡されているN 個の個体に関する現象を記述する2値または多項変数であるとする.イベントが発生した個体を + で,発生しなかった個体を– で記録する. Tをイベントが発生したかしなかったかを検出することを目的としたテストであるとする.Tはバイナリ(2値,有/無)でも質的変数(たとえば色)でも量的変数(たとえば濃度)でもかまわない. バイナリまたは質的変数については,t1 を目的(興味)のイベントの発生に対応することとする.量的変数については,t1 をそれより上がイベントが発生したとみなされるしきい値とする.

N個の個体に検定が適用されると,各個体についてイベントが発生したかどうか,そして検定の結果を見ることのできる個体/変数の表が得られる.

IndividualDiseaseBinary TestQuantitative Test
I01++0
I02++0.1
I03++0.2
I04++0.3
I05++0.4
I06++0.5
I07--1
I08+-2
I09--3
I10--4
I11--5

これらの表は, 2x2 分割表に要約できる:

Test/DiseaseD+D-
T+60
T-14

上記の事例では,テストが疾患の存在を検出した個体が6件あり,非存在を検出した個体が 4件ある.ただし,1件の個体の診断は間違っており,患者が病気であるにもかかわらず疾患の非存在を主張している.

以下の用語が使用される:

  • 真陽性(TP :True positive ): テストが陽性を主張し,実際にも陽性であるケースの数.
  • 偽陽性(FP :False positive): テストが陽性を主張し,実際は陰性であるケースの数.
  • 真陰性(TN :True negative)テストが陰性を主張し,実際にも陰性であるケースの数.
  • 偽陰性(FN :False negative): テストが陰性を主張し,実際は陽性であるケースの数.

感度および特異度分析の指標

テストの性能を評価するために,複数の指標が開発されてきた:

  • 感度Sensitivity真陽性率に相当): テストによって正しく検出された陽性ケースの比率.言い換えると,感度は陽性の個体で使用する場合に,テストがどれだけ効果的であるかを測定する.感度が 1のとき,陽性の個体ではテストは完全で,感度が0.5のとき,無作為抽出に相当する.. 0.5よりも下の場合,テストは反対に機能しており,感度が0.5より高くなるように,ルールを逆転させることが有用であろう(ただし,これが特異度には影響しないことが条件). 数学的定義は,次式で与えられる:Sensitivity = TP/(TP + FN).
  • 特異度Specificity真陰性率に相当):テストによって正しく検出された陰性ケースの比率.言い換えると,特異度は陰性の個体で使用する場合に,テストがどれだけ効果的であるかを測定する.特異度が 1のとき,陰性の個体ではテストは完全で,特異度が0.5のとき,無作為抽出に相当する.0.5よりも下の場合,テストは反対に機能しており,特異度が 0.5より高くなるように,ルールを逆転させることが有用であろう( ただし,これが感度に影響しないことが条件).数学的定義は,次式で与えられる:Specificity = TN/(TN + FP).
  • 偽陽性率 (FPR):テストが陽性と検出した陰性のケースの比率(FPR = 1-Specificity).
  • 偽陰性率 (FNR):テストが陰性と検出した陽性のケースの比率(FNR = 1-Sensitivity)
  • 有病率(Prevalence): 全体標本中の目的のイベントの相対度数(TP+FN)/N.
  • 陽性的中率(PPV:PositivePredictive Value:テストによって検出された陽性ケースの中での本当に陽性ケースの比率.我々は次式を使用する.PPV = TP / (TP + FP),または PPV = Sensitivity x Prevalence / [(Sensitivity x Prevalence + (1-Specificity)(1-Prevalence)].これは有病率に依存する基本的な値であり,テストの品質に依存しない指標である
  • 陰性的中率(NPV): テストによって検出された陰性ケースの中での本当に陰性ケースの比率.我々は次式を使用する.NPV = TN / (TN + FN),または PPV = Specificity x (1 - Prevalence) / [(Specificity (1-Prevalence)  + (1-Sensibility) x Prevalence].この指標も有病率に依存し,テストの品質に依存しない.
  • 陽性尤度比(LR+:Positive Likelihood Ratio): この比率は,ある固体がテストで陽性であると判定されたときに,それが本当に陽性である確率がどれぐらいであるかを示す.式は,LR+ = Sensitivity / (1-Specificity).LR+ は正値または空値である.
  • 陰性尤度比(LR-:Negative Likelihood Ratio):この比率は,ある個体がテストで陰性であると判定されたときに,それが本当に陰性である確率がどれぐらいであるかを示す.式は, LR- = (1-Sensitivity) / (Specificity). LR- は正値または空値である.
  • オッズ比::オッズ比(odds ratio)は,テストが陽性の場合,テストが陰性である場合と較べて,固体が陽性であることがどれぐらい確からしいかを示す.たとえば,オッズ比が2 というのは,テストが陽性の場合が陰性の場合よりも2倍,陽性イベントが起きやすいことを意味する.オッズ比は正値または空値である.式は,Odds ratio = TPxTN / (FPxFN).
  • 相対リスク: 相対リスク(relative risk)は,テストが陽性を報告するとき,陰性のときよりも,どれだけよく動作するかを測定する比率である.たとえば,相対リスクが2 であることは,陽性のときは陰性のときよりもテストが2倍強力であることを意味する. 1 に近い値は,行と列の間が独立であり,陽性の場合も陰性の場合も同じように動作するケースに対応する. 相対リスクは,空値または正値であり,次式によって与えられる:
     Relative risk = TP/(TP+FP) / (FN/(FN+TN)).

感度および特異度分析の信頼区間

.上記に提示された諸々について,それらの分散を計算する複数の方法と,したがって,それらの信頼区間が提案されている.2つのファミリーがある:1つ目は,感度や特異度のような割合(proportions)に関連しており,2つ目は,LR +, LR-,オッズ比,相対リスクのような比(ratios)に関連する.

割合については,XLSTATは,単純 (Wald, 1939) または修正済み (Agresti and Coull, 1998) Wald 区間,Wilson スコア (Wilson, 1927)に基づく計算,連続性補正の選択, または Clopper-Pearson (1934) 区間を使用することができる.Agresti とCaffo は,修正済みWald 区間またはWilson スコア区間を使用することを推奨している.

比率については,連続性の補正つき,またはなしで,単一の手法を用いて,分散が計算される.

上記の統計量の分散が計算されると,我々は対応する信頼区間を決定するために,漸近的正規性(またはそれらの比の対数)を仮定する.統計量の多くは比率なので, 0 から 1の間であるはずである.区間がこれらの限界の外側にかかっている場合,XLSTAT は自動的に区間の境界を修正する.

ternary diagramneural network diagram

Excelで動作する統計解析ソフトウェア。

14日間無償トライアルあり。