Análisis detallado de sensibilidad y especificidad

El análisis de sensibilidad y especificidad le permite evaluar el desempeño de una prueba. Es disponible en nuestro programa de análisis estadístico XLSTAT.

sensitivity-and-specificity-contingency-table-and-statistics.png

¿Qué es el análisis detallado de sensibilidad y especificidad?

Este método fue desarrollado por primera vez durante la Segunda Guerra Mundial para desarrollar medios eficaces para detectar aviones japoneses. Se aplicó entonces más general, para la detección de señales y la medicina que ahora es ampliamente utilizado.

El problema es el siguiente: se estudia un fenómeno, a menudo binario (por ejemplo, la presencia o ausencia de una enfermedad) y queremos desarrollar una prueba para detectar eficazmente la ocurrencia de un evento preciso (por ejemplo, la presencia de la enfermedad).

Podemos utilizar varias pruebas como los k vecinos más cercanos, el análisis discriminante lineal o cuadrático, la regresión logística, Lasso o Ridge..

Después de cada análisis, es necesario evaluar su desempeño y su capacidad de discriminacion de los positivos (ejemplo : enfermo) y de los negativos (ejemplo : sano).

Es por eso que, una vez que la prueba se ha aplicado a una población determinada, varios índices se utilizan para evaluar la prueba:

  • Verdaderos positivos (VP): Número de casos que la prueba declara positivos y que son verdaderamente positivos.
  • Falsos positivos (FP): Número de casos que la prueba declara positivos y que en realidad son negativos.
  • Verdaderos negativo (VN): Número de casos que la prueba declara negativos y que son realmente negativos.
  • Falsos negativos (FN): Número de casos que la prueba declara negativos y que en realidad son positivos.
  • N = TP + FP + FN + TN, el tamaño efectivo de la población evaluada.

Vamos a ver un ejemplo para que sea más claro y que al fin del artículo se conviertan en especialistas de este análisis !

PRUEBE EL ANALISIS

Los índices e interpretación

Imagine que estemos analizando un grupo de personas que han estado en contacto con un enfermo del Covid. Vamos a intentar predecir si van a enfermarse o no con un análisis estadístico. Tenemos :

  • 100 personas en el grupo (N)
  • 10 verdaderos positivos (TP)
  • 60 verdaderos negativos (TN)
  • 10 falsos positivos (FP)
  • 20 falsos negativos (FN)

XLSTAT calcula los siguientes índices:

Sensibilidad (equivalente a la tasa de positivos verdaderos): Proporción de casos positivos que están bien detectadas por la prueba. La definición matemática es:

Sensibilidad = VP / (VP + FN)


En nuestro ejemplo, la sensibilidad es de 10/(10+20)=0.33. Significa que 33% de las personas positivas han sido predichas como positivas.

Especificidad (también llamada Tasa de verdaderos negativos): proporción de casos negativos que son bien detectadas por la prueba. La definición matemática es:

Especificidad = VN / (VN + FP)


En nuestro ejemplo, la especificidad es de 60/(60+10)=0.86. Significa que 86% de las personas negativas han sido predichas como negativas.

Tasa de falsos positivos (FPR): Proporción de casos negativos que la prueba detecta como positivos. La definición matemática es :

FPR = FP/(TN+FP)

En nuestro ejemplo, el FPR es de 10/(60+10)=0.14. Significa que 14% de las personas negativas han sido predichas como positivas.

Tasa de falsos negativos (FNR): Proporción de casos positivos que la prueba detecta como negativo. 
La definición matemática es :

FNR = FN/(TP+FN)

En nuestro ejemplo, la prevalencia es de (20+10)/100=0.3. Significa que en verdad hay 30% de casos positivos en el grupo.

Prevalencia: la frecuencia relativa de los acontecimiento de interés en la muestra total (VP + FN) / N.

Valor Predictivo Positivo (PPV): Proporción de casos verdaderamente positivos entre los casos positivos detectados por la prueba.

Tenemos PPV = TP / (TP + FP), o PPV = Sensibilidad x Prevalencia / [(Sensibilidad x Prevalencia + (1-Especificidad) (1-Prevalencia)]

Es un valor fundamental que depende de la prevalencia, un índice que es independiente de la calidad de la prueba.

En nuestro ejemplo, el valor es de 10/(10+10)=0.5. Significa que los verdaderos positivos representan 50% de los valores predichos como positivos.

Valor predictivo negativo (VPN): Proporción de casos verdaderamente negativos entre los casos negativos detectados por la prueba.

Tenemos VPN = VN / (VN + FN), o VPP = Especificidad x (1 - Prevalencia) / [(Especificidad (1-Prevalencia) + (1-sensibilidad) x Prevalencia]

Este índice depende también de la prevalencia que se independiente de la calidad de la prueba. En nuestro ejemplo, el valor es de 60/(60+20)=0.75. Significa que los verdaderos negativos representan 75% de los valores predichos como negativos.

Razón de verosimilitud positiva (LR +): Esta relación indica
a qué punto una persona tiene más posibilidades que la prueba la diagnostique positiva cuando está positiva en realidad que cuando está negativa en realidad.

Tenemos LR + = sensibilidad / (1-especificidad)

La RP + es un valor positivo o nulo.

En nuestro ejemplo, el valor es de 0.33/(1-0.86)=2.36. Significa que el método tiene una probabilidad 2.36 veces más importante de diagnosticar una persona como positiva cuando está positiva en realidad.

Razón de verosimilitud Negativa (LR-): Esta relación indica
a qué punto una persona tiene más posibilidades que la prueba la diagnostique negativa cuando está negativa en realidad que cuando está positiva en realidad.

Tenemos LR-= (1-sensibilidad) / (especificidad)

El LR-es un valor positivo o nulo.

En nuestro ejemplo, el valor es de (1-0.33)/0.86=0.77. Significa que el método tiene la probabilidad de diagnosticar una persona como negativa cuando está negativa en realidad que solo representa 77% de la probabilidad de diagnosticarla negativa cuando está positiva.

Odds ratio: El odds ratio indica la cantidad de un individuo es más probable que sea positivo si el resultado es positivo, en comparación con los casos en que la prueba es negativa. Por ejemplo, un odds ratio de 2 significa que la probabilidad de que el caso positivo se produce es dos veces superior si la prueba es positiva que si es negativo. El odds ratio es un valor positivo o nulo.

Tenemos Odds ratio = VPxVN / (FPxFN)

En nuestro ejemplo, el odds ratio es de 10*60/10*20=3. Significa que es 3 veces más probable que el individuo sea positivo si la prueba es positiva que si la prueba es negativa.

El riesgo relativo: El riesgo relativo es un ratio que mide mejor la prueba se comporta cuando se trata de un informe positivo que cuando es negativo. Por ejemplo, un riesgo relativo de 2 significa que la prueba es dos veces más potente cuando es positiva que cuando es negativo. Un valor cercano a 1 corresponde a un caso de independencia entre las filas y columnas, y una prueba de que funciona tan bien cuando es positiva que cuando es negativo.

El riesgo relativo es un valor nulo o un valor positivo dado por: riesgo relativo = VP / (VP + FP) / (FN / (FN + VN)).

En nuestro ejemplo, el riesgo relativo es de 0.5/0.25=2. Significa que la prueba funciona 2 veces mejor para los positivos que para los negativos.

ESTUDIE LA CUALIDAD DE SUS PROPIAS PRUEBAS

 

ternary diagramneural network diagram

analice sus datos con xlstat

prueba gratuita de 14 días