Análisis detallado de sensibilidad y especificidad

El análisis de sensibilidad y especificidad le permite evaluar el desempeño de una prueba. Es disponible en nuestro programa de análisis estadístico XLSTAT.

¿Qué es el análisis detallado de sensibilidad y especificidad?

El análisis de sensibilidad y especificidad se utiliza para evaluar el rendimiento de una prueba. En medicina, puede emplearse para evaluar la eficacia de una prueba utilizada para diagnosticar una enfermedad o en el control de calidad para detectar la presencia de un defecto en un producto fabricado.

La función de sensibilidad y especificidad de XLSTAT permite calcular, entre otras cosas, la sensibilidad, la especificidad, la razón de momios, los valores predictivos y las razones de verosimilitud asociados a una prueba o a un método de detección.

¿Cuándo se elaboró este análisis?

Este método fue desarrollado por primera vez durante la Segunda Guerra Mundial para desarrollar medios eficaces para detectar aviones japoneses. Se aplicó entonces más general, para la detección de señales y la medicina que ahora es ampliamente utilizado.

El problema es el siguiente: se estudia un fenómeno, a menudo binario (por ejemplo, la presencia o ausencia de una enfermedad) y queremos desarrollar una prueba para detectar eficazmente la ocurrencia de un evento preciso (por ejemplo, la presencia de la enfermedad).

Podemos utilizar varias pruebas como los k vecinos más cercanos, el análisis discriminante lineal o cuadrático, la regresión logística, Lasso o Ridge..

Después de cada análisis, es necesario evaluar su desempeño y su capacidad de discriminacion de los positivos (ejemplo : enfermo) y de los negativos (ejemplo : sano).

Sea V la variable binaria o multinomial que describe el fenómeno para N individuos a los que se sigue. Anotamos por + los individuos para los que se produce el evento, y por - aquellos para los que no se produce. Sea T una prueba cuyo objetivo es detectar si el suceso se ha producido o no. T puede ser una variable binaria (presencia/ausencia), cualitativa (por ejemplo el color) o cuantitativa (por ejemplo una concentración). En el caso de las variables binarias o cualitativas, t1 es la categoría correspondiente a la ocurrencia del evento de interés. Para una variable cuantitativa, sea t1 el valor umbral por debajo o por encima del cual se supone que se produce el evento.

Imagine que estemos analizando un grupo de personas que han estado en contacto con un enfermo del Covid. Vamos a intentar predecir si van a enfermarse o no con un análisis estadístico. Podemos ver los resultados de sus pruebas en la tabla a continuación.

Podemos resumir los resultados en una tabla de contingencia:

Es por eso que, una vez que la prueba se ha aplicado a una población determinada, varios índices se utilizan para evaluar la prueba:

Verdaderos positivos (VP): Número de casos que la prueba declara positivos y que son verdaderamente positivos.
Falsos positivos (FP): Número de casos que la prueba declara positivos y que en realidad son negativos.
Verdaderos negativo (VN): Número de casos que la prueba declara negativos y que son realmente negativos.
Falsos negativos (FN): Número de casos que la prueba declara negativos y que en realidad son positivos.
N = TP + FP + FN + TN, el tamaño efectivo de la población evaluada.

Aquí tenemos:

10 personas en el grupo (N)
1 verdadero positivo (VP)
6 verdaderos negativos (VN)
1 falso positivo (FP)
2 falsos negativos (FN)

Vamos a seguir estudiando este ejemplo para que sea más claro y que al fin del artículo se conviertan en especialistas de este análisis !

PRUEBE EL ANALISIS

Los índices e interpretación

XLSTAT calcula los siguientes índices:

Sensibilidad (equivalente a la tasa de positivos verdaderos): Proporción de casos positivos que están bien detectadas por la prueba. La definición matemática es:

Sensibilidad = VP / (VP + FN)

En nuestro ejemplo, la sensibilidad es de 10/(10+20)=0.33. Significa que 33% de las personas positivas han sido predichas como positivas.

Especificidad (también llamada Tasa de verdaderos negativos): proporción de casos negativos que son bien detectadas por la prueba. La definición matemática es:

Especificidad = VN / (VN + FP)

En nuestro ejemplo, la especificidad es de 60/(60+10)=0.86. Significa que 86% de las personas negativas han sido predichas como negativas.

Tasa de falsos positivos (FPR): Proporción de casos negativos que la prueba detecta como positivos. La definición matemática es :

FPR = FP/(VN+FP)

En nuestro ejemplo, el FPR es de 10/(60+10)=0.14. Significa que 14% de las personas negativas han sido predichas como positivas.

Tasa de falsos negativos (FNR): Proporción de casos positivos que la prueba detecta como negativo.

La definición matemática es :

FNR = FN/(VP+FN)

En nuestro ejemplo, la prevalencia es de (20+10)/100=0.3. Significa que en verdad hay 30% de casos positivos en el grupo.

Prevalencia: la frecuencia relativa de los acontecimiento de interés en la muestra total (VP + FN) / N.

También existen más índices, como el VPP y el VPN.

¿Cómo se interpretan el VPP y el VPN?

Valor Predictivo Positivo (VPP): Proporción de casos verdaderamente positivos entre los casos positivos detectados por la prueba.

Tenemos PPV = VP / (VP + FP), o PPV = Sensibilidad x Prevalencia / [(Sensibilidad x Prevalencia + (1-Especificidad) (1-Prevalencia)]

Es un valor fundamental que depende de la prevalencia, un índice que es independiente de la calidad de la prueba.

En nuestro ejemplo, el valor es de 10/(10+10)=0.5. Significa que los verdaderos positivos representan 50% de los valores predichos como positivos.

Valor predictivo negativo (VPN): Proporción de casos verdaderamente negativos entre los casos negativos detectados por la prueba.

Tenemos VPN = VN / (VN + FN), o VPP = Especificidad x (1 - Prevalencia) / [(Especificidad (1-Prevalencia) + (1-sensibilidad) x Prevalencia]

Este índice depende también de la prevalencia que se independiente de la calidad de la prueba. En nuestro ejemplo, el valor es de 60/(60+20)=0.75. Significa que los verdaderos negativos representan 75% de los valores predichos como negativos.

Por último, algunos índices de ratio y de riesgo están disponibles en XLSTAT.

Razón de verosimilitud positiva (LR +): Esta relación indica a qué punto una persona tiene más posibilidades que la prueba la diagnostique positiva cuando está positiva en realidad que cuando está negativa en realidad.

Tenemos LR + = sensibilidad / (1-especificidad)

La RP + es un valor positivo o nulo.

En nuestro ejemplo, el valor es de 0.33/(1-0.86)=2.36. Significa que el método tiene una probabilidad 2.36 veces más importante de diagnosticar una persona como positiva cuando está positiva en realidad.

Razón de verosimilitud Negativa (LR-): Esta relación indica a qué punto una persona tiene más posibilidades que la prueba la diagnostique negativa cuando está negativa en realidad que cuando está positiva en realidad.

Tenemos LR-= (1-sensibilidad) / (especificidad)

El LR-es un valor positivo o nulo.

En nuestro ejemplo, el valor es de (1-0.33)/0.86=0.77. Significa que el método tiene la probabilidad de diagnosticar una persona como negativa cuando está negativa en realidad que solo representa 77% de la probabilidad de diagnosticarla negativa cuando está positiva.

Razón de momios: La razón de momios (o odds ratio) indica la cantidad de un individuo es más probable que sea positivo si el resultado es positivo, en comparación con los casos en que la prueba es negativa. Por ejemplo, un odds ratio de 2 significa que la probabilidad de que el caso positivo se produce es dos veces superior si la prueba es positiva que si es negativo. El odds ratio es un valor positivo o nulo.

Tenemos Odds ratio = VPxVN / (FPxFN)

En nuestro ejemplo, el odds ratio es de 10*60/10*20=3. Significa que es 3 veces más probable que el individuo sea positivo si la prueba es positiva que si la prueba es negativa.

El riesgo relativo: El riesgo relativo es un ratio que mide mejor la prueba se comporta cuando se trata de un informe positivo que cuando es negativo. Por ejemplo, un riesgo relativo de 2 significa que la prueba es dos veces más potente cuando es positiva que cuando es negativo. Un valor cercano a 1 corresponde a un caso de independencia entre las filas y columnas, y una prueba de que funciona tan bien cuando es positiva que cuando es negativo.

El riesgo relativo es un valor nulo o un valor positivo dado por: riesgo relativo = VP / (VP + FP) / (FN / (FN + VN)).

En nuestro ejemplo, el riesgo relativo es de 0.5/0.25=2. Significa que la prueba funciona 2 veces mejor para los positivos que para los negativos.

ESTUDIE LA CUALIDAD DE SUS PROPIAS PRUEBAS

Intervalos de confianza para el análisis de sensibilidad y especificidad

Se han propuesto varios métodos de cálculo de la varianza de los indices mencionados anteriormente y, por tanto, de sus intervalos de confianza. Existen dos familias: la primera se refiere a las proporciones, como la sensibilidad y la especificidad, y la segunda a los ratios, como LR+, LR- la razón de momios y el riesgo relativo.

Para las proporciones, XLSTAT permite utilizar los intervalos de Wald simples (Wald, 1939) o ajustados (Agresti y Coull, 1998), un cálculo basado en la puntuación de Wilson (Wilson, 1927), posiblemente con una corrección de continuidad, o los intervalos de Clopper-Pearson (1934). Agresti y Caffo recomiendan utilizar el intervalo de Wald ajustado o los intervalos de puntuación de Wilson.

En el caso de las proporciones, solo hay un método para calcular las varianzas, con o sin corrección de continuidad.

Una vez calculada la varianza de los indices, asumimos su normalidad asintótica (o de su logaritmo para los ratios) para determinar los intervalos de confianza. Muchos de los estadísticos son proporciones y deben estar entre 0 y 1. Si los intervalos no se encuentran dentro de estos límites, XLSTAT corrige automáticamente los límites del intervalo.

No dude en consultar nuestro tutorial sobre cómo ejecutar un análisis de sensibilidad y especificidad en XLSTAT.

Ver todos los tutoriales