Utilidad y Validez de las Pruebas Diagnósticas

Unidad de Apoyo para el Aprendizaje

Iniciar

Introducción


El proceso diagnóstico es parte fundamental de la atención de un paciente; para su abordaje, los médicos utilizan, como primeras herramientas, el interrogatorio y la exploración física; sin embargo, con mucha frecuencia existe la necesidad de solicitar, interpretar y valorar diferentes pruebas que permitan apoyar o descartar un diagnóstico.

El desarrollo tecnológico de los últimos decenios ha permitido incorporar a la práctica clínica médica novedosos y sofisticados medios diagnósticos que, sin duda, constituyen adelantos en el perfeccionamiento del trabajo médico; no obstante, estos adelantos en el proceso diagnóstico se han acompañado también de una tendencia a su uso indiscriminado. Por esto, resulta de fundamental importancia que el médico conozca cómo valorar la utilidad de las diferentes pruebas diagnósticas, interpretando correctamente los distintos parámetros que definen su validez.

Conocer cuáles son las pruebas diagnósticas que se recomiendan para determinada patología es indispensable en el actuar médico; sin embargo, en un considerable número de patologías, las pruebas diagnósticas no son patognomónicas; es decir, no permiten asegurar con 100 % de probabilidad un diagnóstico específico y nos obligan a considerar diagnósticos diferenciales; de esta manera, es indispensable conocer los diferentes parámetros que se utilizan para valorar la utilidad de una prueba diagnóstica e interpretar, de manera adecuada, sus resultados, para su correcta aplicación en las diversas situaciones clínicas.

Con base en lo anterior, hemos elaborado esta herramienta, enfatizando los aspectos que te permitirán estimar e interpretar los parámetros para la validez de una prueba diagnóstica y, así, seleccionar la mejor prueba para tu paciente.






Distinguir la validez de una prueba diagnóstica y su correcta aplicación en la práctica médica, a través de la interpretación de los parámetros que permiten valorar su utilidad.

Validez de una prueba diagnóstica


La validez se refiere al grado en que una medición representa realmente lo que se pretende.

Una de las primeras consideraciones para conocer la eficacia de un método diagnóstico es medir su validez, la cual se refiere a valorar lo que realmente se quiere medir y mejorar las probabilidades de llegar al diagnóstico real del paciente; es decir, la validez de una prueba diagnóstica está definida por su capacidad para distinguir entre los individuos que tienen la enfermedad de aquellos que no.



Algunas consideraciones sobre una prueba diagnóstica

Sensibilidad y especificidad


Uno de los parámetros clásicos para evaluar una prueba diagnóstica es calcular su sensibilidad y especificidad para identificar sujetos enfermos y distinguir a los que no lo están.

Para evaluar la utilidad de una prueba diagnóstica, es indispensable diagnosticar la enfermedad en cuestión en los individuos en donde se aplicará la prueba en estudio. Para establecer el diagnóstico de la enfermedad, se utiliza el criterio de referencia, llamado anteriormente estándar de oro, que es aquel recurso diagnóstico que permite establecer o diferenciar entre los enfermos y los no enfermos; es aquella prueba que, hasta el momento, se reconoce como la mejor para establecer el diagnóstico de interés y que permite diferenciar entre pacientes que padecen la enfermedad de los que no.

En los estudios que se llevan a cabo para evaluar una prueba diagnóstica, es, por lo tanto, indispensable seleccionar el criterio de referencia aceptado hasta el momento como el mejor y contra el cual se retará la nueva prueba diagnóstica. Se trata de estimar qué tanto la prueba que se evaluará se acerca, en capacidad diagnóstica, al estándar o criterio de referencia.



Tabla de contingencia 2 X 2



Es una forma simple de considerar las relaciones entre los resultados de una prueba y el diagnóstico real. La prueba se considera positiva (+) o negativa (-); la enfermedad, presente (+) o ausente (-); por tanto, existen cuatro posibles interpretaciones de los resultados de la prueba, dos de los cuales son correctos y dos incorrectos. La prueba proporciona la respuesta correcta cuando es positiva en presencia de la enfermedad o negativa en ausencia de ésta; además, puede conducir a un error si es positiva, cuando la enfermedad está ausente (falso-positivo), o negativa, cuando la enfermedad está presente (falso-negativo).

En el siguiente video, puedes observar cómo se construye una tabla de contingencia de 2 X 2, que son las que utilizamos para medir la utilidad de una prueba diagnóstica:



Construcción de una tabla 2 x 2 para evaluar la validez de una prueba diagnóstica



A partir de la tabla de contingencia de 2 x 2, se puede calcular la sensibilidad y la especificidad, de acuerdo a las fórmulas señaladas en la siguiente tabla.

Fotografía del retiro de líderes APEC en la Casa Blanca

Tabla de 2 x 2 con fórmulas de sensibilidad y especificidad



La sensibilidad se define como la proporción de personas con una enfermedad y con resultado positivo en una prueba para detectar dicha enfermedad. Una prueba sensible casi nunca pasará por alto a pacientes que sufren la enfermedad.

La especificidad se refiere a la proporción de personas sin la enfermedad y con un resultado negativo en la prueba para detectarla. Una prueba específica rara vez clasificará como enfermas a personas que realmente no sufren la enfermedad.




La sensibilidad y especificidad se comunican en probabilidad o porcentaje y, a medida que se acercan a uno o a 100 %, si se maneja en porcentaje, se considera que la eficacia de la prueba es mayor.

Utilidad de la sensibilidad y la especificidad


Los médicos deben considerar la sensibilidad y especificidad de las pruebas diagnósticas al seleccionarlas dentro del proceso diagnóstico. En los círculos de cada una de las siguientes figuras puedes encontrar las recomendaciones para solicitar pruebas con alta sensibilidad o con alta especificidad:








Lo deseable es disponer de pruebas diagnósticas con alta sensibilidad y especificidad; sin embargo, esta situación no es frecuente, principalmente en aquellas pruebas cuyos resultados se traducen en un rango de valores; en este caso, existe una negociación entre los valores de sensibilidad y especificidad de acuerdo con el punto de corte, a partir del cual se clasificará el resultado como positivo o negativo o como normal o anormal. Cuando los resultados de la prueba se expresan en una escala continua, el valor de la sensibilidad sólo puede aumentarse a expensas de la especificidad.

Por ejemplo, en los niveles séricos de antígeno prostático, si se selecciona como punto de corte, para diferenciar resultados normales de anormales, en 4 ng/ml, la sensibilidad aumenta y la especificidad baja; en cambio, al seleccionar un punto de corte más alto, por ejemplo, en 9 ng/ml, la especificidad aumenta a expensas de bajar el porcentaje de la sensibilidad.

Curvas ROC


Una manera de visualizar los cambios entre sensibilidad y especificidad en las pruebas que se expresan en variables continuas y discretas es a través de las curvas conocidas como curvas ROC o características operativas del receptor (COR), ideadas por el ejército de Estados Unidos, para detectar aparatos japoneses a partir de sus señales y ruidos de radar; posteriormente, han sido aplicadas en otras áreas, entre ellas, la epidemiología y la investigación médica.

Las curvas ROC son una representación gráfica de la sensibilidad frente a 1−especificidad; es decir, es la relación entre los verdaderos positivos (sensibilidad) en el eje de las y, y los falsos positivos (1−especificidad) en el de las x. El mejor resultado posible se sitúa en el extremo superior izquierdo, el cual señala el 100 % de sensibilidad (ningún falso negativo) y el 100% de especificidad (ningún falso positivo). La exactitud de una prueba también puede describirse como el área bajo la curva ROC; a mayor área bajo la curva, mayor será la utilidad de la prueba.


Ejemplo:
Se diseñó y se validó una escala de síntomas de fácil aplicación para la detección de una enfermedad por reflujo gastroesofágico (ERGE). Los investigadores, de acuerdo con los resultados de la escala, exploraron cinco posibles puntos de corte para medir el constructo ERGE. En esta tabla, se pueden apreciar la sensibilidad (SE), especificidad (ES), valores predictivos positivo o negativo (VPP, VPN), razones de probabilidad positivo o negativo (RPP, RPN) y área bajo la curva (ABC) para cada punto de corte.


ERGE 1 2 3 4 5
SE % 100 95.6 91.6 84.4 73.3
ES % 72.9 86.4 94.9 96.6 98.3
VPP 91.8 95.5 98.2 98. 99.3
VPN 100 86.4 78.9 67.1 55.2
RPP 3.69 7.03 17.96 24.8 43.4
RPN 0 0.05 0.89 0.16 0.27
ABC 50 90.9 93.3 90.5 86

Para este ejemplo, el punto de corte recomendable sería el punto 3, debido a un adecuado balance entre sensibilidad, especificidad, VPP y VPN, así como entre RPP y RPN. Por otra parte, con este punto de corte, se verificó que el área bajo la curva es la mayor y el hombro de la curva, el más cercano al vértice.

           


Las curvas ROC también son utilizadas para comparar la eficacia de diferentes pruebas para un diagnóstico o de una prueba en varios estadios de una enfermedad.

En la siguiente gráfica, podemos observar las diferentes posibilidades de una curva ROC. La exactitud de la prueba aumenta a medida que la curva se desplaza desde la diagonal hacia el vértice superior izquierdo. Si la discriminación fuera perfecta —100 % sensibilidad y 100 % especificidad o 1-especificidad—, pasaría por dicho punto.

Interpretación de una curva ROC, de acuerdo con la eficacia de pruebas diagnósticas [imagen]. Tomada de Burgos, M y Materola, C. (2010). “Cómo interpretar un artículo sobre pruebas diagnósticas”, p. 306.



En la siguiente gráfica, podemos observar cómo a medida que el estadio de cáncer colorrectal aumenta, también crece la sensibilidad de la prueba del antígeno carcinoembrionario como prueba diagnóstica.



Interpretación de una curva ROC, de acuerdo con los estadios de la enfermedad [imagen]. Tomada de Fletcher, R. y Fletcher, S. (2008). “Diagnóstico”, p. 47.



La sensibilidad y la especificidad son propiedades de una prueba que deben tenerse en cuenta al momento de decidir si se utiliza dicha prueba; sin embargo, una vez que están disponibles los resultados de una prueba diagnóstica, ya sean positivos o negativos, la sensibilidad y la especificidad dejan de ser relevantes, ya que estos valores han sido obtenidos por personas en las que la presencia o ausencia de la enfermedad ya se conoce. En la práctica clínica, el médico frecuentemente se enfrenta al dilema de determinar si el paciente tiene una enfermedad específica, dado el resultado de una prueba, para lo cual son de mayor utilidad los valores predictivos.

Valor predictivo positivo y negativo


De acuerdo con los resultados de una prueba, la probabilidad de enfermedad se denomina valor predictivo de la prueba.





El valor predictivo no es una propiedad únicamente de la prueba, pues está determinado por la sensibilidad y especificidad, así como por la prevalencia de la enfermedad en la población objeto de estudio. Cuanto más sensible sea una prueba, mayor será su VPN; por tanto, mayor seguridad tendrá el médico de que un valor negativo descarta la enfermedad que se está buscando. A la inversa, cuanto más específica sea una prueba, mayor será su VPP y mayor seguridad tendrá el médico de que un resultado positivo confirma el diagnóstico que se está buscando.

En el siguiente esquema, se muestra cómo se obtienen los valores predictivos de una prueba diagnóstica.

Valores predictivos de una prueba diagnóstica



Cocientes de probabilidad positivo y negativo o razones de verosimilitud —likelihood ratios


En la toma de decisiones clínicas, cuando el médico tiene cierto grado de incertidumbre, generalmente, solicita una prueba para confirmar o descartar el diagnóstico, para lo cual los valores predictivos pueden resultar útiles; sin embargo, tienen la limitación de depender de la prevalencia, información que no siempre está a la mano y que puede variar de paciente a paciente. Considerando este inconveniente, es necesario que el médico conozca e interprete los cocientes de probabilidad o razón de verosimilitud (RV), que son índices menos populares que los anteriores, pero de mayor utilidad para interpretar y utilizar el resultado de una prueba diagnóstica.


Características de cocientes de probabilidad/razones de verosimilitud



En términos generales, estos cocientes sirven para estimar cuántas veces es, más o menos, probable que pacientes con la enfermedad tengan un determinado resultado, en comparación con pacientes sin la enfermedad.

La razón de verosimilitud o cociente de probabilidad positivo se obtiene de la proporción de personas enfermas con una prueba positiva (sensibilidad) entre la proporción de personas no enfermas con una prueba positiva (1−especificidad) y refleja qué frecuente es obtener un resultado positivo entre los enfermos, en comparación a los no enfermos. Para calcularlo, se aplica la siguiente fórmula:



La razón de verosimilitud o cociente de probabilidad negativo se obtiene de la proporción de personas enfermas con una prueba negativa (1−sensibilidad) entre la proporción de personas no enfermas con una prueba negativa (especificidad) y refleja qué frecuente es obtener un resultado negativo entre los enfermos en comparación a los no enfermos. Para calcularlo, se aplica la siguiente fórmula:





Si el CP+ es mayor que uno, se asocia con la presencia de enfermedad; entre más se aleje, por ejemplo < 10, más fuerte es la evidencia de su presencia. Si el CP– es menor que uno, se asocia con la ausencia de enfermedad; entre más se aleje, por ejemplo > 0.1, más fuerte es la evidencia de su ausencia.


Los cocientes de probabilidad nos permiten calcular la probabilidad posprueba o postest, para lo cual podemos convertir las probabilidades en posibilidades y aplicar fórmulas aritméticas; sin embargo, la probabilidad posprueba puede obtenerse de una manera más sencilla, utilizando el nomograma, desarrollado por Fagan en 1975; mediante éste, conociendo la probabilidad pretest o prevalencia y el resultado de los cocientes, podemos trazar una línea de intersección y obtener la probabilidad posprueba. Entre más cambie el valor de ésta, en comparación al valor de la probabilidad preprueba, mayor será la utilidad de la prueba diagnóstica. El nomograma de Fagan tiene tres columnas:

  • La primera es la probabilidad de tener la enfermedad antes de aplicar la prueba (prevalencia).
  • La segunda es el valor de la RV positiva (valores por encima del uno) y RV negativa (valores entre cero y uno).
  • La tercera es la probabilidad posprueba. Una vez conocida la posibilidad pretest y la RV positiva y negativa, se unen ambos valores con una línea recta. La prolongación de esta línea se corta en la tercera columna, marcando la probabilidad de tener la enfermedad en función del resultado de la prueba.

En el siguiente ejemplo, la probabilidad pretest de tener un cáncer de pulmón en pacientes hombres mayores de 65 años, fumadores con consumo acumulado de 60 paquetes/año, con síndrome consuntivo, hemoptisis y tos irritativa de más de tres meses, sabemos que es del 90 %, la RV positiva de 94 y la RV negativa 0.006. Aplicando la línea en el nomograma de Fagan, se obtiene una probabilidad positiva postest de > 99 %, y una negativa postest del 3 %. Esto significa que, en nuestro grupo de pacientes referidos, más del 99 % de los pacientes con radiografía de tórax patológica tendrá un cáncer de pulmón y que, si la radiografía de tórax es normal, sólo lo tendrán un 3 %, tal como se observa en el siguiente nomograma.



Establecer un diagnóstico es un proceso que, en ocasiones, resulta complejo; sin embargo, las pruebas diagnósticas son herramientas invaluables que apoyan al médico, para poder confirmar la hipótesis que realizó acerca de la naturaleza de la enfermedad del paciente, por lo que la confirmación de un diagnóstico a través de la interpretación adecuada de los parámetros que permiten valorar la eficacia de una prueba diagnóstica, revisados previamente, tiene gran significado para el médico, pero mucho más para el paciente. Para el médico, el diagnóstico es un objetivo ideal y elusivo, dispuesto a recordarnos nuestras limitaciones; para el paciente, significa eliminar la incertidumbre de saber que algo anda mal y no saber qué es.

Para reforzar y ejemplificar los conceptos que hemos estudiado en esta UAPA, te recomendamos revisar los siguientes artículos:

Molina, M y Ochoa, C. (2016, junio). Evaluación de la validez de las pruebas diagnósticas (I). Sensibilidad. Especificidad. Evidencias en Pediatría, 12 (2): 34.

Molina, M y Ochoa, C. (2016, septiembre). Evaluación de la validez de las pruebas diagnósticas (II). Valores predictivos. Evidencias en Pediatría, 12 (3): 53.

Actividad. Cálculo e interpretación de los parámetros de validez de una prueba diagnóstica

La validez de una prueba diagnóstica se evalúa mediante diferentes parámetros cuya interpretación adecuada le permiten al médico disponer de herramientas para aumentar la probabilidad de establecer un diagnóstico correcto, optimizando tiempo y recursos.


Autoevaluación. Validez de pruebas diagnósticas

A lo largo de esta unidad, revisaste los elementos necesarios para evaluar una prueba diagnóstica, la cual se compara con el estándar de referencia que nos permite el diagnóstico de certeza de la enfermedad; aprendiste a construir una tabla de contingencia de 2 x 2 para obtener los parámetros recomendados y evaluar la validez de una prueba diagnóstica y su correcta interpretación.

En la siguiente evaluación, podrás constatar tu nivel de comprensión sobre el tema estudiado, el cual es indispensable para que, en tu desempeño profesional, puedas brindar atención médica de calidad.


Fuentes de información

Básicas

Bibliografía

Burgos, M y Materola, C. (2010). Cómo interpretar un artículo sobre pruebas diagnósticas. Revista Chilena de Cirugía, 62(3), 301-308.

Fletcher, R. y Fletcher, S. (2008). Diagnóstico. En Epidemiología clínica (4.a ed.) (pp. 39-63). Barcelona: Lippincott Williams and Wilkins.

Fletcher, R., Fletcher, S. y Fletcher, G. (2016). Epidemiología clínica (5.a ed.). Barcelona: Lippincott Williams and Wilkins.

Hernández, M. y Mohar, A. (2006). Validez de pruebas diagnósticas. En Métodos clínicos y epidemiológicos de investigación médica. Ciudad de México: Elsevier.

Manterola, C. (2009). Cómo interpretar un artículo sobre pruebas diagnósticas. Revista Médica Clínica Las Condes, 20(5), 708-717.

Moreno, L. y López, S. (2013). Epidemiología clínica (3.a ed.). Ciudad de México: McGraw-Hill, pp. 1-9.


Complementarias

Bibliografía

Araujo, M. (2011, julio). Estudios sobre el diagnóstico de las enfermedades. Medwave, 11(107).

Cuello, C. (2015). Diagnóstico. Razonamiento clínico y pruebas diagnósticas. En Medicina basada en la evidencia. Fundamentos y su enseñanza en el contexto clínico (pp. 127-148). Ciudad de México: Médica Panamericana.

Segura, A. (2008, septiembre). Cribado de enfermedades y factores de riesgo en personas sanas: el lado oscuro de la fuerza. Humanitas. Humanidades Médicas, 31, 1-17.

Cómo citar

Ponciano, M. G., García, G. y Velasco, M. R. (2018). Utilidad y validez de las pruebas diagnósticas. Unidades de Apoyo para el Aprendizaje. CUAED/Facultad de Medicina-UNAM. Consultado el (fecha) de (vínculo)