Escrito por la Profesora Nancy Devlin, Directora de Investigación del OHE y miembro del Grupo EuroQol
El EQ-5D es la medida de resultados reportados por los pacientes (PRO) más utilizada en todo el mundo. Desde hace un par de décadas, se utiliza en ensayos clínicos, estudios observacionales, encuestas de salud de la población y -más recientemente- en la recogida de datos rutinaria en los sistemas sanitarios. Al tratarse de un PRO genérico, y al ir acompañado de «conjuntos de valores» (también conocidos como «utilidades») utilizados en el cálculo de los AVAC (años de vida ajustados por calidad), el EQ-5D se ha convertido en la piedra angular de la evaluación de tecnologías sanitarias (HTA), afectando a importantes decisiones sobre el acceso a nuevos medicamentos.
Pero, a pesar de todo, los datos del EQ-5D a menudo no se comunican y se analizan de forma inadecuada. La conclusión es: si recoge estos datos de sus pacientes, debe comprometerse a asegurarse de que aprende lo máximo posible de lo que le dicen.
Así que: para cualquiera que recoja o informe de los datos del EQ-5D, aquí están mis recomendaciones sobre qué hacer con los datos del EQ-5D. Esto se aplica a la versión original de tres niveles, el EQ-5D-3L; a la versión de cinco niveles, el EQ-5D-5L; a la versión adaptada a los niños, el EQ-5D-Y – y podría decirse que a cualquier instrumento PRO.
1. ¿Qué hacer? Lo que no hay que hacer: no pasar directamente a las «utilidades» o al uso de puntuaciones de cualquier tipo para resumir los datos de los pacientes
Bien: ha recogido datos del EQ-5D. ¡Eso es genial por muchas razones! El EQ-5D es una forma fantástica de medir los resultados de salud de una forma genérica que puede compararse entre áreas de enfermedad. Un grupo de pacientes/personas han marcado casillas para describir su salud en las cinco dimensiones. Un enfoque común es resumir esas respuestas en un único número en una escala anclada en 1 (salud plena) utilizando los conjuntos de valores que están disponibles para ese fin (Szende et al 2007). Esto hace que el análisis de los datos sea mucho más fácil: después de todo, estadísticamente, los números únicos son más fáciles que los datos categóricos.
¿Trabajo hecho? Error!
Debe saber que:
- No existe una forma «neutral» u «objetiva» de resumir los datos del EQ-5D (o los datos de cualquier medida PRO, en realidad)
- Cualquiera que sea el «conjunto de valores» que utilice para resumir sus datos del EQ-5D, introducirá una fuente exógena de varianza en la inferencia estadística (Parkin, Devlin y Rice 2010), es decir, una varianza que no proviene de los datos que le han proporcionado sus pacientes. Las conclusiones sobre si hay diferencias estadísticamente significativas entre diferentes grupos de población o de pacientes -o entre diferentes brazos de un ensayo clínico- se ven afectadas por el conjunto de valores que se utilice. Existen importantes diferencias entre las propiedades estadísticas de los distintos conjuntos de valores disponibles para el EQ-5D. (Para más información, véase Parkin et al 2014. Actualmente estamos analizando estos mismos aspectos en relación con los datos del EQ-5D-5L, sobre los que informaremos próximamente en Feng et al 2016).
- ¡Tenga en cuenta de dónde proceden los valores! Los valores provienen de estudios de «preferencia declarada»: por convención, estos estudios recogen las opiniones de los miembros del público en general – a quienes se les pide que se imaginen viviendo con varios problemas de salud. Sabemos que hay diferencias entre el público en general y los pacientes en cuanto a sus puntos de vista y opiniones sobre lo buenos o malos que son los problemas de salud. Estos conjuntos de valores basados en las preferencias se desarrollaron con un propósito específico: estimar los AVAC. Si no se utilizan los datos del EQ-5D para estimar los AVAC, puede que no haya una razón muy sólida para utilizar conjuntos de valores para resumir los datos del EQ-5D.
Nota: nada de esto es una crítica al EQ-5D, sino todo lo contrario. El Grupo EuroQol está abierto a este tipo de cuestiones y las ha investigado ampliamente. Todos los demás PROs genéricos y específicos de la condición tienen exactamente los mismos problemas – simplemente no dicen mucho al respecto.
2. Observe las respuestas de los pacientes a los ítems de las preguntas (dimensiones)
¡No subestime la importancia y la utilidad de las buenas y viejas estadísticas descriptivas! Las estadísticas descriptivas de los datos PRO se infravaloran y no se comunican en los artículos, lo que es una pena.
Resumir los datos del EQ-5D por los conjuntos de valores no le dice mucho sobre qué aspectos de la salud del paciente o de la población se han visto más afectados por su condición, o han mejorado con el tratamiento. Para saberlo, hay que fijarse en los datos que los pacientes han proporcionado realmente: las casillas que han marcado en las preguntas del EQ-5D. Por ejemplo, debe informar siempre del número y el porcentaje de pacientes que declaran cada nivel de problema en cada dimensión del EQ-5D. Si quiere simplificar las cosas, también puede agrupar los niveles 2 y 3, e informar del número de pacientes que informan de «ningún» problema, y del número de pacientes que informan de «cualquier» problema.
Además de describir la salud de los pacientes en un momento dado, puede estar interesado en describir los cambios en la salud de los pacientes, por ejemplo, antes o después de la cirugía, o en varios momentos de un ensayo clínico, en comparación con el punto de partida.
Esto también se puede hacer a nivel de las dimensiones del EQ-5D. De nuevo, las estadísticas descriptivas pueden decir mucho. Por ejemplo, cuando analizamos el cambio en el número y el porcentaje de pacientes de prótesis de cadera del NHS que informaban de problemas por dimensión (véase la Tabla 1 a continuación), antes y después de la cirugía, descubrimos que había mejoras bastante sorprendentes en la ansiedad y la depresión de los pacientes, el autocuidado y el dolor/malestar, y no sólo en la movilidad (Devlin et al 2010). De hecho, lo sorprendente fue que ningún paciente tenía un «nivel 3» de movilidad antes de la cirugía, por lo que las únicas mejoras posibles como resultado de la cirugía fueron de «algunos» a «ningún» problema. ¿La razón? El nivel 3 en la dimensión de movilidad del EQ-5D-3L es «confinado en la cama», e incluso los pacientes con una movilidad muy pobre debido a problemas de cadera no están confinados en la cama. Ese es un problema del EQ-5D-3L -como hemos señalado anteriormente (Oppe et al 2011)- y se ha corregido en el nuevo EQ-5D-5L (Herdman et al 2014). Ninguna de estas cosas habría sido evidente si los datos de estos pacientes se hubieran analizado solo en términos de utilidades.
3. Resumir el cambio sin utilizar conjuntos de valores
Tablas como la mostrada anteriormente pueden ser muy informativas – pero son complicadas de ver, y a veces se requiere un resumen general. La buena noticia es que es fácil resumir los cambios en el estado de salud del EQ-5D, simplemente utilizando los datos que los pacientes han proporcionado.
En 2010, se nos ocurrió una forma de hacerlo, basada en los principios de una mejora de Pareto en la Economía del Bienestar – la Clasificación de Pareto del Cambio en la Salud (PCHC) (Devlin et al 2010). La idea es sencilla: se considera que un estado de salud EQ-5D es «mejor» que otro si es mejor en al menos una dimensión y no es peor en ninguna otra. Y un estado de salud EQ-5D se considera «peor» que otro si es peor en al menos una dimensión y no es mejor en ninguna otra. Utilizando ese principio para comparar los estados de salud del EQ-5D de un paciente entre dos períodos de tiempo cualesquiera, sólo hay 4 posibilidades:
– Su estado de salud es mejor
– Su estado de salud es peor
– Su estado de salud es exactamente el mismo
– Los cambios en la salud son «mixtos»: mejor en una dimensión, pero peor en otra.
Aplicando esto a los datos del reemplazo de cadera, encontramos que menos del 5% no tuvo ningún cambio, el 82% mejoró su salud, menos del 5% empeoró su salud y menos del 10% tuvo un cambio ‘mixto’ (Devlin et al 2010). En otras palabras, este sencillo análisis proporciona un resumen muy claro de lo que ocurre con la salud de los pacientes como resultado de la cirugía de cadera, sin depender de conjuntos de valores. También puso de manifiesto importantes diferencias en los beneficios de la cirugía de cadera, en comparación con otros tipos de cirugía electiva.
También hay otras formas de resumir los datos del EQ-5D. No voy a entrar en todos ellos aquí – pero hay una variedad de enfoques, y algunos tienen importantes limitaciones como una forma de resumir los datos de los pacientes. Un ejemplo de esto último es aproximar la «gravedad» general de un estado mediante su «puntuación de suma de niveles», que simplemente suma los niveles de cada dimensión. El mejor estado de salud del EQ-5D-3L implica no tener ningún problema en ninguna dimensión. Ningún problema» = 1, por lo que ningún problema (1+1+1+1+1) = 5. El problema más grave en cualquier dimensión = 3, por lo que el peor estado de salud es (3+3+3+3+3) = 15. Todos los demás estados de salud del EQ-5D-3L tendrán una puntuación de suma de niveles entre el mejor (5) y el peor (15). Esto también puede aplicarse al EQ-5D-5L, donde el mejor es de nuevo 5, y el peor es (5+5+5+5+5) = 25. Estas puntuaciones de suma de niveles pueden ser útiles en algunas situaciones, pero existen limitaciones obvias. Por ejemplo, 22222, 33211 y 11233 tienen la misma puntuación de suma de niveles (= 10). Y cada puntuación contiene un número muy diferente de perfiles potenciales (5 y 15 tienen un solo perfil cada uno; mientras que la puntuación de suma de niveles 10 contiene 51 perfiles). Además, el hecho de que pondere las dimensiones por igual no significa que esté «libre de juicios de valor»: la ponderación igual de las dimensiones representa en sí misma una opinión sobre su importancia (Parkin et al 2010).
4. ¡Utilice sus datos del EQ-VAS!
El EQ-VAS es una escala de 0 a 100 en la que se pide a los pacientes que indiquen su estado de salud general actual. Nosotros (¡hablando aquí como miembro del Grupo EuroQol!) consideramos que es una parte integral del cuestionario EQ-5D – pero a menudo se pasa por alto y no se reporta (o peor aún – ¡algunos usuarios lo dejan de lado en la recolección de datos, a pesar de que es una parte del instrumento de derechos de autor!) La EQ-VAS ofrece información importante y complementaria a la información sobre el estado de salud que proporcionan los pacientes cuando informan de su salud en la EQ-5D. De hecho, el EQ-5D es único como instrumento PRO al generar datos que muestran la evaluación general de los propios pacientes sobre su salud. No se trata de la opinión de otra persona sobre lo bueno o malo que es su estado de salud general, si se imagina que está en él, sino de la opinión de la persona que realmente lo experimenta. Por ejemplo, la EQ-VAS puede captar problemas que no se recogen en las 5 dimensiones de la EQ-5D, lo que podría revelar algunas lagunas en la EQ-5D relevantes para determinados grupos de pacientes (véase Feng et al., 2014). Esto ayuda a interpretar los datos del EQ-5D que ha recogido, y si podría haber alguna razón para sugerir que no capta completamente los efectos de los problemas de salud.
¿No está convencido? Eche un vistazo a este diagrama, que se ha generado a partir de las enormes cantidades de datos que posee el Grupo EuroQol. La EQ-VAS disminuye considerablemente en función de la edad de las personas que declaran tener problemas en la EQ-5D (es decir, a medida que aumenta la edad, también lo hacen los problemas declarados en las cinco dimensiones y también lo hace la salud general autoevaluada de los pacientes en la EQ-VAS). Pero, curiosamente, la EQ-VAS disminuye con la edad, incluso entre los pacientes que no declaran ningún problema en la EQ-5D. Esto sugiere que el EQ-VAS está midiendo algo un poco diferente y adicional a las cosas de las 5 dimensiones.
5. Por último, pero no menos importante: si necesita utilizar un conjunto de valores para resumir sus datos de EQ-5D -por ejemplo, para estimar los QALY- asegúrese de realizar un análisis de sensibilidad a conjuntos de valores alternativos.
Los conjuntos de valores son un producto de las decisiones de los investigadores sobre qué métodos utilizar y cómo modelar los datos. Esas decisiones pueden tener potencialmente un efecto no trivial en las características de los valores que se generan – por ejemplo, cuál es el valor mínimo, y cuántos valores negativos hay, y cómo es la distribución de los valores. Existe una falta de consenso entre los investigadores sobre qué métodos son los «mejores», y diferentes métodos, tanto para obtener valores como para modelarlos, pueden llevar a resultados diferentes.
La implicación es que los valores que se aplican a los datos del EQ-5D tienen cierta incertidumbre asociada. Pero entonces, también lo hace la evidencia sobre muchas otras cosas en el análisis de coste-efectividad, como la efectividad de las nuevas tecnologías, y sus costes. Así que, al igual que cualquier otro parámetro incierto en un modelo de rentabilidad, la implicación es que los analistas deben asegurarse de comprobar si sus conclusiones sobre la rentabilidad son sensibles a la elección del conjunto de valores. Y, cuando los conjuntos de valores informan de los intervalos de confianza (¡que es lo que deberían hacer todos!) esos intervalos de confianza también deberían formar parte del análisis de sensibilidad en el análisis de rentabilidad.
¿Quieres saber más? Referencias seleccionadas:
Devlin N, Parkin D, Browne J. (2010). Using the EQ-5D as a performance measurement tool in the NHS. Health Economics 19(8):886-905.
Parkin D, Devlin N, Rice N. (2010) Statistical analysis of EQ-5D profiles: does the use of value sets bias inference? Medical Decision Making 2010; 30:556-565