APACHE II

11.5.1 Pronóstico de la mortalidad en la UCI

La serie de modelos de fisiología aguda y evaluación crónica de la salud (APACHE-II (Knaus et al., 1991) y APACHE-IV (Zimmerman et al., 2006)) constituyen algunos de los modelos predictivos basados en la regresión logística más utilizados. Estas herramientas se utilizan en las unidades de cuidados intensivos (UCI) para predecir la mortalidad intrahospitalaria en función de diversas variables de base fisiológica. La versión inicial de APACHE (Knaus et al., 1981) destacó por ser el primer modelo predictivo clínico que utilizaba exclusivamente parámetros fisiológicos objetivos para predecir el resultado, y era un sistema de puntuación basado en expertos que utilizaba estos parámetros para estimar el riesgo de resultado.

Tanto APACHE-II como APACHE-IV siguen utilizándose hoy en día para la investigación, el control de calidad y las aplicaciones clínicas. El APACHE-II se publicó en 1985 utilizando un conjunto de datos de desarrollo mucho mayor (5.815 ingresos de 13 hospitales) que el APACHE, y mejoró el sistema de puntuación basado en expertos con la inclusión de un modelo de regresión logística que utilizaba la puntuación de fisiología basada en expertos de un paciente, el estado de emergencia y ajustes para ciertas categorías de diagnóstico. El modelo mostró una buena discriminación en diferentes conjuntos de evaluaciones independientes (Jacobs et al., 1987; Giangiuliani et al., 1989; Chisakuta y Alexander, 1990; Turner et al., 1991; Teskey et al., 1991; Wong et al., 1995), pero su calibración resultó ser muy variable. Desde que el modelo se puso a disposición del público, se utilizó en muchos estudios de validación diferentes.

El APACHE-III se publicó en 1991, habiéndose desarrollado en respuesta a las críticas relativas a la casuística y la generalizabilidad del APACHE-II. El sistema se desarrolló a partir de una base de datos de 17.440 pacientes de 40 UCI de Estados Unidos. El APACHE-III era un producto comercial y no se puso a disposición de la comunidad médica en general tan fácilmente como el APACHE-II, pero las evaluaciones externas realizadas fueron similares a las del APACHE-II, indicando una buena discriminación y una calibración muy variable (Zimmerman et al., 1998; Pappachan et al., 1999; Carneiro et al., 1997; von Bierbrauer et al., 1998; Bastos et al., 1996; Ihnsook et al., 2003; Rivera-Fernández et al., 1998; Cook, 2000). APACHE-IV se introdujo en 2006 como una remodelación a gran escala de APACHE-III y también es un producto comercial. Este esfuerzo de remodelación incluyó la remodelación de 42 de las 72 ecuaciones subyacentes de APACHE III y la eliminación de 11 ecuaciones que ya no eran apropiadas, o que ya no se reflejaban en la práctica clínica (Zimmerman et al., 2006).

Estos modelos siguen siendo útiles en la investigación, pero las limitaciones en la calibración y a través de poblaciones de pacientes dispares han restringido su uso en algunas situaciones clínicas (particularmente con respecto a la aplicación a pacientes individuales). Otros sistemas de pronóstico para la UCI de adultos, más comunes en Europa, son el Simplified Acute Physiologic Score SAPS-3, y el Mortality Prediction Model MPM-III. También se ha utilizado el modelo SOFA (Sequential Organ Failure Assessment) para evaluar la función de los órganos a lo largo del tiempo. Estos modelos o sus versiones anteriores se han comparado ampliamente en todo el mundo en distintas poblaciones de pacientes. Hasta la fecha se han publicado varias revisiones y comparaciones entre estos modelos (Vincent et al., 1996; Ohno-Machado et al., 2006; Castella et al., 1991; Rowan et al., 1994; Wilairatana et al., 1995; Del Bufalo et al., 1995; Castella et al., 1995; Moreno et al., 1998; Nouira et al., 1998; Tan, 1998; Patel y Grant, 1999; Vassar et al, 1999; Katsaragakis et al., 2000; Livingston et al., 2000; Capuzzo et al., 2000; Markgraf et al., 2000; Beck et al., 2003; Keegan et al., 2012; Vasilevskis et al., 2009; Hwang et al., 2012; Costa e Silva et al., 2011; Shrope-Mok et al., 2010).

Múltiples estudios han comparado la regresión logística con las redes neuronales artificiales en este ámbito. Clermont y sus colegas (Clermont et al., 2001) descubrieron que con un conjunto de datos de desarrollo de tamaño suficiente (1.200), la regresión logística desarrollada localmente y las redes neuronales artificiales tenían un rendimiento equivalente tanto en términos de calibración (adecuada) como de discriminación (AUCs que oscilaban entre 0,80 y 0,84). Sin embargo, ambos modelos experimentaron una degradación del rendimiento a medida que el tamaño de la muestra de desarrollo disminuía. Otro estudio más pequeño con un conjunto de desarrollo de 168 realizado por Dybowski y colegas (Dybowski et al., 1996) mostró una discriminación superior de la RNA en comparación con la RL (0,863 frente a 0,753 de AUC, respectivamente).

Algunos estudios han comparado el modelo APACHE-II LR con las RNA. Nimgaonkar y colegas (Nimgaonkar et al., 2004) encontraron, tras desarrollar una RNA en 1.962 pacientes de una UCI india con las 22 variables de APACHE-II, que la RNA tenía una discriminación superior a la de APACHE-II (0,87 frente a 0,77 de AUC, respectivamente). Wong y sus colegas (Wong y Young, 1999) realizaron una comparación similar con un conjunto de datos de desarrollo de 2.932 pacientes en el Reino Unido, y descubrieron que los dos métodos tenían una discriminación equivalente (0,82 frente a 0,83 de AUC para la RNA y el APACHE, respectivamente).

También se realizaron comparaciones de calibración en algunos de los estudios, pero resultaron problemáticas porque el modelo LR se desarrolló en poblaciones de pacientes externas distintas de las poblaciones del Reino Unido y la India derivadas localmente y utilizadas para los modelos RNA. Las comparaciones de la discriminación no sufren este problema de la misma manera.

Deja una respuesta

Tu dirección de correo electrónico no será publicada.