h3>11.5.1 Prognóstico da mortalidade na UTI
As séries de modelos de Avaliação Fisiológica Aguda e Saúde Crônica (APACHE-II (Knaus et al., 1991) e APACHE-IV (Zimmerman et al., 2006)) constituem alguns dos modelos preditivos baseados em regressão logística mais amplamente utilizados. Essas ferramentas são utilizadas em unidades de terapia intensiva (UTIs) para prever a mortalidade hospitalar com base em uma variedade de variáveis fisiológicas. A versão inicial do APACHE (Knaus et al., 1981) foi notável como o primeiro modelo preditivo clínico a usar exclusivamente parâmetros fisiológicos objetivos para prever o desfecho, e foi um sistema de pontuação baseado em expertos usando esses parâmetros para estimar o risco de desfecho.
Both APACHE-II e APACHE-IV permanecem em uso hoje em dia para pesquisa, controle de qualidade e aplicações clínicas. O APACHE-II foi publicado em 1985 usando um conjunto de dados de desenvolvimento muito maior (5.815 admissões de 13 hospitais) do que o APACHE, e melhorou o sistema de pontuação baseado em especialistas com a inclusão de um modelo de regressão logística usando um escore fisiológico baseado em especialistas do paciente, estado de emergência e ajustes para certas categorias diagnósticas. O modelo mostrou boa discriminação em diferentes conjuntos de avaliação independentes (Jacobs et al., 1987; Giangiuliani et al., 1989; Chisakuta e Alexander, 1990; Turner et al., 1991; Teskey et al., 1991; Wong et al., 1995), mas sua calibração foi considerada altamente variável. Como o modelo foi disponibilizado publicamente, ele foi utilizado em diversos estudos de validação.
APACHE-III foi publicado em 1991, tendo sido desenvolvido em resposta a críticas sobre a mistura de casos e generalização do APACHE-II. O sistema foi desenvolvido a partir de uma base de dados de 17.440 pacientes em 40 UTIs nos Estados Unidos. O APACHE-III foi um produto comercial e não foi disponibilizado à comunidade médica em geral tão facilmente quanto o APACHE-II, mas as avaliações externas realizadas foram semelhantes ao APACHE-II, indicando boa discriminação e calibração altamente variável (Zimmerman et al., 1998; Pappachan et al., 1999; Carneiro et al., 1997; von Bierbrauer et al., 1998; Bastos et al., 1996; Ihnsook et al., 2003; Rivera-Fernandez et al., 1998; Cook, 2000). O APACHE-IV foi introduzido em 2006 como uma remodelação em larga escala do APACHE-III e é também um produto comercial. Esse esforço de remodelação incluiu a remodelação 42 das 72 equações subjacentes ao APACHE III e a remoção de 11 equações que não eram mais apropriadas ou não mais refletidas na prática clínica (Zimmerman et al., 2006).
Esses modelos continuam sendo úteis na pesquisa, mas as limitações na calibração e em populações de pacientes díspares têm restringido seu uso em algumas situações clínicas (particularmente no que diz respeito à aplicação a pacientes individuais). Outros sistemas prognósticos para a UTI adulta, mais comuns na Europa, são o Simplified Acute Physiologic Score SAPS-3 e o Mortality Prediction Model MPM-III. O modelo Sequential Organ Failure Assessment SOFA também tem sido utilizado para avaliar a função dos órgãos ao longo do tempo. Estes modelos ou suas versões anteriores têm sido amplamente comparados em todo o mundo em diferentes populações de pacientes. Várias revisões e comparações entre esses modelos foram publicadas até o momento (Vincent et al., 1996; Ohno-Machado et al., 2006; Castella et al., 1991; Rowan et al., 1994; Wilairatana et al., 1995; Del Bufalo et al., 1995; Castella et al., 1995; Moreno et al., 1998; Nouira et al., 1998; Tan, 1998; Patel e Grant, 1999; Vassar et al, 1999; Katsaragakis et al., 2000; Livingston et al., 2000; Capuzzo et al., 2000; Markgraf et al., 2000; Beck et al., 2003; Keegan et al., 2012; Vasilevskis et al., 2009; Hwang et al., 2012; Costa e Silva et al., 2011; Shrope-Mok et al., 2010).
Estudos múltiplos têm comparado a regressão logística com redes neurais artificiais neste domínio. Clermont e colegas (Clermont et al., 2001) descobriram que com um conjunto de dados de desenvolvimento de tamanho suficiente (1.200), regressão logística desenvolvida localmente e redes neurais artificiais realizadas de forma equivalente tanto em termos de calibração (adequada) quanto de discriminação (AUCs variando de 0,80 a 0,84). Entretanto, ambos os modelos sofreram degradações de desempenho à medida que o tamanho da amostra de desenvolvimento diminuiu. Outro estudo menor com um conjunto de desenvolvimento de 168 realizado por Dybowski e colegas (Dybowski et al., 1996) mostrou discriminação superior da ANN em relação à RL (0,863 vs. 0,753 AUC, respectivamente).
alguns estudos compararam o modelo APACHE-II LR com as ANNs. Nimgaonkar e colegas (Nimgaonkar et al., 2004) encontraram, após desenvolver uma ANN em 1.962 pacientes em uma UTI indiana com as 22 variáveis APACHE-II, que a ANN tinha discriminação superior à APACHE-II (0,87 vs. 0,77 AUC, respectivamente). Wong e colegas (Wong e Young, 1999) realizaram uma comparação semelhante com um conjunto de dados de desenvolvimento de 2.932 pacientes no Reino Unido, e constataram que os dois métodos tinham discriminação equivalente (0,82 vs. 0,83 AUC para ANN e APACHE, respectivamente).
Comparações de calibração também foram feitas em alguns dos estudos, mas foram problemáticas porque o modelo LR foi desenvolvido em populações de pacientes externos diferentes das populações britânicas e indianas derivadas localmente utilizadas para os modelos ANN. As comparações de discriminação não sofrem deste problema da mesma forma.