11.5.1 Prognostisering av dödlighet på intensivvårdsavdelningen
Modellerna i serien Acute Physiology and Chronic Health Evaluation (APACHE-II (Knaus et al., 1991) och APACHE-IV (Zimmerman et al., 2006)) är några av de mest använda prognosmodellerna baserade på logistisk regression. Dessa verktyg används på intensivvårdsavdelningar (ICU) för att förutsäga dödlighet på sjukhus baserat på en mängd fysiologiskt baserade variabler. Den första versionen av APACHE (Knaus et al., 1981) var anmärkningsvärd som den första kliniska prediktiva modellen som uteslutande använde objektiva fysiologiska parametrar för att förutsäga utfallet, och var ett expertbaserat poängsystem som använde dessa parametrar för att uppskatta risken för utfallet.
Både APACHE-II och APACHE-IV används fortfarande idag för forskning, kvalitetskontroll och kliniska tillämpningar. APACHE-II publicerades 1985 med hjälp av en mycket större uppsättning utvecklingsdata (5 815 intagningar från 13 sjukhus) än APACHE, och förbättrade det expertbaserade poängsystemet genom att inkludera en logistisk regressionsmodell med hjälp av en expertbaserad fysiologipoäng för patienten, akutstatus och justeringar för vissa diagnostiska kategorier. Modellen visade god diskriminering på olika oberoende utvärderingsuppsättningar (Jacobs et al., 1987; Giangiuliani et al., 1989; Chisakuta och Alexander, 1990; Turner et al., 1991; Teskey et al., 1991; Wong et al., 1995), men dess kalibrering visade sig vara mycket varierande. Eftersom modellen gjordes allmänt tillgänglig användes den i många olika valideringsstudier.
APACHE-III publicerades 1991, efter att ha utvecklats som svar på kritik mot APACHE-II:s case-mix och generaliserbarhet. Systemet utvecklades utifrån en databas med 17 440 patienter på 40 intensivvårdsavdelningar i USA. APACHE-III var en kommersiell produkt och gjordes inte lika lätt tillgänglig för det medicinska samfundet i stort som APACHE-II, men de externa utvärderingar som utfördes liknade APACHE-II och visade på god diskriminering och mycket varierande kalibrering (Zimmerman et al., 1998; Pappachan et al., 1999; Carneiro et al., 1997; von Bierbrauer et al., 1998; Bastos et al., 1996; Ihnsook et al., 2003; Rivera-Fernandez et al., 1998; Cook, 2000). APACHE-IV introducerades 2006 som en storskalig ombyggnad av APACHE-III och är också en kommersiell produkt. Denna omformning omfattade en omformning av 42 av de 72 underliggande APACHE-III-ekvationerna och avlägsnande av 11 ekvationer som inte längre var lämpliga eller inte längre återspeglades i klinisk praxis (Zimmerman et al., 2006).
Dessa modeller förblir användbara inom forskningen, men begränsningar i kalibreringen och i olika patientpopulationer har begränsat användningen av dem i vissa kliniska situationer (särskilt när det gäller tillämpningen på enskilda patienter). Andra prognossystem för intensivvårdsavdelningen för vuxna, som är vanligare i Europa, är Simplified Acute Physiologic Score SAPS-3 och Mortality Prediction Model MPM-III. Sequential Organ Failure Assessment SOFA-modellen har också använts för att bedöma organfunktionen över tid. Dessa modeller eller deras tidigare versioner har jämförts flitigt över hela världen i olika patientpopulationer. Flera översikter och jämförelser mellan dessa modeller har hittills publicerats (Vincent et al., 1996; Ohno-Machado et al., 2006; Castella et al., 1991; Rowan et al., 1994; Wilairatana et al., 1995; Del Bufalo et al., 1995; Castella et al., 1995; Moreno et al., 1998; Nouira et al., 1998; Tan, 1998; Patel och Grant, 1999; Vassar et al, 1999; Katsaragakis et al., 2000; Livingston et al., 2000; Capuzzo et al., 2000; Markgraf et al., 2000; Beck et al., 2003; Keegan et al., 2012; Vasilevskis et al., 2009; Hwang et al., 2012; Costa e Silva et al., 2011; Shrope-Mok et al., 2010).
Flera studier har jämfört logistisk regression med artificiella neurala nätverk på detta område. Clermont och kollegor (Clermont et al., 2001) fann att med ett tillräckligt stort utvecklingsdataset (1 200), utförde lokalt utvecklad logistisk regression och artificiella neurala nätverk likvärdiga resultat när det gäller både kalibrering (adekvat) och diskriminering (AUC mellan 0,80 och 0,84). Båda modellerna fick dock sämre prestanda när urvalet för utveckling minskade. En annan mindre studie med en utvecklingsuppsättning på 168 som genomfördes av Dybowski och medarbetare (Dybowski et al., 1996) visade att ANN:s diskrimineringsförmåga var överlägsen jämfört med LR:s (0,863 respektive 0,753 AUC).
En del studier har jämfört APACHE-II LR-modellen med ANN:s. Nimgaonkar och medarbetare (Nimgaonkar et al., 2004) fann, efter att ha utvecklat en ANN på 1 962 patienter på en indisk intensivvårdsavdelning med de 22 APACHE-II-variablerna, att ANN hade överlägsen diskrimineringsförmåga jämfört med APACHE-II (0,87 respektive 0,77 AUC). Wong och kollegor (Wong och Young, 1999) gjorde en liknande jämförelse med ett utvecklingsdataset på 2 932 patienter i Storbritannien och fann att de två metoderna hade likvärdig diskriminering (0,82 vs. 0,83 AUC för ANN respektive APACHE).
Kalibreringsjämförelser gjordes också i några av studierna, men de var problematiska eftersom LR-modellen utvecklades på externa patientpopulationer som var olikartade från de lokalt härledda brittiska och indiska populationer som användes för ANN-modellerna. Jämförelser av diskriminering lider inte av detta problem på samma sätt.