APACHE II

11.5.1 Prognose der Sterblichkeit auf der Intensivstation

Die Modelle der Reihe „Acute Physiology and Chronic Health Evaluation“ (APACHE-II (Knaus et al., 1991) und APACHE-IV (Zimmerman et al., 2006)) gehören zu den am weitesten verbreiteten Prognosemodellen auf der Grundlage logistischer Regression. Diese Instrumente werden auf Intensivstationen zur Vorhersage der Sterblichkeit im Krankenhaus auf der Grundlage einer Vielzahl physiologischer Variablen eingesetzt. Die erste Version von APACHE (Knaus et al., 1981) war das erste klinische Vorhersagemodell, das ausschließlich objektive physiologische Parameter zur Vorhersage des Ergebnisses verwendete und ein expertenbasiertes Scoring-System war, das diese Parameter zur Schätzung des Ergebnisrisikos nutzte.

Bei APACHE-II und APACHE-IV handelt es sich um Modelle, die auch heute noch für Forschung, Qualitätskontrolle und klinische Anwendungen verwendet werden. APACHE-II wurde 1985 unter Verwendung eines viel größeren Entwicklungsdatensatzes (5.815 Aufnahmen aus 13 Krankenhäusern) als APACHE veröffentlicht und verbesserte das expertenbasierte Scoring-System durch die Einbeziehung eines logistischen Regressionsmodells, das den expertenbasierten physiologischen Score eines Patienten, den Notfallstatus und Anpassungen für bestimmte diagnostische Kategorien verwendet. Das Modell zeigte eine gute Diskriminierung bei verschiedenen unabhängigen Auswertungen (Jacobs et al., 1987; Giangiuliani et al., 1989; Chisakuta und Alexander, 1990; Turner et al., 1991; Teskey et al., 1991; Wong et al., 1995), aber seine Kalibrierung erwies sich als sehr variabel. Da das Modell öffentlich zugänglich gemacht wurde, wurde es in vielen verschiedenen Validierungsstudien verwendet.

APACHE-III wurde 1991 veröffentlicht und als Reaktion auf die Kritik an der Fallzusammensetzung und der Verallgemeinerbarkeit von APACHE-II entwickelt. Das System wurde anhand einer Datenbank mit 17.440 Patienten aus 40 Intensivstationen in den Vereinigten Staaten entwickelt. APACHE-III war ein kommerzielles Produkt und wurde der breiten medizinischen Gemeinschaft nicht so leicht zugänglich gemacht wie APACHE-II, aber die durchgeführten externen Evaluierungen waren ähnlich wie bei APACHE-II, was auf eine gute Diskriminierung und eine sehr variable Kalibrierung hindeutet (Zimmerman et al., 1998; Pappachan et al., 1999; Carneiro et al., 1997; von Bierbrauer et al., 1998; Bastos et al., 1996; Ihnsook et al., 2003; Rivera-Fernandez et al., 1998; Cook, 2000). APACHE-IV wurde 2006 als eine groß angelegte Umgestaltung von APACHE-III eingeführt und ist ebenfalls ein kommerzielles Produkt. Im Rahmen dieser Umgestaltung wurden 42 der 72 APACHE-III-Gleichungen neu modelliert und 11 Gleichungen entfernt, die nicht mehr angemessen waren oder nicht mehr der klinischen Praxis entsprachen (Zimmerman et al., 2006).

Diese Modelle sind in der Forschung weiterhin nützlich, aber Einschränkungen bei der Kalibrierung und bei unterschiedlichen Patientenpopulationen haben ihre Verwendung in einigen klinischen Situationen eingeschränkt (insbesondere im Hinblick auf die Anwendung auf einzelne Patienten). Andere Prognosesysteme für die Intensivstation für Erwachsene, die in Europa weiter verbreitet sind, sind der Simplified Acute Physiologic Score SAPS-3 und das Mortalitätsvorhersagemodell MPM-III. Das SOFA-Modell (Sequential Organ Failure Assessment) wurde ebenfalls zur Beurteilung der Organfunktion im Zeitverlauf verwendet. Diese Modelle oder ihre früheren Versionen wurden weltweit bei unterschiedlichen Patientenpopulationen ausgiebig verglichen. Bisher wurden mehrere Übersichten und Vergleiche zwischen diesen Modellen veröffentlicht (Vincent et al., 1996; Ohno-Machado et al., 2006; Castella et al., 1991; Rowan et al., 1994; Wilairatana et al., 1995; Del Bufalo et al., 1995; Castella et al., 1995; Moreno et al., 1998; Nouira et al., 1998; Tan, 1998; Patel und Grant, 1999; Vassar et al, 1999; Katsaragakis et al., 2000; Livingston et al., 2000; Capuzzo et al., 2000; Markgraf et al., 2000; Beck et al., 2003; Keegan et al., 2012; Vasilevskis et al., 2009; Hwang et al., 2012; Costa e Silva et al., 2011; Shrope-Mok et al., 2010).

Mehrere Studien haben die logistische Regression mit künstlichen neuronalen Netzen in diesem Bereich verglichen. Clermont und Kollegen (Clermont et al., 2001) fanden heraus, dass bei einem ausreichend großen Entwicklungsdatensatz (1.200) die lokal entwickelte logistische Regression und künstliche neuronale Netze sowohl in Bezug auf die Kalibrierung (angemessen) als auch auf die Diskriminierung (AUCs zwischen 0,80 und 0,84) gleich gut abschnitten. Bei beiden Modellen kam es jedoch zu einer Leistungsverschlechterung, wenn der Umfang der Entwicklungsstichprobe abnahm. Eine weitere kleinere Studie von Dybowski und Kollegen (Dybowski et al., 1996) mit einem Entwicklungsset von 168 Personen zeigte eine bessere Diskriminierung des ANN im Vergleich zu LR (0,863 vs. 0,753 AUC).

Einige Studien haben das APACHE-II LR-Modell mit ANNs verglichen. Nimgaonkar und Kollegen (Nimgaonkar et al., 2004) fanden nach der Entwicklung eines ANN für 1.962 Patienten auf einer indischen Intensivstation mit den 22 APACHE-II-Variablen heraus, dass das ANN eine bessere Diskriminierung als APACHE-II aufwies (0,87 vs. 0,77 AUC). Wong und Kollegen (Wong und Young, 1999) führten einen ähnlichen Vergleich mit einem Entwicklungsdatensatz von 2.932 Patienten im Vereinigten Königreich durch und stellten fest, dass die beiden Methoden eine gleichwertige Diskriminierung aufwiesen (0,82 vs. 0,83 AUC für ANN bzw. APACHE).

Vergleiche der Kalibrierung wurden ebenfalls in einigen der Studien durchgeführt, waren jedoch problematisch, da das LR-Modell an externen Patientenpopulationen entwickelt wurde, die sich von den lokal abgeleiteten britischen und indischen Populationen unterscheiden, die für die ANN-Modelle verwendet wurden. Vergleiche der Diskriminierung haben dieses Problem nicht in gleicher Weise.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.