APACHE II

11.5.1 Prognose van IC-sterfte

De modellenreeksen Acute Physiology and Chronic Health Evaluation (APACHE-II (Knaus et al., 1991) en APACHE-IV (Zimmerman et al., 2006)) behoren tot de meest gebruikte op logistische regressie gebaseerde voorspellende modellen. Deze instrumenten worden gebruikt in intensive care units (ICU’s) om de sterfte in het ziekenhuis te voorspellen op basis van een verscheidenheid aan fysiologisch gebaseerde variabelen. De eerste versie van APACHE (Knaus et al., 1981) was opmerkelijk als het eerste klinische voorspellingsmodel dat uitsluitend gebruik maakte van objectieve fysiologische parameters om het resultaat te voorspellen, en was een op deskundigen gebaseerd scoresysteem dat deze parameters gebruikte om het risico op het resultaat in te schatten.

Zowel APACHE-II als APACHE-IV worden vandaag de dag nog steeds gebruikt voor onderzoek, kwaliteitscontrole, en klinische toepassingen. APACHE-II werd in 1985 gepubliceerd met gebruikmaking van een veel grotere set ontwikkelingsgegevens (5.815 opnames uit 13 ziekenhuizen) dan APACHE, en verbeterde het expert-gebaseerde scoringssysteem door de opname van een logistisch regressiemodel met gebruikmaking van de expert-gebaseerde fysiologie-score van een patiënt, de noodtoestand en aanpassingen voor bepaalde diagnostische categorieën. Het model vertoonde een goede discriminatie op verschillende onafhankelijke evaluatiesets (Jacobs e.a., 1987; Giangiuliani e.a., 1989; Chisakuta en Alexander, 1990; Turner e.a., 1991; Teskey e.a., 1991; Wong e.a., 1995), maar de kalibratie ervan bleek zeer variabel te zijn. Aangezien het model openbaar werd gemaakt, werd het in veel verschillende validatiestudies gebruikt.

APACHE-III werd gepubliceerd in 1991, en werd ontwikkeld als reactie op kritiek op de case-mix en de generaliseerbaarheid van APACHE-II. Het systeem werd ontwikkeld op basis van een database van 17.440 patiënten in 40 ICU’s in de Verenigde Staten. APACHE-III was een commercieel product en werd niet zo gemakkelijk beschikbaar gesteld aan de medische gemeenschap in het algemeen als APACHE-II, maar de uitgevoerde externe evaluaties waren vergelijkbaar met APACHE-II, en wezen op een goede discriminatie en een zeer variabele kalibratie (Zimmerman et al., 1998; Pappachan et al., 1999; Carneiro et al., 1997; von Bierbrauer et al., 1998; Bastos et al., 1996; Ihnsook et al., 2003; Rivera-Fernandez et al., 1998; Cook, 2000). APACHE-IV werd in 2006 geïntroduceerd als een grootschalige hermodellering van APACHE-III en is ook een commercieel product. Deze herziening omvatte de herziening van 42 van de 72 onderliggende APACHE-III vergelijkingen en de verwijdering van 11 vergelijkingen die niet langer geschikt waren, of niet langer in de klinische praktijk werden toegepast (Zimmerman et al., 2006).

Deze modellen blijven nuttig voor onderzoek, maar beperkingen in de kalibratie en bij verschillende patiëntenpopulaties hebben hun gebruik in sommige klinische situaties beperkt (vooral met betrekking tot de toepassing op individuele patiënten). Andere prognostische systemen voor de IC van volwassenen, die meer gangbaar zijn in Europa, zijn de Simplified Acute Physiologic Score SAPS-3, en het Mortality Prediction Model MPM-III. Het Sequential Organ Failure Assessment SOFA-model is ook gebruikt om de orgaanfunctie in de loop van de tijd te beoordelen. Deze modellen of hun vroegere versies zijn over de hele wereld uitvoerig vergeleken bij uiteenlopende patiëntenpopulaties. Tot op heden zijn er verschillende overzichten en vergelijkingen tussen deze modellen gepubliceerd (Vincent et al., 1996; Ohno-Machado et al., 2006; Castella et al., 1991; Rowan et al., 1994; Wilairatana et al., 1995; Del Bufalo et al., 1995; Castella et al., 1995; Moreno et al., 1998; Nouira et al., 1998; Tan, 1998; Patel and Grant, 1999; Vassar et al, 1999; Katsaragakis et al., 2000; Livingston et al., 2000; Capuzzo et al., 2000; Markgraf et al., 2000; Beck et al., 2003; Keegan et al., 2012; Vasilevskis et al., 2009; Hwang et al., 2012; Costa e Silva et al., 2011; Shrope-Mok et al., 2010).

Meerdere studies hebben logistische regressie vergeleken met kunstmatige neurale netwerken in dit domein. Clermont en collega’s (Clermont et al., 2001) vonden dat met een ontwikkelingsdataset van voldoende omvang (1.200), lokaal ontwikkelde logistische regressie en kunstmatige neurale netwerken gelijkwaardig presteerden in termen van zowel kalibratie (adequaat) als discriminatie (AUC’s variërend van 0,80 tot 0,84). De prestaties van beide modellen verslechterden echter naarmate de omvang van de ontwikkelingssteekproef afnam. Een andere kleinere studie met een ontwikkelreeks van 168 door Dybowski en collega’s (Dybowski et al., 1996) toonde een superieure discriminatie van het ANN in vergelijking met LR (respectievelijk 0,863 versus 0,753 AUC).

Enkele studies hebben het APACHE-II LR model vergeleken met ANNs. Nimgaonkar en collega’s (Nimgaonkar et al., 2004) vonden, na het ontwikkelen van een ANN op 1.962 patiënten in een Indiase ICU met de 22 APACHE-II variabelen, dat het ANN een superieure discriminatie had ten opzichte van APACHE-II (0,87 vs. 0,77 AUC, respectievelijk). Wong en collega’s (Wong en Young, 1999) voerden een soortgelijke vergelijking uit met een reeks ontwikkelingsgegevens van 2.932 patiënten in het VK, en vonden dat de twee methoden een gelijkwaardige discriminatie hadden (0,82 vs. 0,83 AUC voor ANN en APACHE, respectievelijk).

Vergelijkingen van kalibratie werden ook gedaan in sommige van de studies, maar deze waren problematisch omdat het LR-model was ontwikkeld op externe patiëntenpopulaties die niet verschilden van de lokale Britse en Indiase populaties die werden gebruikt voor de ANN-modellen. Vergelijkingen van discriminatie hebben niet op dezelfde manier met dit probleem te kampen.

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.