APACHE II

11.5.1 Prognosi di mortalità in terapia intensiva

La serie di modelli APACHE-II (Knaus et al., 1991) e APACHE-IV (Zimmerman et al., 2006) costituiscono alcuni dei modelli predittivi basati sulla regressione logistica più utilizzati. Questi strumenti sono utilizzati nelle unità di terapia intensiva (ICU) per prevedere la mortalità in ospedale sulla base di una varietà di variabili fisiologiche. La versione iniziale di APACHE (Knaus et al., 1981) era notevole come il primo modello clinico predittivo ad utilizzare esclusivamente parametri fisiologici oggettivi per predire l’esito, ed era un sistema di punteggio basato sull’esperienza che utilizzava questi parametri per stimare il rischio di esito.

Sia APACHE-II che APACHE-IV rimangono in uso oggi per la ricerca, il controllo qualità e le applicazioni cliniche. APACHE-II è stato pubblicato nel 1985 utilizzando un set di dati di sviluppo molto più ampio (5.815 ricoveri da 13 ospedali) rispetto ad APACHE, e ha migliorato il sistema di punteggio basato sull’esperienza con l’inclusione di un modello di regressione logistica utilizzando il punteggio fisiologico basato sull’esperienza del paziente, lo stato di emergenza e gli aggiustamenti per alcune categorie diagnostiche. Il modello ha mostrato una buona discriminazione su diversi set di valutazione indipendenti (Jacobs et al., 1987; Giangiuliani et al., 1989; Chisakuta e Alexander, 1990; Turner et al., 1991; Teskey et al., 1991; Wong et al., 1995), ma la sua calibrazione è risultata molto variabile. Poiché il modello è stato reso disponibile al pubblico, è stato utilizzato in molti studi di validazione diversi.

APACHE-III è stato pubblicato nel 1991, essendo stato sviluppato in risposta alle critiche riguardanti il case-mix e la generalizzabilità di APACHE-II. Il sistema è stato sviluppato da un database di 17.440 pazienti in 40 ICU negli Stati Uniti. APACHE-III era un prodotto commerciale e non è stato reso facilmente disponibile alla comunità medica in generale come APACHE-II, ma le valutazioni esterne condotte sono state simili ad APACHE-II, indicando una buona discriminazione e una calibrazione altamente variabile (Zimmerman et al., 1998; Pappachan et al., 1999; Carneiro et al., 1997; von Bierbrauer et al., 1998; Bastos et al., 1996; Ihnsook et al., 2003; Rivera-Fernandez et al., 1998; Cook, 2000). APACHE-IV è stato introdotto nel 2006 come rimodellamento su larga scala di APACHE-III ed è anche un prodotto commerciale. Questo sforzo di rimodellamento ha incluso il rimodellamento di 42 delle 72 equazioni APACHE III sottostanti e la rimozione di 11 equazioni che non erano più appropriate o che non si riflettevano più nella pratica clinica (Zimmerman et al., 2006).

Questi modelli rimangono utili nella ricerca, ma le limitazioni nella calibrazione e nelle diverse popolazioni di pazienti hanno limitato il loro uso in alcune situazioni cliniche (in particolare rispetto all’applicazione ai singoli pazienti). Altri sistemi prognostici per la terapia intensiva dell’adulto, più comuni in Europa, sono il Simplified Acute Physiologic Score SAPS-3, e il Mortality Prediction Model MPM-III. Anche il modello Sequential Organ Failure Assessment SOFA è stato utilizzato per valutare la funzione degli organi nel tempo. Questi modelli o le loro versioni precedenti sono stati ampiamente confrontati in tutto il mondo in diverse popolazioni di pazienti. Ad oggi sono state pubblicate diverse revisioni e confronti tra questi modelli (Vincent et al., 1996; Ohno-Machado et al., 2006; Castella et al., 1991; Rowan et al., 1994; Wilairatana et al., 1995; Del Bufalo et al., 1995; Castella et al., 1995; Moreno et al., 1998; Nouira et al., 1998; Tan, 1998; Patel e Grant, 1999; Vassar et al, 1999; Katsaragakis et al., 2000; Livingston et al., 2000; Capuzzo et al., 2000; Markgraf et al., 2000; Beck et al., 2003; Keegan et al., 2012; Vasilevskis et al., 2009; Hwang et al., 2012; Costa e Silva et al., 2011; Shrope-Mok et al., 2010). Clermont e colleghi (Clermont et al., 2001) hanno scoperto che con un set di dati di sviluppo di dimensioni sufficienti (1.200), la regressione logistica sviluppata localmente e le reti neurali artificiali hanno funzionato in modo equivalente sia in termini di calibrazione (adeguata) che di discriminazione (AUC che vanno da 0,80 a 0,84). Tuttavia, entrambi i modelli hanno sperimentato degradazioni delle prestazioni man mano che la dimensione del campione di sviluppo diminuiva. Un altro studio più piccolo con un set di sviluppo di 168 intrapreso da Dybowski e colleghi (Dybowski et al., 1996) ha mostrato una discriminazione superiore della RNA rispetto alla LR (0.863 vs. 0.753 AUC, rispettivamente).

Alcuni studi hanno confrontato il modello APACHE-II LR con le RNA. Nimgaonkar e colleghi (Nimgaonkar et al., 2004) hanno trovato, dopo aver sviluppato un ANN su 1.962 pazienti in una ICU indiana con le 22 variabili APACHE-II, che l’ANN aveva una discriminazione superiore all’APACHE-II (0,87 vs. 0,77 AUC, rispettivamente). Wong e colleghi (Wong e Young, 1999) hanno effettuato un confronto simile con un set di dati di sviluppo di 2.932 pazienti nel Regno Unito, e hanno trovato che i due metodi avevano una discriminazione equivalente (0,82 vs. 0,83 AUC per ANN e APACHE, rispettivamente).

I confronti di calibrazione sono stati fatti anche in alcuni studi, ma erano problematici perché il modello LR è stato sviluppato su popolazioni di pazienti esterni disparati dalle popolazioni locali del Regno Unito e indiane utilizzate per i modelli ANN. I confronti di discriminazione non soffrono di questo problema allo stesso modo.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.