11.5.1 Prognoza śmiertelności w OIT
Seria modeli oceny ostrej fizjologii i przewlekłego stanu zdrowia (APACHE-II (Knaus i wsp., 1991) i APACHE-IV (Zimmerman i wsp., 2006)) to jedne z najszerzej stosowanych modeli prognostycznych opartych na regresji logistycznej. Narzędzia te są wykorzystywane na oddziałach intensywnej terapii (OIT) do przewidywania śmiertelności wewnątrzszpitalnej na podstawie różnych zmiennych fizjologicznych. Pierwotna wersja APACHE (Knaus i wsp., 1981) była godna uwagi jako pierwszy kliniczny model prognostyczny wykorzystujący wyłącznie obiektywne parametry fizjologiczne do przewidywania wyniku i był to system punktacji oparty na ocenie ekspertów, wykorzystujący te parametry do oszacowania ryzyka wyniku.
Oba modele APACHE-II i APACHE-IV są nadal używane w badaniach, kontroli jakości i zastosowaniach klinicznych. APACHE-II został opublikowany w 1985 roku przy użyciu znacznie większego zbioru danych (5 815 przyjęć z 13 szpitali) niż APACHE i udoskonalił system punktacji oparty na wynikach eksperckich poprzez włączenie modelu regresji logistycznej wykorzystującego wynik fizjologii pacjenta oparty na wynikach eksperckich, stan zagrożenia i korekty dla pewnych kategorii diagnostycznych. Model ten wykazywał dobrą dyskryminację w różnych niezależnych zestawach ocen (Jacobs et al., 1987; Giangiuliani et al., 1989; Chisakuta i Alexander, 1990; Turner et al., 1991; Teskey et al., 1991; Wong et al., 1995), ale jego kalibracja okazała się wysoce zmienna. Ponieważ model ten był publicznie dostępny, wykorzystywano go w wielu różnych badaniach walidacyjnych.
APACHE-III opublikowano w 1991 roku, a opracowano go w odpowiedzi na krytykę dotyczącą zróżnicowania przypadków i możliwości uogólniania APACHE-II. System opracowano na podstawie bazy danych obejmującej 17 440 pacjentów z 40 oddziałów intensywnej terapii w Stanach Zjednoczonych. APACHE-III był produktem komercyjnym i nie był tak łatwo dostępny dla ogółu społeczności medycznej jak APACHE-II, ale przeprowadzone oceny zewnętrzne były podobne do APACHE-II, wskazując na dobrą dyskryminację i wysoce zmienną kalibrację (Zimmerman i wsp., 1998; Pappachan i wsp., 1999; Carneiro i wsp., 1997; von Bierbrauer i wsp., 1998; Bastos i wsp., 1996; Ihnsook i wsp., 2003; Rivera-Fernandez i wsp., 1998; Cook, 2000). APACHE-IV został wprowadzony w 2006 roku jako szeroko zakrojony remodeling APACHE-III i jest również produktem komercyjnym. Ta przebudowa obejmowała przebudowę 42 z 72 podstawowych równań APACHE III i usunięcie 11 równań, które nie były już odpowiednie lub nie znajdowały odzwierciedlenia w praktyce klinicznej (Zimmerman i wsp., 2006).
Modele te pozostają przydatne w badaniach, ale ograniczenia w kalibracji i w różnych populacjach pacjentów ograniczyły ich zastosowanie w niektórych sytuacjach klinicznych (szczególnie w odniesieniu do stosowania u poszczególnych pacjentów). Inne systemy prognostyczne dla oddziałów intensywnej terapii dla dorosłych, bardziej rozpowszechnione w Europie, to Simplified Acute Physiologic Score SAPS-3 i Mortality Prediction Model MPM-III. Model SOFA (Sequential Organ Failure Assessment) był również używany do oceny funkcji narządów w czasie. Te modele lub ich wcześniejsze wersje były szeroko porównywane na całym świecie w różnych populacjach pacjentów. Do tej pory opublikowano kilka przeglądów i porównań tych modeli (Vincent i wsp., 1996; Ohno-Machado i wsp., 2006; Castella i wsp., 1991; Rowan i wsp., 1994; Wilairatana i wsp., 1995; Del Bufalo i wsp., 1995; Castella i wsp., 1995; Moreno i wsp., 1998; Nouira i wsp., 1998; Tan, 1998; Patel i Grant, 1999; Vassar i wsp., 1999; Katsaragakis et al., 2000; Livingston et al., 2000; Capuzzo et al., 2000; Markgraf et al., 2000; Beck et al., 2003; Keegan et al., 2012; Vasilevskis et al., 2009; Hwang et al., 2012; Costa e Silva et al., 2011; Shrope-Mok et al., 2010).
Wielokrotne badania porównywały w tej dziedzinie regresję logistyczną ze sztucznymi sieciami neuronowymi. Clermont i współpracownicy (Clermont i in., 2001) stwierdzili, że w przypadku zbioru danych rozwojowych o wystarczającej wielkości (1200), lokalnie opracowana regresja logistyczna i sztuczne sieci neuronowe działały równoważnie zarówno pod względem kalibracji (odpowiednia), jak i dyskryminacji (AUC w zakresie od 0,80 do 0,84). Jednak oba modele doświadczały pogorszenia wydajności w miarę zmniejszania wielkości próby rozwojowej. W innym, mniejszym badaniu Dybowski i współpracownicy (Dybowski i in., 1996) wykazali wyższą dyskryminację ANN w porównaniu z LR (odpowiednio 0,863 vs. 0,753 AUC).
W niektórych badaniach porównano model APACHE-II LR z ANN. Nimgaonkar i współpracownicy (Nimgaonkar et al., 2004) stwierdzili, po opracowaniu ANN dla 1 962 pacjentów z indyjskiego oddziału intensywnej terapii z 22 zmiennymi APACHE-II, że ANN ma lepszą dyskryminację niż APACHE-II (odpowiednio 0,87 vs. 0,77 AUC). Wong i współpracownicy (Wong i Young, 1999) przeprowadzili podobne porównanie z zestawem danych rozwojowych obejmujących 2932 pacjentów w Wielkiej Brytanii i stwierdzili, że obie metody miały równoważną dyskryminację (0,82 vs. 0,83 AUC odpowiednio dla ANN i APACHE).
W niektórych badaniach przeprowadzono również porównania kalibracji, ale były one problematyczne, ponieważ model LR został opracowany na zewnętrznych populacjach pacjentów różniących się od lokalnie uzyskanych populacji brytyjskich i indyjskich wykorzystanych w modelach ANN. Porównania dyskryminacji nie mają tego problemu w ten sam sposób.
.