APACHE II

11.5.1 ICU死亡の予後

急性生理学と慢性健康評価の一連のモデル(APACHE-II(Knausら、1991)およびAPACHE-IV(Zimmermanら、2006))は最も広く用いられているロジスティック回帰ベースの予測モデルの一部を構成しています。 これらのツールは、集中治療室(ICU)で、さまざまな生理学的変数に基づいて院内死亡率を予測するために使用されている。 APACHEの初期バージョン(Knausら、1981)は、転帰を予測するために客観的な生理学的パラメータのみを使用した最初の臨床予測モデルとして注目され、これらのパラメータを使用して転帰のリスクを推定する専門家ベースのスコアリングシステムであった。 APACHE-IIは、1985年に、APACHEよりもはるかに大規模な開発データセット(13病院から5,815人の入院患者)を用いて発表され、患者のエキスパートベースの生理学スコア、救急状況、特定の診断カテゴリーの調整を用いたロジスティック回帰モデルを含めることによって、エキスパートベースのスコアシステムを改良したものであった。 このモデルは、さまざまな独立した評価セットで良好な識別性を示したが (Jacobs et al., 1987; Giangiuliani et al., 1989; Chisakuta and Alexander, 1990; Turner et al., 1991; Teskey et al., 1991; Wong et al., 1995) 、その適合性は大きく変動することが判明している。

APACHE-IIIは、APACHE-IIのケースミックスと一般化に関する批判に応えて開発され、1991年に発表されました。 このシステムは,米国の40のICUにおける17,440人の患者を対象としたデータベースから開発された。 APACHE-IIIは市販品であったため、APACHE-IIほどには医療界に普及しなかったが、外部評価はAPACHE-IIと同様であり、良好な識別性と高い可変性を示した(Zimmermanら、1998;Pappachanら、1999;Carneiroら、1997;von Bierbrauerら、1998;Bastosら、1996;Ihnsookら、2003;Rivera-Fernandezら、1998;Cook、2000;)。 APACHE-IVは、APACHE-IIIの大規模なリモデリングとして2006年に発表され、製品化もされています。

これらのモデルは、研究においては依然として有用であるが、キャリブレーションにおける制限や、異なる患者集団全体における制限により、一部の臨床状況(特に個々の患者への適用に関して)での使用は制限されている。 ヨーロッパでより一般的な成人ICU用の他の予後システムは、Simplified Acute Physiologic Score SAPS-3、Mortality Prediction Model MPM-IIIである。 また、Sequential Organ Failure Assessment SOFAモデルも経時的な臓器機能の評価に使用されている。 これらのモデルやその初期バージョンは、世界中でさまざまな患者集団において広範囲に比較されてきた。 現在までにいくつかのレビューとこれらのモデル間の比較が発表されている(Vincentら、1996;Ohno-Machadoら、2006;Castellaら、1991;Rowanら、1994;Wilairatanaら、1995;Del Bufaloら、1995;Castellaら、1995;Morenoら、1998;Nouiraら、1998;Tan、1998;Patel and Grant、1999;Vassarら、.1999;Tanら、1991;Patel and Grant、1999;Vassarら、1998)。 1999; Katsaragakis et al., 2000; Livingston et al., 2000; Capuzzo et al., 2000; Markgraf et al., 2000; Beck et al., 2003; Keegan et al., 2012; Vasilevskis et al., 2009; Hwang et al., 2012; Costa e Silva et al., 2011; Shrope-Mok et al., 2010)

複数の研究が、このドメインでの人工ニューラルネットワークとロジスティック回帰の比較を行っています。 Clermontら(Clermont et al., 2001)は、十分なサイズ(1,200)の開発データセットで、局所的に開発したロジスティック回帰と人工ニューラルネットワークが、キャリブレーション(適切)と識別(AUCが0.80~0.84の範囲)の両方の点で同等のパフォーマンスを示すことを発見しています。 しかし,両モデルとも,開発サンプルサイズが小さくなるにつれて性能が低下した. Dybowskiらによる168の開発セットを用いた別の小規模な研究(Dybowski et al., 1996)では、LRと比較してANNの優れた識別性が示された(それぞれ、0.863対0.753 AUC)

いくつかの研究は、APACHE-II LRモデルをANNと比較したものであった。 Nimgaonkarら(Nimgaonkar et al., 2004)は、インドのICUの患者1,962人について、22のAPACHE-II変数でANNを開発した結果、ANNはAPACHE-IIより優れた識別力を持つことを発見した(それぞれAUC 0.87 vs. 0.77 )。

キャリブレーションの比較もいくつかの研究で行われましたが、LRモデルがANNモデルに利用された地元に由来するイギリスやインドの集団とは異なる外部の患者集団で開発されたため、問題が生じました。 識別の比較は、同じようにこの問題に悩まされることはありません。

コメントを残す

メールアドレスが公開されることはありません。