執筆:OHEリサーチディレクター、EuroQolグループメンバー Nancy Devlin教授
EQ-5D は世界中で最も広く使われている患者報告アウトカム(PRO)の測定方法です。 数十年前から、臨床試験、観察研究、集団健康調査、そして最近では医療制度における日常的なデータ収集に使用されています。 EQ-5Dは一般的なPROであり、QALYs(質調整生存年)の計算に使用される「価値セット」(別名「効用」)を伴うため、医療技術評価(HTA)の基礎となり、新薬へのアクセスに関する重要な決定に影響を与えています
しかしながら、EQ-5Dデータはしばしば過小評価され、不十分な分析が行われています。
しかし、それにもかかわらず、EQ-5Dデータはしばしば過小評価され、分析も不十分です。要するに、患者からこれらのデータを収集するならば、患者が語ることからできる限り多くを学べるように尽力すべきなのです。
そこで、EQ-5Dデータを収集または報告している方々のために、EQ-5Dデータをどのように扱うべきかについて、私が推奨する方法をご紹介します。 これは、オリジナルの3レベル版EQ-5D-3L、5レベル版EQ-5D-5L、子供向けのEQ-5D-Y、そして間違いなく、すべてのPRO測定器に当てはまります。
1.やってはいけないこと – 患者のデータを要約するために「効用」やあらゆる種類のスコアをそのまま使わないこと
さて、EQ-5Dデータを集めましたね。 それは多くの理由で素晴らしいことです。 EQ-5Dは、疾患領域間で比較できる一般的な方法で、健康上の成果を測定する素晴らしい方法です。 多くの患者さんや人々が、自分の健康状態を5つの次元で表現するためにボックスにチェックを入れています。 一般的なアプローチは、その目的のために利用可能な値セットを使用して、これらの回答を1(完全な健康)を軸とするスケール上の単一の数値に要約することです(Szende et al 2007)。 結局のところ、統計的に、単一の数値はカテゴリデータよりも簡単なのです。
これで終わりでしょうか?
- EQ-5Dデータ(または任意のPRO測定からのデータ)を要約する「中立」または「客観的」な方法はありません!
- EQ-5Dデータの要約に使用する「値セット」が何であれ、それは統計推論に外来分散の原因をもたらします(Parkin, Devlin and Rice 2010)、つまり、患者から与えられたデータからではない分散が生じるのです。 異なる集団または患者グループ間、または臨床試験の異なる群間で統計的に有意な差があるかどうかの結論は、どの値セットを使用するかに影響されます。 EQ-5Dで利用可能な様々な値セットの統計的特性には重要な違いがあります。 (これについては、Parkin et al 2014を参照してください。 私たちは現在、EQ-5D-5Lデータに関連してこれらと同じことを調べています-Feng et al 2016でまもなく報告します)
- 値がどこから来たのかに注意しましょう!
- 値がどこから来たのかに注意しましょう!
- 値がどこから来たのかに注意しましょう!
- 値がどこから来たのかに注意しましょう。 この値は「stated preference」研究から来ています。慣習的に、これらの研究では、一般市民のメンバーから意見を収集します – 彼らは様々な健康問題での生活を想像するよう求められます。 一般市民と患者さんでは、健康問題の良し悪しに関する見解や意見に違いがあることが分かっています。 これらの嗜好に基づいた価値セットは、QALYsを推定するという特定の目的のために開発されました。 QALYsを推定するためにEQ-5Dデータを使用していない場合、EQ-5Dデータを要約するためにバリューセットを使用することには、あまり強い根拠がないかもしれません
注意 – これらはいずれもEQ-5Dに対する批判ではありません。 EuroQol Group は、この種の問題についてオープンであり、広範囲に渡って研究しています。
2.質問項目 (次元) に対する患者の回答を見る
古き良き記述統計の重要性と有用性を過小評価しないでください!
EQ-5Dデータを値群別に要約しても、患者や集団の健康のどの側面が症状によって最も影響を受けたか、あるいは治療によって改善したかについては、あまりわかりません。 それを知るためには、患者さんが実際に与えてくれたデータ、つまりEQ-5Dの質問でチェックしたボックスを見る必要があります。 例えば、EQ-5Dの各次元で、各レベルの問題を報告している患者さんの数と割合を常に報告する必要があります。
ある時点での患者の健康状態を説明することに加え、患者の健康状態の変化、たとえば手術の前後や臨床試験のさまざまな時点における、ベースラインとの比較について説明することに興味があるかもしれません。
これもEQ-5Dの次元レベルで行うことができます。 例えば、NHSの股関節置換術を受けた患者が、手術の前後で、問題を報告している数と割合の変化を調べたところ(下記の表1参照)、患者の不安やうつ、セルフケア、痛み/不快感において、移動性だけでなく、非常に顕著な改善が見られたことがわかりました(Devlin et al 2010)。 実際、顕著だったのは、手術前に移動性で「レベル3」だった患者はおらず、手術の結果、問題が「ある」から「ない」に改善されただけだったということです。 その理由は? EQ-5D-3Lのモビリティのレベル3は「寝たきり」ですが、股関節の問題でモビリティが非常に悪い患者さんでも、寝たきりになっているわけではありません。 これはEQ-5D-3Lの問題点であり、以前にも指摘したとおり(Oppe et al 2011)、新しいEQ-5D-5Lでは修正されている(Herdman et al 2014)。 これらの患者さんのデータをユーティリティだけで分析していたら、いずれも明らかにならなかったことです。
div
Source: Devlin et al (2010)
3.値セットを使用しない変化のまとめ
上に示したような表は非常に有益ですが、見るのが複雑で、全体的なまとめが必要な場合もあります。
2010年に、私たちは、厚生経済学におけるパレート改善の原則に基づいて、健康状態の変化のパレート分類 (PCHC) を行う方法を考え出しました (Devlin et al 2010)。 この考え方は簡単です。EQ-5Dの健康状態は、少なくとも1つの次元で優れており、他の次元では悪化していない場合、他の状態よりも「良い」と判断されます。 また、EQ-5Dの健康状態は、少なくとも1つの次元で悪く、他のどの次元でも良くなければ、他の状態より「悪い」と判断されます。 その原則を使用して、患者の EQ-5D 健康状態を任意の 2 つの期間間で比較すると、4 つの可能性しかありません:
-健康状態が良くなった
-健康状態が悪くなった
-健康状態がまったく同じ
-健康状態の変化が「混合」である:ある側面では良くなるが、別の側面では悪化している。
これを股関節置換術のデータに適用したところ、変化がなかったのは5%未満、健康状態が改善したのは82%、健康状態が悪化したのは5%未満、そして「混合型」の変化は10%未満でした (Devlin et al 2010)。 言い換えれば、この単純な分析は、股関節手術の結果として患者さんの健康に何が起こっているかを、価値観に頼ることなく、非常に明確に要約するものです。
EQ-5Dデータを要約する他の方法もあります。
また、EQ-5Dデータを要約する他の方法もあります。ここではすべてを説明しませんが、さまざまなアプローチがあり、患者さんのデータを要約する方法として重要な制限を持つものもあります。 後者の例としては、ある状態の全体的な「重症度」を「レベルサムスコア」で近似する方法があり、これは各次元のレベルを単純に合計したものです。 EQ-5D-3Lの最高の健康状態は、どの次元でも問題がないことを意味します。 問題なし」=1なので、全く問題なし(1+1+1+1)=5となります。 どの次元でも最も深刻な問題=3なので、最悪の健康状態は(3+3+3+3+3)=15となる。 EQ-5D-3Lの他のすべての健康状態は、最高(5)と最悪(15)の間のレベルサムスコアを持つことになります。 これはEQ-5D-5Lにも当てはまり、最高はやはり5で、最低は(5+5+5+5+5)=25となります。 このようなレベル和のスコアは、状況によっては有用であるが、明らかな限界がある。 例えば、22222、33211、11233はすべて同じレベルサムスコア(=10)である。 また、各スコアには非常に異なる数の潜在的なプロファイルが含まれています(5と15にはそれぞれ1つのプロファイルしかありませんが、レベルサムスコア10には51のプロファイルが含まれています)。 また、次元を均等に重み付けしているからといって、「価値判断がない」わけではありません。次元を均等に重み付けすること自体、その重要性に関する見解を表しています (Parkin et al 2010)。
4. EQ-VAS データの使用!
EQ-VAS は 0-100 スケールで、患者は今日の全体的な健康状態を示すよう尋ねられます。 私たち(EuroQolグループの一員として)は、EQ-5Dアンケートの不可欠な部分であると考えますが、しばしば完全に見落とされ、報告されません(さらに悪いことに、著作権のある機器の一部であるにもかかわらず、データ収集から外すユーザもいます!)。 EQ-VASは、患者がEQ-5Dで健康状態を自己申告する際に提供する健康状態情報を補完する重要な情報を提供します。 実際、EQ-5Dは、患者自身の健康についての総合的な評価を示すデータを生成するPRO機器としてユニークなものです。 他の人が想像した健康状態の良し悪しではなく、実際に体験している人の健康状態を示すのです。
例えば、EQ-VASは、EQ-5Dの5つの次元では捉えられない問題を捉えることができ、特定の患者グループに関連するEQ-5Dのギャップを明らかにできる可能性があります(Feng et al 2014を参照)。 これは、収集したEQ-5Dデータを解釈するのに役立ち、健康問題の影響を完全に捉えていないことを示唆する理由があるかどうかを判断することができます
納得がいきませんか? EuroQol Groupが保有する膨大なデータから作成されたこの図を見てみてください。 EQ-5Dで問題を報告した人のEQ-VASは、年齢によって急激に減少しています(つまり、年齢が上がるにつれて、5つの次元で報告された問題も、EQ-VASで自己評価した患者の全体的な健康状態も減少しているのです)。 しかし、興味深いことに、EQ-VASはEQ-5Dで問題を報告していない患者においても年齢とともに低下する。 このことは、EQ-VASが5次元のものとは少し異なる、あるいは追加的な何かを測定していることを示唆している。
5.EQ-VASは、5次元とは少し異なる、追加的なものを測定していることが示唆されます。 最後になりましたが、EQ-5Dデータを要約するために値セットを使用する必要がある場合(例:QALYsの推定)、代替値セットに対する感度分析を行うようにしてください。
値セットは、どの方法を使用し、どのようにデータをモデル化するかという研究者の決定の産物です。
価値セットは、どのような方法を使い、どのようにデータをモデル化するかという研究者の決定の産物です。これらの決定は、例えば、最小値は何か、どれくらいの負の値があるか、値の分布はどのように見えるかなど、生成される値の特徴に自明ではない影響を与える可能性があります。
つまり、EQ-5D データに適用される値には、何らかの不確実性が伴うということです。 しかし、費用対効果分析における他の多くの事柄、例えば新しい技術の有効性やそのコストに関する証拠も同様です。 つまり、費用対効果モデルにおける他の不確実なパラメータと同様に、解析者は費用対効果に関する結論がバリューセットの選択に対して敏感であるかどうかを確認する必要があるということである。 そして、信頼区間を報告しているバリューセット(これらはすべてそうすべきです!)は、その信頼区間も費用対効果分析の感度分析の一部を構成する必要があります。
もっと知りたいですか?
Devlin N, Parkin D, Browne J. (2010).の参考文献。 NHSにおけるパフォーマンス測定ツールとしてEQ-5Dを使用する。 Health Economics 19(8):886-905.
Parkin D, Devlin N, Rice N. (2010) Statistical analysis of EQ-5D profiles: does the use of value set bias inference? Medical Decision Making 2010; 30:556-565