Aufgeschrieben von Professor Nancy Devlin, Forschungsdirektorin an der OHE und Mitglied der EuroQol-Gruppe
Der EQ-5D ist das weltweit am häufigsten verwendete Maß für von Patienten berichtete Ergebnisse (PRO). Seit einigen Jahrzehnten wird er in klinischen Studien, Beobachtungsstudien, Erhebungen zur Gesundheit der Bevölkerung und – in jüngerer Zeit – in der routinemäßigen Datenerfassung im Gesundheitswesen eingesetzt. Da es sich um einen generischen PRO handelt und weil er von „Wertesätzen“ (auch „Nutzen“ genannt) begleitet wird, die bei der Berechnung von QALYs (qualitätsbereinigten Lebensjahren) verwendet werden, ist der EQ-5D zum Eckpfeiler der Bewertung von Gesundheitstechnologien (HTA) geworden und beeinflusst wichtige Entscheidungen über den Zugang zu neuen Arzneimitteln.
Trotz alledem werden EQ-5D-Daten oft zu wenig erfasst und unzureichend ausgewertet. Die Quintessenz ist: Wenn Sie diese Daten von Ihren Patienten erheben, sollten Sie sicherstellen, dass Sie so viel wie möglich aus dem lernen, was sie Ihnen sagen.
Für alle, die EQ-5D-Daten erheben oder auswerten, sind hier meine Empfehlungen, was mit den EQ-5D-Daten zu tun ist. Dies gilt für die ursprüngliche dreistufige Version, den EQ-5D-3L; die fünfstufige Version, den EQ-5D-5L; die kinderfreundliche Version, den EQ-5D-Y – und wohl auch für jedes PRO-Instrument.
1. Was Sie nicht tun sollten – gehen Sie nicht gleich zu den „Utilities“ über oder verwenden Sie Scores jeglicher Art, um die Patientendaten zusammenzufassen
OK: Sie haben EQ-5D-Daten gesammelt. Das ist aus vielerlei Gründen großartig! Der EQ-5D ist eine phantastische Methode zur Messung von Gesundheitsergebnissen in einer allgemeinen Form, die über verschiedene Krankheitsbereiche hinweg verglichen werden kann. Eine Reihe von Patienten/Personen haben Kästchen angekreuzt, um ihren Gesundheitszustand auf den fünf Dimensionen zu beschreiben. Ein gängiger Ansatz ist die Zusammenfassung dieser Antworten zu einer einzigen Zahl auf einer Skala, die bei 1 (vollständiger Gesundheitszustand) verankert ist, unter Verwendung der für diesen Zweck verfügbaren Wertesätze (Szende et al. 2007). Das macht die Analyse der Daten viel einfacher, denn statistisch gesehen sind einzelne Zahlen einfacher als kategorische Daten.
Arbeit erledigt? Falsch!
Sie sollten wissen, dass:
- Es gibt keine „neutrale“ oder „objektive“ Art der Zusammenfassung von EQ-5D-Daten (oder von Daten einer beliebigen PRO-Messung!)
- Welchen „Wertesatz“ Sie auch immer für die Zusammenfassung Ihrer EQ-5D-Daten verwenden, er wird eine exogene Quelle der Varianz in die statistische Schlussfolgerung einbringen (Parkin, Devlin und Rice 2010) – das heißt, Varianz, die nicht aus den Daten stammt, die Ihre Patienten Ihnen gegeben haben. Schlussfolgerungen darüber, ob es statistisch signifikante Unterschiede zwischen verschiedenen Bevölkerungs- oder Patientengruppen – oder zwischen verschiedenen Armen einer klinischen Studie – gibt, hängen davon ab, welche Wertemenge verwendet wird. Es gibt erhebliche Unterschiede zwischen den statistischen Eigenschaften der verschiedenen für den EQ-5D verfügbaren Wertesätze. (Weitere Informationen hierzu finden Sie in Parkin et al. 2014. Wir untersuchen derzeit dieselben Dinge in Bezug auf die EQ-5D-5L-Daten, über die wir demnächst in Feng et al. 2016 berichten werden).
- Achten Sie darauf, woher die Werte stammen! Die Werte stammen aus sogenannten „stated preference“-Studien: Bei diesen Studien werden üblicherweise die Meinungen von Mitgliedern der Allgemeinheit eingeholt, die gebeten werden, sich ein Leben mit verschiedenen Gesundheitsproblemen vorzustellen. Wir wissen, dass es Unterschiede zwischen der Allgemeinheit und den Patienten gibt, was ihre Ansichten und Meinungen darüber angeht, wie gut oder schlecht Gesundheitsprobleme sind. Diese präferenzbasierten Wertesätze wurden zu einem bestimmten Zweck entwickelt: zur Schätzung von QALYs. Wenn Sie die EQ-5D-Daten nicht zur Schätzung von QALYs verwenden, gibt es möglicherweise keinen triftigen Grund für die Verwendung von Wertesätzen zur Zusammenfassung von EQ-5D-Daten.
Hinweis: Dies ist keine Kritik am EQ-5D – im Gegenteil! Die EuroQol-Gruppe ist offen für diese Art von Fragen und hat sie ausgiebig erforscht. Alle anderen generischen und krankheitsspezifischen PROs haben genau die gleichen Probleme – sie sagen nur nicht viel darüber.
2. Betrachten Sie die Antworten der Patienten auf die Frage-Items (Dimensionen)
Unterschätzen Sie nicht die Bedeutung und Nützlichkeit der guten, altmodischen deskriptiven Statistik! Deskriptive Statistiken zu PRO-Daten werden unterbewertet und in Veröffentlichungen zu wenig erwähnt, was schade ist.
Die Zusammenfassung von EQ-5D-Daten nach Wertesätzen sagt nicht viel darüber aus, welche Aspekte des Gesundheitszustands der Patienten oder der Bevölkerung am stärksten durch ihre Erkrankung beeinträchtigt oder durch die Behandlung verbessert wurden. Um dies herauszufinden, müssen Sie sich die Daten ansehen, die Ihnen die Patienten tatsächlich gegeben haben: die Kästchen, die sie bei den EQ-5D-Fragen angekreuzt haben. So sollten Sie beispielsweise immer die Anzahl und den Prozentsatz der Patienten angeben, die für jede Dimension des EQ-5D ein bestimmtes Maß an Problemen angeben. Wenn Sie die Dinge vereinfachen wollen, können Sie auch die Stufen 2 und 3 zusammenfassen und die Anzahl derer, die „keine“ Probleme angeben, und die Anzahl derer, die „irgendwelche“ Probleme angeben, angeben.
Neben der Beschreibung des Gesundheitszustands der Patienten zu einem bestimmten Zeitpunkt sind Sie vielleicht daran interessiert, die Veränderungen des Gesundheitszustands der Patienten zu beschreiben – zum Beispiel vor oder nach einer Operation oder zu verschiedenen Zeitpunkten in einer klinischen Studie im Vergleich zum Ausgangswert.
Auch dies kann auf der Ebene der EQ-5D-Dimensionen erfolgen. Auch hier kann die deskriptive Statistik eine Menge aussagen. Als wir beispielsweise die Veränderung der Anzahl und des Prozentsatzes der NHS-Hüftersatzpatienten, die über Probleme berichteten, aufgeschlüsselt nach Dimensionen (siehe Tabelle 1 unten), vor und nach der Operation untersuchten, stellten wir fest, dass sich die Ängste und Depressionen, die Selbstfürsorge und die Schmerzen/Beschwerden der Patienten – nicht nur die Mobilität – deutlich verbessert hatten (Devlin et al. 2010). Auffallend war, dass kein Patient vor der Operation eine Mobilitätsstufe 3″ hatte, so dass die einzigen Verbesserungen, die durch die Operation möglich waren, von einigen“ zu keinen“ Problemen führten. Der Grund dafür? Stufe 3 auf der EQ-5D-3L-Mobilitätsdimension ist „bettlägerig“ – und selbst Patienten mit sehr schlechter Mobilität aufgrund von Hüftproblemen sind nicht ans Bett gefesselt. Das ist ein Problem des EQ-5D-3L, auf das wir bereits hingewiesen haben (Oppe et al. 2011), und das im neuen EQ-5D-5L korrigiert wurde (Herdman et al. 2014). Nichts von alledem wäre ersichtlich gewesen, wenn die Daten dieser Patienten nur im Hinblick auf den Nutzwert analysiert worden wären.
Quelle: Devlin et al (2010)
3. Zusammenfassen von Veränderungen ohne Verwendung von Wertesätzen
Tabellen wie die oben gezeigte können sehr informativ sein – sind aber kompliziert zu betrachten, und manchmal ist eine Gesamtzusammenfassung erforderlich. Die gute Nachricht ist, dass es einfach ist, Veränderungen im EQ-5D-Gesundheitsstatus zusammenzufassen, indem man einfach die Daten verwendet, die die Patienten angegeben haben.
Im Jahr 2010 haben wir eine Methode entwickelt, die auf den Prinzipien der Pareto-Verbesserung in der Wohlfahrtsökonomie basiert – die Pareto-Klassifikation von Gesundheitsveränderungen (PCHC) (Devlin et al 2010). Die Idee ist einfach: Ein EQ-5D-Gesundheitszustand gilt als „besser“ als ein anderer, wenn er in mindestens einer Dimension besser und in keiner anderen Dimension schlechter ist. Und ein EQ-5D-Gesundheitszustand gilt als „schlechter“ als ein anderer, wenn er in mindestens einer Dimension schlechter ist und in keiner anderen Dimension besser ist. Wendet man dieses Prinzip an, um den EQ-5D-Gesundheitszustand eines Patienten zwischen zwei beliebigen Zeiträumen zu vergleichen, gibt es nur 4 Möglichkeiten:
– Der Gesundheitszustand ist besser
– Der Gesundheitszustand ist schlechter
– Der Gesundheitszustand ist genau gleich
– Die Veränderungen im Gesundheitszustand sind „gemischt“: besser auf einer Dimension, aber schlechter auf einer anderen.
Wenn man dies auf die Daten zum Hüftgelenkersatz anwendet, stellt man fest, dass weniger als 5 % keine Veränderung hatten, 82 % hatten einen besseren Gesundheitszustand, weniger als 5 % einen schlechteren und weniger als 10 % eine „gemischte“ Veränderung (Devlin et al. 2010). Mit anderen Worten: Diese einfache Analyse liefert eine sehr klare Zusammenfassung dessen, was mit der Gesundheit der Patienten infolge einer Hüftoperation geschieht – ohne sich auf Wertesätze zu stützen. Sie zeigt auch wichtige Unterschiede im Nutzen von Hüftoperationen im Vergleich zu anderen Arten von elektiven Eingriffen auf.
Es gibt auch andere Möglichkeiten, EQ-5D-Daten zusammenzufassen. Ich werde hier nicht auf alle eingehen, aber es gibt eine Vielzahl von Ansätzen, und einige haben erhebliche Einschränkungen bei der Zusammenfassung von Patientendaten. Ein Beispiel für letzteres ist die Annäherung an den Gesamt-„Schweregrad“ eines Zustands durch seinen „Level-Summen-Score“, bei dem einfach die Werte auf jeder Dimension addiert werden. Der beste EQ-5D-3L-Gesundheitszustand besteht darin, auf keiner Dimension ein Problem zu haben. Kein Problem“ = 1, also überhaupt keine Probleme (1+1+1+1+1) = 5. Das schwerwiegendste Problem auf einer der Dimensionen = 3, der schlechteste Gesundheitszustand ist also (3+3+3+3+3) = 15. Jeder andere Gesundheitszustand auf dem EQ-5D-3L hat einen Niveausummenwert zwischen dem besten (5) und dem schlechtesten (15). Dies lässt sich auch auf den EQ-5D-5L anwenden, bei dem der beste Wert wiederum 5 und der schlechteste Wert (5+5+5+5+5) = 25 ist. Diese Niveausummenwerte können in manchen Situationen nützlich sein, aber es gibt offensichtliche Einschränkungen. Es handelt sich um eine sehr grobe zusammenfassende Bewertung – zum Beispiel haben 22222, 33211 und 11233 alle den gleichen Level-Summenwert (= 10). Und jeder Score enthält eine sehr unterschiedliche Anzahl potenzieller Profile (5 und 15 haben jeweils nur ein Profil, während Level-Sum-Score 10 51 Profile enthält). Und nur weil die Dimensionen gleich gewichtet werden, heißt das nicht, dass sie „werturteilsfrei“ sind – die gleiche Gewichtung der Dimensionen stellt an sich schon eine Ansicht über ihre Wichtigkeit dar (Parkin et al. 2010).
4. Nutzen Sie Ihre EQ-VAS-Daten!
Der EQ-VAS ist eine Skala von 0-100, auf der die Patienten gebeten werden, ihren heutigen allgemeinen Gesundheitszustand anzugeben. Wir (ich spreche hier als Mitglied der EuroQol-Gruppe!) betrachten ihn als integralen Bestandteil des EQ-5D-Fragebogens – aber er wird oft völlig übersehen und nicht erfasst (oder schlimmer noch – manche Anwender lassen ihn aus der Datenerhebung aus, obwohl er Teil des urheberrechtlich geschützten Instruments ist!). Der EQ-VAS bietet wichtige, ergänzende Informationen zu den Informationen über den Gesundheitszustand, die die Patienten bei der Selbsteinschätzung ihres Gesundheitszustands im EQ-5D angeben. In der Tat ist der EQ-5D als PRO-Instrument einzigartig, da er Daten liefert, die die eigene Gesamtbeurteilung des Gesundheitszustands durch die Patienten zeigen. Es geht nicht darum, wie gut oder schlecht der allgemeine Gesundheitszustand aus Sicht eines anderen ist, wenn er sich vorstellt, in diesem Zustand zu sein, sondern um die Sicht der Person, die ihn tatsächlich erlebt. Das klingt nach nützlichen Informationen – und das ist es auch.
Der EQ-VAS kann zum Beispiel Probleme erfassen, die nicht in den fünf Dimensionen des EQ-5D enthalten sind, und so möglicherweise Lücken im EQ-5D aufdecken, die für bestimmte Patientengruppen relevant sind (siehe Feng et al. 2014). Dies hilft bei der Interpretation der EQ-5D-Daten, die Sie gesammelt haben, und bei der Frage, ob es Gründe gibt, die darauf hindeuten, dass sie die Auswirkungen von Gesundheitsproblemen nicht vollständig erfassen.
Nicht überzeugt? Werfen Sie einen Blick auf dieses Diagramm, das aus den riesigen Datenmengen der EuroQol-Gruppe erstellt wurde. Bei denjenigen, die Probleme mit dem EQ-5D angeben, nimmt der EQ-VAS mit zunehmendem Alter stark ab (d. h. mit zunehmendem Alter nehmen die Probleme, die auf den fünf Dimensionen angegeben werden, und der von den Patienten selbst eingeschätzte Gesundheitszustand auf dem EQ-VAS insgesamt ab). Interessanterweise nimmt jedoch der EQ-VAS mit dem Alter ab, selbst bei Patienten, die beim EQ-5D keine Probleme angeben. Dies deutet darauf hin, dass der EQ-VAS etwas anderes als die 5 Dimensionen misst, und zwar zusätzlich zu den Dingen in den 5 Dimensionen.
5. Zu guter Letzt: Wenn Sie einen Wertesatz verwenden müssen, um Ihre EQ-5D-Daten zusammenzufassen – z. B. für die Schätzung von QALYs – stellen Sie sicher, dass Sie eine Sensitivitätsanalyse für alternative Wertesätze durchführen.
Wertesätze sind ein Produkt der Entscheidungen von Forschern darüber, welche Methoden sie verwenden und wie sie die Daten modellieren. Diese Entscheidungen können potenziell eine nicht-triviale Auswirkung auf die Charakteristika der generierten Werte haben – zum Beispiel, wie hoch der Mindestwert ist, wie viele negative Werte es gibt und wie die Verteilung der Werte aussieht. Unter den Forschern besteht kein Konsens darüber, welche Methoden die „besten“ sind, und verschiedene Methoden, sowohl für die Erhebung von Werten als auch für deren Modellierung, können zu unterschiedlichen Ergebnissen führen.
Das bedeutet, dass die auf die EQ-5D-Daten anzuwendenden Werte mit einer gewissen Unsicherheit behaftet sind. Aber das gilt auch für viele andere Aspekte der Kostenwirksamkeitsanalyse, wie die Wirksamkeit neuer Technologien und deren Kosten. Wie bei jedem anderen unsicheren Parameter in einem Kosteneffektivitätsmodell sollten die Analysten also überprüfen, ob ihre Schlussfolgerungen zur Kosteneffektivität von der Wahl des Wertesatzes abhängen. Und wenn Wertesätze Konfidenzintervalle angeben (was sie alle sollten!), sollten diese Konfidenzintervalle auch Teil der Sensitivitätsanalyse in der Kosteneffektivitätsanalyse sein.
Wollen Sie mehr wissen? Ausgewählte Referenzen:
Devlin N, Parkin D, Browne J. (2010). Verwendung des EQ-5D als Instrument zur Leistungsmessung im NHS. Health Economics 19(8):886-905.
Parkin D, Devlin N, Rice N. (2010) Statistical analysis of EQ-5D profiles: does the use of value sets bias inference? Medical Decision Making 2010; 30:556-565