5 dingen die u moet doen met EQ-5D data

Geschreven door professor Nancy Devlin, directeur onderzoek bij OHE en lid van de EuroQol Group

EQ-5D is de meest gebruikte maat voor patiëntgerapporteerde uitkomsten (PRO) over de hele wereld. Al een paar decennia wordt hij gebruikt in klinische studies, observationele studies, bevolkingsonderzoeken en – meer recent – bij het routinematig verzamelen van gegevens in de gezondheidszorg. Omdat het een generieke PRO is, en omdat het vergezeld gaat van ‘waardesets’ (ook wel ‘utilities’ genoemd) die worden gebruikt bij de berekening van QALY’s (quality adjusted life years), is de EQ-5D de hoeksteen geworden van de health technology appraisal (HTA), en beïnvloedt het belangrijke beslissingen over de toegang tot nieuwe medicijnen.

Maar ondanks dat alles worden EQ-5D gegevens vaak te weinig gerapporteerd, en onvoldoende geanalyseerd. Het komt erop neer dat als u deze gegevens van uw patiënten verzamelt, u er alles aan moet doen om ervoor te zorgen dat u zoveel mogelijk leert van wat zij u vertellen.

Dus: voor iedereen die EQ-5D gegevens verzamelt of rapporteert, hier zijn mijn aanbevelingen voor wat te doen met EQ-5D gegevens. Dit geldt voor de oorspronkelijke versie met drie niveaus, de EQ-5D-3L; de versie met vijf niveaus, EQ-5D-5L; de kindvriendelijke versie, EQ-5D-Y – en aantoonbaar, elk PRO-instrument.

1. Wat niet te doen – ga niet meteen over op ‘utilities’ of het gebruik van scores van welke aard dan ook om de gegevens van patiënten samen te vatten

OK: u hebt EQ-5D gegevens verzameld. Dat is om veel redenen geweldig! De EQ-5D is een fantastische manier om gezondheidsuitkomsten te meten op een generieke manier die kan worden vergeleken tussen verschillende ziektegebieden. Een aantal patiënten/mensen heeft vakjes aangekruist om hun gezondheid op de vijf dimensies te beschrijven. Een gangbare aanpak is om die antwoorden samen te vatten tot één getal op een schaal die is verankerd op 1 (volledige gezondheid) met gebruikmaking van de waardesets die voor dat doel beschikbaar zijn (Szende et al 2007). Het maakt de analyse van de gegevens een stuk eenvoudiger: immers – statistisch gezien zijn enkelvoudige getallen eenvoudiger dan categorische gegevens.

Job done? Fout!

U moet weten dat:

  • Er is geen ‘neutrale’, of ‘objectieve’ manier om EQ-5D data (of data van welke PRO-meting dan ook!) samen te vatten
  • Welke ‘waardeset’ u ook gebruikt om uw EQ-5D data samen te vatten, het zal een exogene bron van variantie introduceren in statistische gevolgtrekkingen (Parkin, Devlin and Rice 2010) – dat wil zeggen, variantie die niet afkomstig is van de data die uw patiënten u hebben gegeven. Conclusies over de vraag of er statistisch significante verschillen zijn tussen verschillende bevolkings- of patiëntengroepen – of tussen verschillende armen van een klinische proef – worden beïnvloed door welke waardeset wordt gebruikt. Er zijn belangrijke verschillen tussen de statistische eigenschappen van de diverse beschikbare waardesets voor de EQ-5D. (Voor meer hierover, zie Parkin et al 2014. We kijken momenteel naar deze zelfde zaken in relatie tot EQ-5D-5L data – waarover we binnenkort zullen rapporteren in Feng et al 2016).
  • Ben je bewust van waar de waarden vandaan komen! De waarden komen uit ‘stated preference’-studies: volgens afspraak verzamelen deze studies meningen van leden van het grote publiek – aan wie wordt gevraagd om zich voor te stellen dat ze leven met verschillende gezondheidsproblemen. Wij weten dat er verschillen zijn tussen het grote publiek en patiënten wat betreft hun opvattingen en meningen over hoe goed of slecht gezondheidsproblemen zijn. Deze op voorkeuren gebaseerde waardesets zijn ontwikkeld met een specifiek doel voor ogen: het schatten van QALY’s. Als u geen EQ-5D gegevens gebruikt om QALY’s te schatten, dan is er wellicht geen sterke reden om waardesets te gebruiken om EQ-5D gegevens samen te vatten.

Note – niets van dit alles is kritiek op EQ-5D – integendeel zelfs! De EuroQol Group is open over dit soort zaken en heeft er uitgebreid onderzoek naar gedaan. Alle andere generieke en aandoeningsspecifieke PROs hebben precies dezelfde problemen – ze zeggen er alleen niet veel over.

2. Kijk naar de antwoorden van patiënten op de vraagitems (dimensies)

Onderschat het belang en het nut van goede, ouderwetse beschrijvende statistieken niet! Beschrijvende statistieken van PRO-gegevens worden ondergewaardeerd en ondergerapporteerd in papers, en dat is jammer.

Het samenvatten van EQ-5D-gegevens volgens de waardesets vertelt je niet veel over welke aspecten van de gezondheid van de patiënt of de populatie het meest zijn beïnvloed door hun aandoening, of verbeterd door de behandeling. Om dat te weten te komen, moet u kijken naar de gegevens die patiënten u daadwerkelijk hebben gegeven: de vakjes die zij hebben aangekruist op de EQ-5D vragen. U moet bijvoorbeeld altijd het aantal en het percentage patiënten rapporteren dat elk niveau van problemen rapporteert op elke dimensie van de EQ-5D. Als u de zaken wilt vereenvoudigen, kunt u ook niveau 2 en 3 samenvoegen, en het aantal dat ‘geen’ problemen rapporteert, en het aantal dat ‘enige’ problemen rapporteert.

Naast het beschrijven van de gezondheid van de patiënt op een bepaald moment in de tijd, kunt u geïnteresseerd zijn in het beschrijven van de veranderingen in de gezondheid van de patiënt – bijvoorbeeld voor of na een operatie, of op verschillende tijdstippen in een klinisch onderzoek, vergeleken met de uitgangssituatie.

Ook dit kan worden gedaan op het niveau van de dimensies van de EQ-5D. Nogmaals, beschrijvende statistieken kunnen u veel vertellen. Toen we bijvoorbeeld keken naar de verandering in het aantal en het percentage patiënten met een heupprothese van de NHS die problemen rapporteerden per dimensie (zie tabel 1 hieronder), voor en na de operatie, ontdekten we dat er heel opvallende verbeteringen waren in de angst en depressie van patiënten, zelfzorg en pijn/ongemak – niet alleen mobiliteit (Devlin et al 2010). In feite was het opvallend dat geen enkele patiënt vóór de operatie een ‘niveau 3’ voor mobiliteit had, dus de enige verbeteringen die als gevolg van de operatie mogelijk waren, waren van ‘enige’ naar ‘geen’ problemen. De reden? Niveau 3 op de EQ-5D-3L mobiliteitsdimensie is ‘aan bed gekluisterd’ – en zelfs patiënten met een zeer slechte mobiliteit als gevolg van heupproblemen liggen niet aan bed gekluisterd. Dat is een probleem met de EQ-5D-3L – zoals we al eerder hebben aangegeven (Oppe et al 2011) – en is gecorrigeerd in de nieuwe EQ-5D-5L (Herdman et al 2014). Geen van deze zaken zou duidelijk zijn geweest als de gegevens van deze patiënten alleen in termen van de utilities waren geanalyseerd.


Bronnen: Devlin et al (2010)

3. Veranderingen samenvatten zonder gebruik te maken van waardesets

Tabellen zoals hierboven kunnen heel informatief zijn – maar zijn ingewikkeld om naar te kijken, en soms is een algemene samenvatting nodig. Het goede nieuws is dat het eenvoudig is om veranderingen in de EQ-5D gezondheidsstatus samen te vatten, gewoon met behulp van de gegevens die patiënten u hebben gegeven.

In 2010 kwamen we met een manier om dat te doen, gebaseerd op de principes van een Pareto-verbetering in de welzijnseconomie – de Pareto Classification of Health Change (PCHC) (Devlin et al 2010). Het idee is eenvoudig: een EQ-5D gezondheidstoestand wordt geacht ‘beter’ te zijn dan een andere als hij beter is op ten minste één dimensie, en niet slechter is op een andere dimensie. En een EQ-5D gezondheidstoestand wordt geacht ‘slechter’ te zijn dan een andere als hij op ten minste één dimensie slechter is, en op geen enkele andere dimensie beter. Als we dat principe gebruiken om de EQ-5D gezondheidstoestand van een patiënt tussen twee willekeurige perioden te vergelijken, zijn er slechts 4 mogelijkheden:

– De gezondheidstoestand is beter

– De gezondheidstoestand is slechter

– De gezondheidstoestand is precies hetzelfde

– De veranderingen in gezondheid zijn ‘gemengd’: beter op één dimensie, maar slechter op een andere.

Als we dit toepassen op de gegevens over heupprotheses, zien we dat minder dan 5% geen verandering heeft, 82% een betere gezondheid heeft, minder dan 5% een slechtere gezondheid, en minder dan 10% een ‘gemengde’ verandering (Devlin et al 2010). Met andere woorden, deze eenvoudige analyse geeft een zeer duidelijk overzicht van wat er gebeurt met de gezondheid van patiënten als gevolg van een heupoperatie – zonder te vertrouwen op waardesets. Het laat ook belangrijke verschillen zien in de voordelen van heupchirurgie, vergeleken met andere soorten electieve chirurgie.

Er zijn ook andere manieren om EQ-5D gegevens samen te vatten. Ik zal ze hier niet allemaal bespreken, maar er zijn verschillende benaderingen, en sommige hebben belangrijke beperkingen als manier om de gegevens van patiënten samen te vatten. Een voorbeeld van de laatste is het benaderen van de algemene ‘ernst’ van een toestand door de ‘niveau som score’, die eenvoudigweg de niveaus op elke dimensie bij elkaar optelt. De beste EQ-5D-3L gezondheidstoestand houdt in dat er op geen enkele dimensie een probleem is. Geen probleem’ = 1, dus helemaal geen problemen (1+1+1+1+1) = 5. Het ernstigste probleem op welke dimensie dan ook = 3, dus de slechtste gezondheidstoestand is (3+3+3+3+3+3) = 15. Elke andere gezondheidstoestand op de EQ-5D-3L zal een niveau-som score hebben tussen de beste (5) en de slechtste (15). Dit kan ook worden toegepast op de EQ-5D-5L, waar de beste score weer 5 is, en de slechtste (5+5+5+5+5) = 25. Deze niveauscore kan in sommige situaties nuttig zijn, maar er zijn duidelijke beperkingen. Het is een zeer ruwe samenvattende score – bijvoorbeeld, 22222, 33211 en 11233 hebben allemaal dezelfde level sum score (= 10). En elke score bevat een zeer verschillend aantal potentiële profielen (5 en 15 hebben elk slechts één profiel; terwijl level sum score 10 51 profielen bevat). Ook betekent het feit dat de dimensies gelijk gewogen worden niet dat er geen waardeoordeel is – het gelijk wegen van dimensies vertegenwoordigt op zichzelf al een mening over hun belang (Parkin et al 2010).

4. Gebruik uw EQ-VAS gegevens!

De EQ-VAS is een 0-100 schaal waarbij patiënten wordt gevraagd hun algemene gezondheidstoestand van vandaag aan te geven. Wij (hier sprekend als lid van de EuroQol Groep!) beschouwen het als een integraal onderdeel van de EQ-5D vragenlijst – maar het wordt vaak volledig over het hoofd gezien en niet gerapporteerd (of erger nog – sommige gebruikers laten het achterwege bij het verzamelen van gegevens, ook al is het een onderdeel van het auteursrechtelijk beschermde instrument!). De EQ-VAS biedt belangrijke, aanvullende informatie bij de informatie over de gezondheidstoestand die patiënten verstrekken wanneer zij zelf hun gezondheid rapporteren op de EQ-5D. In feite is de EQ-5D uniek als PRO-instrument omdat het gegevens genereert die de eigen, algemene beoordeling van de gezondheid van de patiënt weergeven. Niet de mening van iemand anders over hoe goed of slecht hun algemene gezondheidstoestand is, als ze zich voorstellen dat ze zich in die toestand bevinden, maar de mening van de persoon die het daadwerkelijk ervaart. Dat klinkt als nuttige informatie – en dat is het ook.

De EQ-VAS kan bijvoorbeeld problemen in kaart brengen die niet binnen de 5 dimensies van de EQ-5D vallen – waardoor mogelijk hiaten in de EQ-5D aan het licht komen die relevant zijn voor bepaalde patiëntengroepen (zie Feng et al 2014). Dit helpt bij het interpreteren van de EQ-5D-gegevens die u hebt verzameld, en of er reden zou kunnen zijn om te suggereren dat het de effecten van gezondheidsproblemen niet volledig weergeeft.

Niet overtuigd? Kijk dan eens naar dit diagram, dat is gegenereerd uit de enorme hoeveelheden gegevens waarover de EuroQol Group beschikt. Er is een sterk dalende EQ-VAS naar leeftijd voor degenen die problemen rapporteren op de EQ-5D (d.w.z. naarmate de leeftijd toeneemt, nemen ook de gerapporteerde problemen op de vijf dimensies toe en daarmee ook de algemene zelf-gerapporteerde gezondheid van de patiënten op de EQ-VAS). Maar interessant genoeg daalt de EQ-VAS met de leeftijd, zelfs onder patiënten die geen problemen rapporteren op de EQ-5D. Dit suggereert dat de EQ-VAS iets anders meet dan, en iets extra’s doet met, de dingen in de 5 dimensies.

5. Last but not least: als u een waardeset moet gebruiken om uw EQ-5D-gegevens samen te vatten – bijvoorbeeld voor het schatten van QALY’s – zorg er dan voor dat u een gevoeligheidsanalyse uitvoert voor alternatieve waardesets.

Waardensets zijn een product van de beslissingen van onderzoekers over welke methoden ze gebruiken, en hoe ze de gegevens modelleren. Die beslissingen kunnen een niet-triviaal effect hebben op de kenmerken van de waarden die worden gegenereerd – bijvoorbeeld wat de minimumwaarde is, en hoeveel negatieve waarden er zijn, en hoe de verdeling van de waarden eruitziet. Er is een gebrek aan consensus onder onderzoekers over welke methoden ‘het beste’ zijn, en verschillende methoden, zowel voor het uitlokken van waarden als voor het modelleren ervan, kunnen tot verschillende resultaten leiden.

De implicatie is dat de waarden die op EQ-5D gegevens moeten worden toegepast, enige onzekerheid met zich meebrengen. Maar dat geldt ook voor het bewijsmateriaal over veel andere zaken in kosteneffectiviteitsanalyses, zoals de effectiviteit van nieuwe technologieën en de kosten daarvan. Dus – net als elke andere onzekere parameter in een kosteneffectiviteitsmodel, is de implicatie dat analisten ervoor moeten zorgen dat ze controleren of hun conclusies over kosteneffectiviteit gevoelig zijn voor de keuze van de waardeset. En, waar waardesets betrouwbaarheidsintervallen rapporteren (wat ze allemaal zouden moeten doen!), zouden die betrouwbaarheidsintervallen ook deel moeten uitmaken van de gevoeligheidsanalyse bij kosteneffectiviteitsanalyse.

Wilt u meer weten? Geselecteerde referenties:

Devlin N, Parkin D, Browne J. (2010). Het gebruik van de EQ-5D als een prestatiemeetinstrument in de NHS. Health Economics 19(8):886-905.

Parkin D, Devlin N, Rice N. (2010) Statistical analysis of EQ-5D profiles: does the use of value sets bias inference? Medical Decision Making 2010; 30:556-565

Parkin, D., Devlin, N. and Feng, Y., 2014. Wat bepaalt de vorm van een EQ-5D verdeling? OHE Research Paper 14/04.

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.