Scritto dalla professoressa Nancy Devlin, direttore della ricerca alla OHE e membro del gruppo EuroQol
L’EQ-5D è la misura più usata in tutto il mondo per gli esiti riportati dai pazienti (PRO). Per un paio di decenni è stata usata in studi clinici, studi osservazionali, indagini sulla salute della popolazione e – più recentemente – nella raccolta dati di routine nei sistemi sanitari. Poiché si tratta di un PRO generico, e poiché è accompagnato da “set di valori” (ovvero “utilità”) utilizzati nel calcolo dei QALY (anni di vita aggiustati per la qualità), l’EQ-5D è diventato la pietra angolare della valutazione delle tecnologie sanitarie (HTA), influenzando importanti decisioni sull’accesso a nuovi farmaci.
Ma nonostante tutto ciò, i dati EQ-5D sono spesso sottorappresentati, e analizzati in modo inadeguato. La linea di fondo è: se raccogliete questi dati dai vostri pazienti, dovreste impegnarvi a fare in modo di imparare il più possibile da ciò che vi dicono.
Così: per chiunque raccolga o riporti i dati EQ-5D, ecco le mie raccomandazioni su cosa fare con i dati EQ-5D. Questo vale per la versione originale a tre livelli, la EQ-5D-3L; la versione a cinque livelli, EQ-5D-5L; la versione adatta ai bambini, EQ-5D-Y – e probabilmente, qualsiasi strumento PRO.
1. Cosa non fare – non passare direttamente alle “utilità” o all’uso di punteggi di qualsiasi tipo per riassumere i dati dei pazienti
OK: hai raccolto dati EQ-5D. Questo è fantastico per molte ragioni! L’EQ-5D è un modo fantastico di misurare i risultati di salute in un modo generico che può essere confrontato tra le aree di malattia. Un gruppo di pazienti/persone ha barrato delle caselle per descrivere la propria salute sulle cinque dimensioni. Un approccio comune è quello di riassumere queste risposte in un singolo numero su una scala ancorata a 1 (piena salute) utilizzando i set di valori che sono disponibili per questo scopo (Szende et al 2007). Rende l’analisi dei dati molto più facile: dopo tutto – statisticamente, i numeri singoli sono più facili dei dati categorici.
Lavoro fatto? Sbagliato!
Devi sapere che:
- Non esiste un modo “neutro” o “obiettivo” di riassumere i dati dell’EQ-5D (o i dati di qualsiasi misura PRO, se è per questo!)
- Qualunque “set di valori” tu usi per riassumere i tuoi dati EQ-5D, introdurrà una fonte esogena di varianza nell’inferenza statistica (Parkin, Devlin e Rice 2010) – cioè una varianza che non proviene dai dati che i tuoi pazienti ti hanno fornito. Le conclusioni sull’esistenza di differenze statisticamente significative tra diverse popolazioni o gruppi di pazienti – o tra diversi bracci di uno studio clinico – sono influenzate dal set di valori utilizzato. Ci sono importanti differenze tra le proprietà statistiche dei vari set di valori disponibili per l’EQ-5D. (Per ulteriori informazioni su questo, vedere Parkin et al 2014. Attualmente stiamo esaminando queste stesse cose in relazione ai dati EQ-5D-5L – che riporteremo presto in Feng et al 2016).
- Stare attenti alla provenienza dei valori! I valori provengono da studi di ‘preferenza dichiarata’: per convenzione, questi studi raccolgono opinioni da membri del pubblico generale – ai quali viene chiesto di immaginare di vivere con vari problemi di salute. Sappiamo che ci sono differenze tra il pubblico generale e i pazienti per quanto riguarda i loro punti di vista e le loro opinioni su quanto siano buoni o cattivi i problemi di salute. Questi set di valori basati sulle preferenze sono stati sviluppati con uno scopo specifico in mente: stimare i QALY. Se non si stanno usando i dati EQ-5D per stimare i QALY, potrebbe non esserci una ragione molto forte per usare i set di valori per riassumere i dati EQ-5D.
Nota – nessuna di queste è una critica all’EQ-5D – semmai il contrario! L’EuroQol Group è aperto su questo tipo di questioni e le ha ampiamente studiate. Tutti gli altri PRO generici e specifici hanno gli stessi problemi – semplicemente non ne parlano molto.
2. Guarda le risposte dei pazienti alle domande (dimensioni)
Non sottovalutare l’importanza e l’utilità delle buone, vecchie statistiche descrittive! Le statistiche descrittive sui dati PRO sono sottovalutate e poco riportate nei documenti, il che è un peccato.
Sommare i dati EQ-5D in base ai set di valori non dice molto su quali aspetti della salute del paziente o della popolazione sono stati più colpiti dalla loro condizione, o migliorati dal trattamento. Per saperlo, è necessario guardare i dati che i pazienti vi hanno effettivamente fornito: le caselle che hanno spuntato nelle domande dell’EQ-5D. Per esempio, dovreste sempre riportare il numero e la percentuale di pazienti che riportano ogni livello di problema su ogni dimensione dell’EQ-5D. Se vuoi semplificare le cose, puoi anche far collassare i livelli 2 e 3 insieme, e riportare il numero che riporta “nessun” problema, e il numero che riporta “qualsiasi” problema.
Oltre a descrivere la salute del paziente in un determinato momento, potresti essere interessato a descrivere i cambiamenti nella salute del paziente – per esempio, prima o dopo un intervento chirurgico, o in vari momenti di uno studio clinico, rispetto al punto di partenza.
Anche questo può essere fatto a livello delle dimensioni dell’EQ-5D. Di nuovo – le statistiche descrittive possono dire molto. Per esempio, quando abbiamo esaminato il cambiamento nel numero e nella percentuale di pazienti con protesi d’anca del NHS che riferivano problemi per dimensione (vedi tabella 1 qui sotto), prima e dopo l’intervento, abbiamo scoperto che c’erano miglioramenti piuttosto sorprendenti nell’ansia e nella depressione dei pazienti, nell’auto-cura e nel dolore/disagio – non solo nella mobilità (Devlin et al 2010). Infatti, ciò che ha colpito è che nessun paziente aveva un ‘livello 3’ di mobilità prima dell’intervento, quindi gli unici miglioramenti possibili come risultato dell’intervento sono stati da ‘alcuni’ a ‘nessun’ problema. Il motivo? Il livello 3 sulla dimensione di mobilità EQ-5D-3L è ‘confinato a letto’ – e anche i pazienti con una mobilità molto scarsa a causa di problemi all’anca non sono bloccati a letto. Questo è un problema dell’EQ-5D-3L – come abbiamo sottolineato in precedenza (Oppe et al 2011) – ed è stato corretto nel nuovo EQ-5D-5L (Herdman et al 2014). Nessuna di queste cose sarebbe stata evidente se i dati di questi pazienti fossero stati analizzati solo in termini di utilità.
Fonte: Devlin et al (2010)
3. Riassumere i cambiamenti senza usare set di valori
Tabelle come quella mostrata sopra possono essere molto informative – ma sono complicate da guardare, e a volte è necessario un riassunto generale. La buona notizia è che è facile riassumere i cambiamenti nello stato di salute dell’EQ-5D, semplicemente usando i dati che i pazienti vi hanno fornito.
Nel 2010, abbiamo trovato un modo per farlo, basato sui principi di un miglioramento di Pareto nell’economia del benessere – la classificazione di Pareto del cambiamento della salute (PCHC) (Devlin et al 2010). L’idea è semplice: uno stato di salute EQ-5D è considerato “migliore” di un altro se è migliore in almeno una dimensione e non è peggiore in qualsiasi altra dimensione. E uno stato di salute EQ-5D è considerato “peggiore” di un altro se è peggiore in almeno una dimensione, e non è migliore in qualsiasi altra dimensione. Usando questo principio per confrontare gli stati di salute EQ-5D di un paziente tra due periodi di tempo qualsiasi, ci sono solo 4 possibilità:
– Lo stato di salute è migliore
– Lo stato di salute è peggiore
– Lo stato di salute è esattamente lo stesso
– I cambiamenti di salute sono ‘misti’: migliori su una dimensione, ma peggiori su un’altra.
Applicando questo ai dati sulla sostituzione dell’anca, abbiamo scoperto che meno del 5% non ha avuto alcun cambiamento, l’82% ha avuto una salute migliore, meno del 5% ha avuto una salute peggiore e meno del 10% ha avuto un cambiamento ‘misto’ (Devlin et al 2010). In altre parole, questa semplice analisi fornisce una sintesi molto chiara di ciò che accade alla salute dei pazienti in seguito all’intervento all’anca – senza fare affidamento su set di valori. Ha anche evidenziato importanti differenze nei benefici della chirurgia dell’anca, rispetto ad altri tipi di chirurgia elettiva.
Ci sono anche altri modi di riassumere i dati EQ-5D. Non li analizzerò tutti qui – ma ci sono una varietà di approcci, e alcuni hanno importanti limitazioni come modo di riassumere i dati dei pazienti. Un esempio di quest’ultimo è quello di approssimare la “gravità” complessiva di uno stato attraverso il suo “punteggio di somma dei livelli”, che semplicemente somma i livelli su ogni dimensione. Il migliore stato di salute dell’EQ-5D-3L consiste nel non avere problemi in nessuna dimensione. Nessun problema’ = 1, quindi nessun problema (1+1+1+1+1+1) = 5. Il problema più grave su qualsiasi dimensione = 3, quindi il peggiore stato di salute è (3+3+3+3+3+3) = 15. Ogni altro stato di salute sull’EQ-5D-3L avrà un punteggio di somma dei livelli tra il migliore (5) e il peggiore (15). Questo può anche essere applicato all’EQ-5D-5L, dove il migliore è di nuovo 5, e il peggiore è (5+5+5+5+5) = 25. Questi punteggi di somma dei livelli possono essere utili in alcune situazioni, ma ci sono ovvie limitazioni. È un punteggio riassuntivo molto grezzo – per esempio, 22222, 33211 e 11233 hanno tutti lo stesso punteggio di somma dei livelli (= 10). E ogni punteggio contiene un numero molto diverso di profili potenziali (5 e 15 hanno solo un profilo ciascuno; mentre il punteggio 10 contiene 51 profili). Inoltre, solo perché pondera equamente le dimensioni non significa che sia “privo di giudizi di valore” – la ponderazione uguale delle dimensioni rappresenta di per sé un punto di vista sulla loro importanza (Parkin et al 2010).
4. Usa i tuoi dati EQ-VAS!
L’EQ-VAS è una scala 0-100 in cui si chiede ai pazienti di indicare la loro salute generale oggi. Noi (parlando qui come membro dell’EuroQol Group!) la consideriamo parte integrante del questionario EQ-5D – ma è spesso completamente trascurata e non riportata (o peggio ancora – alcuni utenti la eliminano dalla raccolta dati, anche se è una parte dello strumento di copyright!) L’EQ-VAS offre informazioni importanti e complementari alle informazioni sullo stato di salute che i pazienti forniscono quando si autodenunciano sulla EQ-5D. Infatti, l’EQ-5D è unico come strumento PRO nel generare dati che mostrano la valutazione complessiva della salute dei pazienti stessi. Non il punto di vista di qualcun altro su quanto sia buono o cattivo il loro stato di salute generale, se immaginano di essere in esso, ma il punto di vista della persona che effettivamente lo sperimenta. Sembra un’informazione utile – e lo è.
Per esempio, l’EQ-VAS può catturare problemi che non sono catturati nelle 5 dimensioni dell’EQ-5D – potenzialmente rivelando alcune lacune nell’EQ-5D rilevanti per particolari gruppi di pazienti (vedi Feng et al 2014). Questo aiuta a interpretare i dati dell’EQ-5D che avete raccolto, e se ci potrebbe essere qualche motivo per suggerire che non cattura completamente gli effetti dei problemi di salute.
Non siete convinti? Date un’occhiata a questo diagramma, che è stato generato dalla grande quantità di dati detenuti dall’EuroQol Group. C’è un forte calo dell’EQ-VAS in base all’età per coloro che riportano problemi sull’EQ-5D (cioè, con l’aumentare dell’età, aumentano anche i problemi riportati sulle cinque dimensioni e così anche la salute complessiva autovalutata dai pazienti sull’EQ-VAS). Ma è interessante notare che l’EQ-VAS diminuisce con l’età, anche tra i pazienti che non riportano problemi nell’EQ-5D. Questo suggerisce che l’EQ-VAS misura qualcosa di diverso e aggiuntivo rispetto alle 5 dimensioni.
5. Ultimo ma non meno importante: se avete bisogno di usare un set di valori per riassumere i vostri dati EQ-5D – ad esempio, per stimare i QALY – assicuratevi di fare un’analisi di sensibilità a set di valori alternativi.
I set di valori sono un prodotto delle decisioni dei ricercatori su quali metodi usare e come modellare i dati. Queste decisioni possono potenzialmente avere un effetto non banale sulle caratteristiche dei valori che vengono generati – per esempio, qual è il valore minimo, e quanti valori negativi ci sono, e come appare la distribuzione dei valori. C’è una mancanza di consenso tra i ricercatori su quali siano i metodi “migliori”, e metodi diversi, sia per ottenere i valori che per modellarli, possono portare a risultati diversi.
L’implicazione è che i valori da applicare ai dati EQ-5D hanno qualche incertezza associata ad essi. Ma lo stesso vale per le prove su molte altre cose nell’analisi costo-efficacia, come l’efficacia delle nuove tecnologie e i loro costi. Quindi, proprio come qualsiasi altro parametro incerto in un modello di costo-efficacia, l’implicazione è che gli analisti dovrebbero assicurarsi di controllare se le loro conclusioni sul costo-efficacia sono sensibili alla scelta del set di valori. E, quando i set di valori riportano gli intervalli di confidenza (che dovrebbero tutti!) questi intervalli di confidenza dovrebbero anche far parte dell’analisi di sensibilità nell’analisi costo-efficacia.
Vuoi saperne di più? Riferimenti selezionati:
Devlin N, Parkin D, Browne J. (2010). Utilizzo dell’EQ-5D come strumento di misurazione della performance nel NHS. Health Economics 19(8):886-905.
Parkin D, Devlin N, Rice N. (2010) Analisi statistica dei profili EQ-5D: l’uso dei set di valori distorce l’inferenza? Medical Decision Making 2010; 30:556-565