5 choses à faire avec les données EQ-5D

Écrit par le professeur Nancy Devlin, directrice de la recherche à OHE et membre du groupe EuroQol

L’EQ-5D est la mesure des résultats rapportés par les patients (PRO) la plus utilisée dans le monde. Depuis une vingtaine d’années, elle est utilisée dans les essais cliniques, les études d’observation, les enquêtes sur la santé de la population et – plus récemment – dans la collecte de données de routine dans les systèmes de soins de santé. Parce qu’il s’agit d’un PRO générique, et parce qu’il est accompagné de  » jeux de valeurs  » (alias  » utilités « ) utilisés dans le calcul des QALY (années de vie ajustées à la qualité), l’EQ-5D est devenu la pierre angulaire de l’évaluation des technologies de la santé (ETS), affectant des décisions importantes sur l’accès aux nouveaux médicaments.

Mais malgré tout, les données EQ-5D sont souvent sous-déclarées, et insuffisamment analysées. L’essentiel est que – si vous recueillez ces données auprès de vos patients, vous devriez vous engager à vous assurer que vous apprenez autant que possible de ce qu’ils vous disent.

Donc : pour tous ceux qui collectent ou rapportent des données EQ-5D, voici mes recommandations sur ce qu’il faut faire avec les données EQ-5D. Cela s’applique à la version originale à trois niveaux, l’EQ-5D-3L ; à la version à cinq niveaux, l’EQ-5D-5L ; à la version adaptée aux enfants, l’EQ-5D-Y – et sans doute, à tout instrument PRO.

1. Ce qu’il ne faut pas faire – ne pas passer directement aux  » utilités  » ou à l’utilisation de scores de toute sorte pour résumer les données des patients

OK : vous avez recueilli des données EQ-5D. C’est formidable pour de nombreuses raisons ! L’EQ-5D est un moyen fantastique de mesurer les résultats de santé d’une manière générique qui peut être comparée à travers les domaines de la maladie. Un ensemble de patients/personnes ont coché des cases pour décrire leur état de santé sur les cinq dimensions. Une approche commune consiste à résumer ces réponses en un seul chiffre sur une échelle ancrée à 1 (pleine santé) en utilisant les ensembles de valeurs disponibles à cet effet (Szende et al 2007). Cela facilite grandement l’analyse des données : après tout – statistiquement, les nombres uniques sont plus faciles que les données catégorielles.

Boulot fait ? Faux !

Vous devez savoir que :

  • Il n’existe pas de manière  » neutre « , ou  » objective  » de résumer les données EQ-5D (ou les données de toute mesure PRO, d’ailleurs !)
  • Quel que soit le  » jeu de valeurs  » que vous utilisez pour résumer vos données EQ-5D, il introduira une source exogène de variance dans l’inférence statistique (Parkin, Devlin et Rice 2010) – c’est-à-dire une variance qui ne provient pas des données que vos patients vous ont fournies. Les conclusions sur l’existence de différences statistiquement significatives entre différents groupes de population ou de patients – ou entre différents bras d’un essai clinique – sont affectées par l’ensemble de valeurs utilisé. Il existe des différences importantes entre les propriétés statistiques des divers ensembles de valeurs disponibles pour l’EQ-5D. (Pour plus d’informations à ce sujet, voir Parkin et al 2014. Nous examinons actuellement ces mêmes éléments en relation avec les données de l’EQ-5D-5L – dont nous ferons bientôt état dans Feng et al 2016).
  • Soyez conscient de l’origine des valeurs ! Les valeurs proviennent d’études de  » préférences déclarées  » : par convention, ces études recueillent les opinions de membres du grand public – à qui l’on demande d’imaginer vivre avec divers problèmes de santé. Nous savons qu’il existe des différences entre le grand public et les patients en ce qui concerne leurs points de vue et leurs opinions sur la qualité ou la gravité des problèmes de santé. Ces ensembles de valeurs fondées sur les préférences ont été élaborés dans un but précis : estimer les QALY. Si vous n’utilisez pas les données EQ-5D pour estimer les QALYs, il se peut qu’il n’y ait pas de raison très forte d’utiliser des ensembles de valeurs pour résumer les données EQ-5D.

Note – rien de tout cela n’est une critique de l’EQ-5D – si ce n’est le contraire ! Le groupe EuroQol est ouvert sur ce genre de questions et a effectué des recherches approfondies à ce sujet. Tous les autres PRO génériques et spécifiques à une condition ont exactement les mêmes problèmes – ils n’en parlent tout simplement pas beaucoup.

2. Regardez les réponses des patients aux éléments des questions (dimensions)

Ne sous-estimez pas l’importance et l’utilité des bonnes vieilles statistiques descriptives ! Les statistiques descriptives sur les données PRO sont sous-évaluées et sous-déclarées dans les articles, ce qui est dommage.

Sommer les données EQ-5D par les ensembles de valeurs ne vous dit pas grand-chose sur les aspects de la santé du patient ou de la population qui ont été les plus affectés par leur état, ou améliorés par le traitement. Pour le savoir, vous devez examiner les données que les patients vous ont réellement fournies : les cases qu’ils ont cochées aux questions de l’EQ-5D. Par exemple, vous devez toujours indiquer le nombre et le pourcentage de patients signalant chaque niveau de problème pour chaque dimension de l’EQ-5D. Si vous voulez simplifier les choses, vous pouvez également regrouper les niveaux 2 et 3, et rapporter le nombre de patients ne signalant « aucun » problème, et le nombre de ceux signalant « tout » problème.

En plus de décrire la santé des patients à un moment donné, vous pouvez être intéressé par la description des changements dans la santé des patients – par exemple, avant ou après une intervention chirurgicale, ou à différents moments d’un essai clinique, par rapport à la ligne de base.

Cela aussi peut être fait au niveau des dimensions de l’EQ-5D. Encore une fois – les statistiques descriptives peuvent vous en dire beaucoup. Par exemple, lorsque nous avons examiné l’évolution du nombre et du pourcentage de patients du NHS ayant subi une arthroplastie de la hanche et signalant des problèmes par dimension (voir le tableau 1 ci-dessous), avant et après l’opération, nous avons constaté des améliorations assez frappantes en ce qui concerne l’anxiété et la dépression, les soins personnels et la douleur/l’inconfort des patients – et pas seulement la mobilité (Devlin et al 2010). En fait, ce qui est frappant, c’est qu’aucun patient n’avait un  » niveau 3  » de mobilité avant l’opération, de sorte que les seules améliorations possibles à la suite de l’opération étaient de  » quelques  » problèmes à  » aucun « . La raison ? Le niveau 3 de la dimension mobilité de l’EQ-5D-3L est « confiné au lit » – et même les patients dont la mobilité est très faible en raison de problèmes de hanche ne sont pas confinés au lit. C’est un problème avec l’EQ-5D-3L – comme nous l’avons déjà souligné (Oppe et al 2011) – et il a été corrigé dans la nouvelle EQ-5D-5L (Herdman et al 2014). Aucune de ces choses n’aurait été apparente si les données de ces patients avaient été analysées uniquement en termes d’utilités.


Source : Devlin et al (2010)

3. Résumer les changements sans utiliser les ensembles de valeurs

Des tableaux comme celui présenté ci-dessus peuvent être très instructifs – mais sont compliqués à regarder, et parfois un résumé global est nécessaire. La bonne nouvelle, c’est qu’il est facile de résumer les changements dans l’état de santé EQ-5D, en utilisant simplement les données que les patients vous ont fournies.

En 2010, nous avons imaginé un moyen de le faire, basé sur les principes d’une amélioration de Pareto en économie du bien-être – la classification de Pareto du changement de santé (PCHC) (Devlin et al 2010). L’idée est simple : un état de santé EQ-5D est considéré comme « meilleur » qu’un autre s’il est meilleur sur au moins une dimension, et n’est pas plus mauvais dans aucune autre dimension. Et un état de santé EQ-5D est considéré comme « pire » qu’un autre s’il est moins bon dans au moins une dimension, et n’est pas meilleur dans aucune autre dimension. En utilisant ce principe pour comparer les états de santé EQ-5D d’un patient entre deux périodes quelconques, il n’y a que 4 possibilités :

– Leur état de santé est meilleur

– Leur état de santé est pire

– Leur état de santé est exactement le même

– Les changements de santé sont  » mixtes  » : meilleurs sur une dimension, mais pires sur une autre.

En appliquant cette méthode aux données sur le remplacement de la hanche, nous avons constaté que moins de 5 % n’ont connu aucun changement, que 82 % ont vu leur santé s’améliorer, que moins de 5 % ont vu leur santé se dégrader et que moins de 10 % ont connu un changement  » mixte  » (Devlin et al 2010). En d’autres termes, cette analyse simple fournit un résumé très clair de l’évolution de la santé des patients suite à une opération de la hanche, sans s’appuyer sur des ensembles de valeurs. Elle a également mis en évidence des différences importantes dans les avantages de la chirurgie de la hanche, par rapport à d’autres types de chirurgie élective.

Il existe également d’autres façons de résumer les données EQ-5D. Je ne vais pas toutes les détailler ici – mais il existe une variété d’approches, et certaines ont des limites importantes comme moyen de résumer les données des patients. Un exemple de cette dernière approche est d’approximer la « gravité » globale d’un état par son « score de somme de niveaux », qui additionne simplement les niveaux de chaque dimension. Le meilleur état de santé EQ-5D-3L implique de n’avoir aucun problème dans aucune des dimensions. Pas de problème » = 1, donc pas de problème du tout (1+1+1+1+1) = 5. Le problème le plus grave, quelle que soit la dimension, est égal à 3, de sorte que le pire état de santé est de (3+3+3+3+3+3) = 15. Chaque autre état de santé de l’EQ-5D-3L aura un score de somme de niveaux entre le meilleur (5) et le pire (15). Cela peut également s’appliquer à l’EQ-5D-5L, où le meilleur est à nouveau 5, et le pire est (5+5+5+5+5+5) = 25. Ces scores de somme de niveaux peuvent être utiles dans certaines situations, mais ils ont des limites évidentes. Il s’agit d’un score synthétique très grossier – par exemple, 22222, 33211 et 11233 ont tous le même score de somme de niveaux (= 10). Et chaque score contient un nombre très différent de profils potentiels (5 et 15 n’ont qu’un seul profil chacun, tandis que le score de somme de niveau 10 contient 51 profils). De plus, ce n’est pas parce qu’il pondère les dimensions de manière égale qu’il est  » sans jugement de valeur  » – une pondération égale des dimensions représente en soi un point de vue sur leur importance (Parkin et al 2010).

4. Utilisez vos données EQ-VAS !

L’EQ-VAS est une échelle de 0 à 100 sur laquelle les patients doivent indiquer leur état de santé général aujourd’hui. Nous (parlant ici en tant que membre du groupe EuroQol !) considérons qu’elle fait partie intégrante du questionnaire EQ-5D – mais elle est souvent complètement négligée et non signalée (ou pire encore – certains utilisateurs la laissent tomber de la collecte de données, même si elle fait partie de l’instrument du droit d’auteur !) L’EQ-VAS offre des informations importantes et complémentaires aux informations sur l’état de santé que les patients fournissent lorsqu’ils déclarent eux-mêmes leur état de santé dans l’EQ-5D. En fait, l’EQ-5D est unique en tant qu’instrument PRO car il génère des données montrant la propre évaluation globale de la santé des patients. Il ne s’agit pas de l’opinion de quelqu’un d’autre sur la qualité ou la dégradation de son état de santé général, s’il s’imagine être dans cet état, mais de l’opinion de la personne qui le vit réellement. Cela ressemble à des informations utiles – et c’est le cas.

Par exemple, l’EQ-VAS peut saisir des problèmes qui ne sont pas pris en compte dans les 5 dimensions de l’EQ-5D – révélant potentiellement certaines lacunes de l’EQ-5D pertinentes pour des groupes de patients particuliers (voir Feng et al 2014). Cela permet d’interpréter les données EQ-5D que vous avez recueillies, et de savoir s’il y a des raisons de penser qu’elles ne rendent pas pleinement compte des effets des problèmes de santé.

Non convaincu ? Jetez un œil à ce diagramme, qui a été généré à partir des vastes quantités de données détenues par le groupe EuroQol. On constate une forte baisse de l’EQ-VAS en fonction de l’âge pour ceux qui déclarent des problèmes sur l’EQ-5D (c’est-à-dire que plus l’âge augmente, plus les problèmes déclarés sur les cinq dimensions augmentent et plus la santé globale auto-évaluée des patients sur l’EQ-VAS augmente également). Mais il est intéressant de noter que l’EQ-VAS diminue avec l’âge, même chez les patients ne signalant aucun problème sur l’EQ-5D. Cela suggère que l’EQ-VAS mesure quelque chose d’un peu différent, et en plus, des éléments des 5 dimensions.

5. Dernier point, mais non le moindre : si vous devez utiliser un ensemble de valeurs pour résumer vos données EQ-5D – par exemple, pour estimer les QALYs – assurez-vous de faire une analyse de sensibilité à des ensembles de valeurs alternatifs.

Les ensembles de valeurs sont le produit des décisions des chercheurs sur les méthodes à utiliser et la façon de modéliser les données. Ces décisions peuvent potentiellement avoir un effet non trivial sur les caractéristiques des valeurs générées – par exemple, quelle est la valeur minimale, et combien de valeurs négatives il y a, et à quoi ressemble la distribution des valeurs. Il n’y a pas de consensus entre les chercheurs sur les méthodes qui sont  » les meilleures « , et différentes méthodes, à la fois pour obtenir des valeurs et pour les modéliser, peuvent conduire à des résultats différents.

Il en résulte que les valeurs à appliquer aux données EQ-5D sont associées à une certaine incertitude. Mais alors, il en va de même pour les preuves sur beaucoup d’autres choses dans l’analyse coût-efficacité, comme l’efficacité des nouvelles technologies, et leurs coûts. Ainsi, comme pour tout autre paramètre incertain dans un modèle de coût-efficacité, les analystes doivent s’assurer qu’ils vérifient si leurs conclusions sur le coût-efficacité sont sensibles au choix de l’ensemble de valeurs. Et, lorsque les ensembles de valeurs font état d’intervalles de confiance (ce qu’ils devraient tous faire !), ces intervalles de confiance devraient également faire partie de l’analyse de sensibilité dans l’analyse coût-efficacité.

Vous voulez en savoir plus ? Références sélectionnées :

Devlin N, Parkin D, Browne J. (2010). Utilisation de l’EQ-5D comme outil de mesure de la performance dans le NHS. Health Economics 19(8):886-905.

Parkin D, Devlin N, Rice N. (2010) Analyse statistique des profils EQ-5D : l’utilisation d’ensembles de valeurs biaise-t-elle l’inférence ? Medical Decision Making 2010 ; 30:556-565

Parkin, D., Devlin, N. et Feng, Y., 2014. Qu’est-ce qui détermine la forme d’une distribution EQ-5D ? Document de recherche de l’OHE 14/04.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.