Analyser les résultats des essais cliniques

Introduction

Lorsque les compagnies pharmaceutiques effectuent des essais cliniques, les informations médicales des patients prenant part (mais non leurs identités) sont recueillies dans une base de données informatique avec les résultats de toutes les mesures effectuées. Des analyses statistiques sont ensuite effectuées afin d’évaluer officiellement les résultats de l’essai.

Les analyses des résultats des essais cliniques couvrent trois domaines d’intérêt :

  • Les informations initiales et démographiques
  • L’efficacité
  • L’innocuité

Ces domaines sont décrites plus en détail ci-dessous. Le type et la conception de l’essai clinique jouent un rôle important dans l’interprétation des analyses statistiques.

Les informations initiales et démographiques

Qui a pris part à l’essai ? Les effets d’un médicament peuvent varier considérablement entre les différents groupes de patients. Il est donc important de connaître les informations de tous les patients de l’essai, telles que :

  • L’âge
  • Le sexe
  • L’origine ethnique
  • La gravité de leur maladie

En général, plus il y a une correspondance entre un groupe d’essai et une population d’intérêt, plus les résultats seront pertinents.

L’efficacité

Comment est-ce que le médicament de l’essai fonctionne ? Cette partie de l’analyse est basée sur des “critères” pré-définis. Ce sont des mesures spécifiques liées à la maladie en question. Les critères sont spécifiés à l’avance dans le protocole d’essai (le document qui décrit en détail comment l’essai sera effectué).

Les critères en général peuvent être classés comme suit :

  • Les critères “forts” – ceux qui prennent la forme de faits numériques avec une importance clinique intrinsèque. Par exemple, combien de temps le patient a survécu ou quelle proportion de patients se sont rétablis après d’une infection.
  • Les critères “légers” – ceux qui sont susceptibles d’être influencés par le processus de mesure ou une reproductibilité contestable. Par exemple, un questionnaire sur la qualité de vie ou la description de l’humeur du patient à un moment donné. Afin d’être analysés statistiquement, les critères légers doivent être convertis dans un format numérique. Ce processus peut être controversé car il s’appuie souvent sur des données subjectives et il est susceptible de donner lieu à des incohérences.
  • Les critères “de substitution” – ceux qui ne font pas partie en eux-mêmes de l’expérience du patient de la maladie, mais qui peuvent être étroitement liés à elle. Par exemple, les résultats de tests de laboratoire.

En général, les critères forts sont préférables aux critères légers et aux critères de substitution. Les critères légers et de substitution doivent être évalués avec soin selon la façon dont ils représentent la maladie étudiée.

Le choix des critères à utiliser dépend fortement de la nature de la maladie étudiée. Le cancer, par exemple, offre des critères forts évidents qui viennent sous la forme de la survie, alors qu’une évaluation de la dépression doit inévitablement s’accompagner de critères plus légers. D’autres maladies, comme le diabète, sont associées à des critères de substitution bien établis tels que les niveaux de sucre dans le sang.

L’innocuité

Quels sont les effets secondaires de ce médicament ? Chaque fois que le médecin menant un essai clinique voit un patient, il lui demande s’il a subi quelque chose d’anormal. Des informations sur ces “effets indésirables” sont recueillies et analysées plus tard pour donner un aperçu d’une relation possible de causalité avec le médicament étudié. Si une telle relation causale est établie, l’événement indésirable devient une “réaction indésirable” ou effet secondaire. Une attention particulière est accordée aux effets indésirables “graves” – ceux qui mettent la vie en danger ou sont associés à un décès, une hospitalisation ou des anomalies congénitales.

Type d’essai clinique

Les essais cliniques varient considérablement en taille, durée et conception. Ces facteurs jouent un rôle majeur dans l’interprétation des résultats des essais.

La conception d’essai clinique la plus informative est la “comparaison randomisée en double-aveugle”, dans laquelle certains patients reçoivent le nouveau médicament, tandis que d’autres reçoivent un traitement alternatif. Le traitement alternatif, parfois appelé le “contrôle”, peut être soit :

  • Un placebo – un traitement “factice” inactif
  • Un produit de comparaison actif – généralement un traitement bien établi pour la maladie étudiée.

Les participants sont affectés à chaque groupe d’étude par hasard. L’essai est configuré de sorte que même si l’étude se poursuit, ni le médecin ni le patient ne sait qui reçoit quel traitement. Un essai mis en place comme cela est dit être en “double-aveugle”. Les essais en double-aveugle réduisent le risque de biais dans les résultats.

Dans de tels essais, les résultats sont présentés en termes de différence entre le groupe recevant le nouveau médicament et le groupe recevant le traitement de contrôle :

  • Lorsque la comparaison se fait contre un placebo, cette différence est une mesure de l’effet réel du nouveau médicament.
  • Lorsque la comparaison est faite avec un comparateur actif, la différence donne un aperçu de la manière dont le nouveau médicament soutient la comparaison avec la pratique actuelle de la médecine.

Dans les deux cas, deux aspects de la différence sont susceptibles d’être signalés :

  • La taille : Elle est souvent signalée comme la différence réelle enregistrée dans un essai particulier avec un “intervalle de confiance de 95%”. C’est la plage dans laquelle nous pouvons être sûrs à 95% que la vraie différence réside pour la population. Bien que vous puissiez détecter une importance statistique, cela peut ne pas être cliniquement significatif. En règle générale, plus grande qu’est cette différence, plus elle est susceptible d’être cliniquement pertinente (accroître les chances de survie d’un an a une plus grande importance clinique que de les augmenter d’une journée).
  • L’importance statistique : Étant donné que certaines personnes réagissent mieux que d’autres au traitement, il y a toujours un risque que la différence entre les groupes considérés dans le cadre d’un essai clinique peut être survenue par hasard. Par exemple, si tous ceux qui donnent des bonnes réponses intrinsèquement étaient randomisés dans un groupe, et ceux qui donnent des mauvaise réponses dans un autre. Les statisticiens peuvent calculer les probabilités pour que ce scénario se soit produit dans un essai clinique particulier et ils expriment leur résultat sous forme de “valeur-p”.

Une valeur-p de 0,05 signifie qu’il y a 5% ou 1 chance sur 20 que la différence soit arrivée par hasard. Elle est prise conventionnellement comme seuil d’acceptation pour accepter les résultats comme “statistiquement importants”. Il est important de réaliser que le mot “important” utilisé dans ce sens ne dit rien à propos de l’importance médicale des résultats – il offre seulement l’assurance que le résultat n’est probablement pas fortuit. Par exemple, une augmentation d’un mètre dans une distance de marche de six minutes pourrait, dans un essai assez grand, s’avérer statistiquement importante (c.-à-d. peu susceptible d’être survenue par hasard) mais elle ne serait jamais considérée par un patient ayant une défaillance cardiaque ou par son médecin comme ayant une valeur clinique.

Un deuxième groupe important d’essais cliniques, souvent menés pour enquêter sur l’innocuité à long terme, prend la forme d’essai “en ouvert”. Dans ceux-ci, il n’y a pas de groupe de contrôle – tout le monde est traité avec le nouveau médicament et leur expérience est enregistrée. Aucune différence entre les groupes ne peut survenir (soit accidentellement, soit par le biais de véritables effets thérapeutiques) et il n’y a donc pas de place pour des tests d’importance. Équilibrés contre ces failles, les essais ouverts comprennent souvent un grand nombre de patients (jusqu’à plusieurs milliers) étudiés pendant de longues périodes de temps (plusieurs années dans certains cas). Ces essais rendent donc plus facile de détecter les effets indésirables rares et ceux qui prennent du temps à se développer.

Les résultats de ces essais sont présentés comme de simples tableaux répertoriant différents événements indésirables et la fréquence à laquelle ils étaient repérés.