Publié le 12/09/2016

Les résultats sont négatifs ! What else ?

Nos lecteurs qui nous font l'honneur de nous suivre depuis des années (quand ce n'est pas des décennies !), sont habitués à la publication sur JIM d'analyses et de commentaires d'essais cliniques au cours desquels aucune différence statistiquement significative n'est mise en évidence sur le critère principal de jugement pré-spécifié. Ces études où la valeur de p n'atteint pas le seuil fatidique de 0,05 sont généralement considérées comme négatives (par les promoteurs de l'essai et par les praticiens) et le traitement testé est jugé inefficace et abandonné.

Mais, comme le rappellent Stuart Pocock et Gregg Stone dans une mise au point remarquable publiée par le New England Journal of Medicine, une étude aux résultats en apparence négatifs ne doit pas nécessairement conduire à l'abandon de l'hypothèse testée et du protocole thérapeutique expérimenté.

12 questions clefs

En se basant sur des exemples tirés d'essais randomisés cardiologiques publiés récemment, pour ces deux auteurs britanniques et américains, face à un essai apparemment négatif il est indispensable que les responsables de l'étude (et les praticiens simple lecteurs) se posent 12 questions clefs avant de conclure à l'absence d'intérêt du traitement testé.

1) Malgré l'absence de significativité statistique des résultats sur le critère principal de jugement, existe-t-il des arguments en faveur d'un effet positif du traitement testé (par exemple sur l'un des éléments d'un critère composite de jugement)?

2) L'essai en cause avait-il une puissance suffisante ? En d'autres termes avait-il inclus le nombre de patients nécessaire pour permettre de conclure et d'écarter une erreur de type 2 ? Si tel n'est pas le cas, ce qui est fréquent pour des pathologies relativement rares, il convient de considérer l'essai comme non concluant plutôt que comme négatif.

3) Le critère principal de jugement avait-il été choisi et défini judicieusement ? Par exemple n'avait-il pas inclus dans le cadre d'un critère composite, des événements sur lesquels le traitement testé ne pouvait avoir d'influence ?

4) La population étudiée était-elle adaptée (patients "insuffisamment" atteints par exemple) ?

5) Le protocole thérapeutique étudié (posologie, durée...) était-il approprié ?

6) Le traitement testé a-t-il été correctement suivi ou y-a-t-il eu beaucoup de déviations du protocole pouvant expliquer une absence de significativité statistique ?

7) Peut-on, malgré la non supériorité du traitement testé, établir sa non infériorité ? Ceci peut avoir une importance pratique lorsque la thérapeutique étudiée a, par exemple, des avantages en termes de tolérance ou de coûts.

8) Des résultats positifs dans un ou des sous groupes, pré-spécifiés ou post-hoc, justifient-ils de conduire un nouvel essai randomisé (comme cela a été le cas par exemple dans l'étude SYNTAX au cours de laquelle la revascularisation per-cutanée est apparue possiblement supérieure au pontage pour le sous groupe des patients atteints de sténose du tronc commun de la coronaire gauche) ?

9) Des résultats positifs sur un ou des critères secondaires de jugement peuvent-ils remettre en cause le caractère négatif de l'étude et justifier de nouveaux essais ? C'est ainsi par exemple que dans l'étude ASCOT comparant amlodipine et aténolol dans l'hypertension l'amlodipine s'est révélée non supérieure à l'aténolol sur le critère principal de jugement (infarctus non fatal et décès par pathologie coronaire) mais significativement supérieure sur les AVC, les événements cardiovasculaires défavorables, la mortalité toute cause et l'apparition de diabète ce qui a conduit à modifier certaines recommandations.

10) De nouvelles analyses des données recueillies aboutissent-elles à des résultats divergents ? Il peut s'agir d'analyses ajustées, d'examen des résultats en per protocole plutôt qu'en intention de traiter, d'analyses tenant compte non plus de la survenue d'un premier événement défavorable (comme cela est habituel) mais de la répétition de ces événements. Cela a été le cas de l'étude CHARM au cours de laquelle le risque d'hospitalisation pour insuffisance cardiaque ne paraissait pas réduit sous candesartan lorsque l'on ne tenait compte que de la première hospitalisation mais l'était si l'on incluait dans l'analyse la répétition des hospitalisations.

11) Existe-t-il d'autres études de bonne qualité méthodologique (essais randomisés ou méta-analyse) donnant des résultats positifs statistiquement significatifs avec des protocoles similaires ? Dans ces cas, surtout si p est proche de la significativité statistique, il faut peut-être envisager de nouvelles études.

12) Y a-t-il des arguments biologiques très forts en faveur de l'efficacité du traitement ? Pour les auteurs ce type de motif ne doit pas en général remettre en cause le caractère négatif d'un essai mais doit plutôt faire envisager une révision des hypothèses physiopathologiques.

Un résultat négatif n'exclut pas une autorisation de mise sur le marché !

Pour les auteurs, les réponses à ces 12 questions conduisent à 3 types de conclusions :

- le plus souvent le caractère négatif de l'étude est confirmé et le traitement abandonné;
- le doute persiste et il convient de conduire de nouvelles études sur la thérapeutique testée (il en est ainsi par exemple de la dénervation rénale dans l'hypertension pour laquelle les résultats de l'essai randomisé SYMPLICITY HTN-3 ont été négatifs contre toute attente).
- L'étude est considérée comme positive malgré l'absence de significativité statistique des résultats sur le critère principal de jugement. Cela peut, rarement, conduire à une autorisation de mise sur le marché ou à une nouvelle indication. Cela a été la décision de certaines autorités sanitaires, par exemple, après la publication de l'étude CAPRICORN sur le carvedilol dans la dysfonction ventriculaire gauche après infarctus du myocarde où les résultats étaient négatifs sur un critère de jugement composite (décès ou hospitalisations) mais positifs sur un critère fondamental, la mortalité toutes causes.

On le voit la lecture critique d'articles n'est pas qu'un exercice scolaire mais est une étape essentielle de la recherche clinique et un must pour les praticiens sollicités de façon pluriquotidienne (notamment par le JIM !) par des résultats d'études...

Dr Anastasia Roublev

Les résultats sont négatifs ! What else ?

12 questions clefs

Un résultat négatif n'exclut pas une autorisation de mise sur le marché !

CAPRICORN démontre une diminution de la mortalité sous carvedilol chez les patients présentant une dysfonction ventriculaire gauche après infarctus.

Coup de théâtre : la dénervation sympathique rénale en échec dans l’HTA

Supériorité confirmée du pontage surtout chez les diabétiques

Vos réactions (2)

Biais méthodologiques

Re: Biais méthodologiques

Sondage

En ce moment...

Flash

Interview

Médecins pour demain : « Les vœux du chef de l’Etat ont consterné la profession »