Possibilité de s’aider de l’intelligence artificielle dans la détection des fractures

Au Royaume-Uni, l’incidence des fractures est comprise entre 733 et 4 017 pour 100 000 patient-années, selon les sources. Entre avril 2019 et avril 2020, 1,2 million de patients se sont présentés aux urgences pour une suspicion de fracture dans ce pays. Le diagnostic n’est pas toujours évident et, dans 3 à 10 % des cas, il est erroné ou tardif. Il existe au demeurant une relation inverse entre l’expérience du clinicien et le taux d’erreurs diagnostiques, la charge de travail venant par ailleurs favoriser ces dernières.

C’est dans ces circonstances que les algorithmes de l’intelligence artificielle (IA) peuvent s’avérer utiles. En témoignent les résultats d’une méta-analyse basée sur une revue systématique de la littérature internationale. Les bases de données électroniques enregistrées entre janvier 2018 et juillet 2020 ont été explorées, à la recherche d’études comparant les performances diagnostiques des cliniciens et de l’IA dans la détection des fractures.

Toutes les modalités d’imagerie étaient autorisées, mais les algorithmes de segmentation d'images ont été exclus. La  méta-analyse a reposé sur un modèle hiérarchique et les biais ont été évalués à l’aide de l’outil PROBAST (Prediction Model Study Risk of Bias Assessment Tool).

Des performances identiques à celles des cliniciens


Au total, 42 études ont été incluses dans l'analyse et 115 tableaux de contingence en ont été extraits, ce qui représente au total 55 061 images. Trente-sept études avaient identifié les fractures sur des radiographies simples et cinq sur des coupes tomodensitométriques. Pour ce qui est des tests de validation interne dans leur ensemble, la sensibilité poolée a été estimée à 92 % (intervalle de confiance à 95 % IC 95 % : 88, 93) pour l'IA et à  91 % (IC 95 % : 85, 95) pour les cliniciens. Les valeurs correspondantes de la spécificité poolée ont été respectivement de   91 % (IC 95 % : 88, 93) pour l'IA et de 92 % (IC 95 % : 89, 92).

Les tests de validation externe ont conduit à des résultats similaires : (1) sensibilité poolée : 91 % (IC 95 % : 84, 95) versus 94 % (IC 95 % : 90, 96) ; (2) spécificité poolée: 91 % (IC 95 % : 81, 95) versus 94 % (IC 95 % : 91, 95). De fait, aucune différence statistiquement significative n’a été mise en évidence entre les performances diagnostiques des cliniciens et celles de l'IA. Sur 42 études (52 %), 22 ont été jugées comme comportant un risque élevé de biais. L’analyse par métarégression a identifié de multiples sources d'hétérogénéité dans les données, y compris le risque de biais et le type de fracture.

Dans la détection des fractures, l’IA semble être aussi performante que les cliniciens en termes de sensibilité et de spécificité. A condition de disposer des bons algorithmes validés en interne et en externe, cette technique semble prometteuse dans l’aide au diagnostic. A suivre…

Dr Philippe Tellier

Référence
Kuo YL et coll. : Artificial Intelligence in Fracture Detection: A Systematic Review and Meta-Analysis. Radiolog. 2022 ; publication avancée en ligne le 29 mars. doi: 10.1148/radiol.211785.

Copyright © http://www.jim.fr

Réagir

Vos réactions

Soyez le premier à réagir !

Les réactions aux articles sont réservées aux professionnels de santé inscrits
Elles ne seront publiées sur le site qu’après modération par la rédaction (avec un délai de quelques heures à 48 heures). Sauf exception, les réactions sont publiées avec la signature de leur auteur.

Réagir à cet article