
C’est dans ces circonstances que les algorithmes de
l’intelligence artificielle (IA) peuvent s’avérer utiles. En
témoignent les résultats d’une méta-analyse basée sur une revue
systématique de la littérature internationale. Les bases de données
électroniques enregistrées entre janvier 2018 et juillet 2020 ont
été explorées, à la recherche d’études comparant les performances
diagnostiques des cliniciens et de l’IA dans la détection des
fractures.
Toutes les modalités d’imagerie étaient autorisées, mais les
algorithmes de segmentation d'images ont été exclus. La
méta-analyse a reposé sur un modèle hiérarchique et les biais ont
été évalués à l’aide de l’outil PROBAST (Prediction Model Study
Risk of Bias Assessment Tool).
Des performances identiques à celles des cliniciens
Au total, 42 études ont été incluses dans l'analyse et 115 tableaux de contingence en ont été extraits, ce qui représente au total 55 061 images. Trente-sept études avaient identifié les fractures sur des radiographies simples et cinq sur des coupes tomodensitométriques. Pour ce qui est des tests de validation interne dans leur ensemble, la sensibilité poolée a été estimée à 92 % (intervalle de confiance à 95 % IC 95 % : 88, 93) pour l'IA et à 91 % (IC 95 % : 85, 95) pour les cliniciens. Les valeurs correspondantes de la spécificité poolée ont été respectivement de 91 % (IC 95 % : 88, 93) pour l'IA et de 92 % (IC 95 % : 89, 92).
Les tests de validation externe ont conduit à des résultats similaires : (1) sensibilité poolée : 91 % (IC 95 % : 84, 95) versus 94 % (IC 95 % : 90, 96) ; (2) spécificité poolée: 91 % (IC 95 % : 81, 95) versus 94 % (IC 95 % : 91, 95). De fait, aucune différence statistiquement significative n’a été mise en évidence entre les performances diagnostiques des cliniciens et celles de l'IA. Sur 42 études (52 %), 22 ont été jugées comme comportant un risque élevé de biais. L’analyse par métarégression a identifié de multiples sources d'hétérogénéité dans les données, y compris le risque de biais et le type de fracture.
Dans la détection des fractures, l’IA semble être aussi performante que les cliniciens en termes de sensibilité et de spécificité. A condition de disposer des bons algorithmes validés en interne et en externe, cette technique semble prometteuse dans l’aide au diagnostic. A suivre…
Dr Philippe Tellier