Big Data en santé, de nouveaux défis

Le New England Journal of Medicine a publié le 11 octobre dernier une revue sur la thématique innovantes des big data en santé et les implications pour la classification des maladies et l’ontologie à la suite des travaux d’une équipe de recherche translationnelle nord-américaine. Consistant en la mise en application concrète des découvertes de la recherche fondamentale pour satisfaire les besoins de santé restés sans réponse, la recherche translationnelle représente un continuum, une passerelle directe et bidirectionnelle entre ces deux approches et se veut par essence pluridisciplinaire.

Un des objectifs de la médecine de précision et personnalisée est de construire un réseau d’informations et de connaissances pour la recherche biomédicale en s’appuyant notamment sur une nouvelle taxonomie des maladies. Ce sont ces aspects sur lesquels se sont penchés les auteurs.

Une corne d’abondance

Le volume des données concernant la santé et leur taux de croissance représentent un défi sans précédent dans l’histoire de l’humanité. Cette « marée » de données a vu sa provenance varier avec l’avènement des nouvelles technologies telles que la génomique, la protéomique, s’ajoutant aux données métaboliques, biologiques, cliniques et d’imagerie… Si le dossier médical partagé a peiné (et lutte encore) pour s’installer en France, ailleurs il représente une véritable mine d’informations d’ores et déjà exploitées et exploitables. Une des ambitions majeures est de faire porter du sens à ces données. Souvent, les informations phénotypiques individuelles des patients sont insuffisamment détaillées ou inaccessibles (notamment car elles ont, par exemple en France, une vocation initiale de tarification, comme les données PMSI, plus que de documentation médicale), ce qui limite la détection de similarités entre les patients et leur classification dans des groupes cliniquement utiles. La médecine de précision a en elle l’objectif d’y remédier, notamment dans les cas des troubles mal étiquetés présentant un spectre de symptômes, signes, biomarqueurs et éléments génotypiques particuliers, pour reconnaître des similarités et stratifier ainsi les patients. Les retombées possibles concernent bien sûr le domaine  thérapeutique : par exemple, l’identification de la mutation de BRAF au niveau des mélanomes et des histiocytoses langheransiennes a permis un traitement commun efficace par vemurafenib.

Le challenge d’une classification cohérente et comparable

Pour que ces informations soient accessibles et ainsi utilisables, il convient avant tout de les rendre compatibles : si cela semble logique, la réalité n’est pas toujours aussi simple. Un des challenges réside dans cette compatibilité. Autrement dit, les données (par exemple, un taux de cholestérol, une image de stéatose hépatique, un poids) qui s’expriment dans des métriques différentes, doivent être converties en une langue commune. Dans l’élaboration d’une classification, les logiciels nécessitent qu’on leur confirme les équivalences de terme, sans cela, pas de comparaisons possibles entre des données d’un laboratoire à un endroit donné et celles d’un hôpital… De manière similaire, on constate aujourd’hui que les classifications de maladies ne se superposent pas toujours, comme c’est par exemple le cas pour la CIM-10 (Classification Internationale des Maladies) et la SNOMED-CT (Systematied Nomenclatrue Of MEDicine Clinical Terms).

Vers de nouvelles ontologies

L’ontologie a cela de particulier qu’elle permet de définir des relations entre les concepts de sorte que les algorithmes soient capables d’esquisser des conclusions d’après des assertions. Par exemple, si un virus est classé comme agent infectieux et une infection méningée, comme un type de méningite liée à un agent infectieux, alors le système conclura qu’une méningite virale est une sous-classe des infections méningées.

Pouvant être utilisée comme moyens de classification des maladies, la plus ancienne ontologie est celle de Carl Linné. Bien qu’elle comporte des erreurs, elle a été la base de la première édition de la CIM en 1893. Toutefois, l’utilisation de données supplémentaires, notamment celles des nouveaux paramètres « omiques » n’est pas possible et ne permet malheureusement pas son enrichissement. L’utilisation croissante du biomonitoring et de dispositifs de santé connectés laisse présager que de nouvelles informations vont venir se surajouter : l’intérêt de l’ontologie est de pouvoir aider à les organiser et les analyser alors même que l’esprit humain serait dépassé par l’immensité de la tâche. La route est longue entre ces recherches qui ont pour but, avant tout, d’améliorer la prise en charge de nos patients. L’identification précise de la pathologie du patient, sa classification au sein d’une ontologie adaptée doit servir le rêve longtemps caressé d’adapter un traitement le plus justement possible, afin qu’il soit le plus efficace et le mieux toléré. C’est là le rôle que doit jouer la médecine personnalisée. Mais pour y parvenir, des barrières persistantes doivent être franchies, comme les questions de l’encadrement légal, de la protection de la confidentialité des données (la RGPD apportant une première « réponse » à ces problématiques), le coût induit par la gestion de ces bases de données, et leur manque de comparabilité et d’harmonisation. Autant de défis passionnants qui ne demandent qu’à être relevés !

Justine Diehl

Référence
Haendel MA, Chute CG, Robinson PN : Classification, Ontology, and Precision Medicine. N Engl J Med. 2018; 379 : 1452-1462. doi: 10.1056/NEJMra1615014.

Copyright © http://www.jim.fr

Réagir

Vos réactions

Soyez le premier à réagir !

Les réactions aux articles sont réservées aux professionnels de santé inscrits
Elles ne seront publiées sur le site qu’après modération par la rédaction (avec un délai de quelques heures à 48 heures). Sauf exception, les réactions sont publiées avec la signature de leur auteur.

Réagir à cet article