
Ces dossiers électroniques contiennent à la fois des données codées et des données non codées, comme par exemple les notes prises par les médecins pendant les consultations, en langage naturel. A partir de dossiers de dermatite atopique confirmée, les auteurs ont donc élaboré un algorithme phénotypique incluant un apprentissage par la machine du langage naturel des médecins, y compris leurs possibles fautes d’orthographe. Ils montrent ainsi que la prise en compte des critères de Hanifin et Rajka est plus performante que celle des critères simplifiés de Williams. D’autres perfectionnements sont à prévoir. Mais l’inclusion de l’apprentissage du langage naturel et de ses finesses est riche de promesses.
D’ores et déjà, la machine sait faire la différence entre une note disant « prurit » et une note disant « pas de prurit », pour ne citer qu’un exemple simple, mais en fait pas si simple.
Dr Daniel Wallach