Un nouvel outil d'IA apprend à lire des images médicales avec beaucoup moins de données

Un nouvel outil d'intelligence artificielle (IA) pourrait rendre les choses beaucoup plus faciles – et moins chères – pour les médecins et les chercheurs pour former des logiciels d'imagerie médicale, même lorsque seul un petit nombre de analyses de patients sont disponibles.

L'outil AI améliore un processus appelé segmentation d'image médicale, où chaque pixel d'une image est étiqueté en fonction de ce qu'il représente – des tissus cancéreux ou normaux, par exemple. Ce processus est souvent effectué par un expert hautement qualifié, et l'apprentissage en profondeur s'est révélé prometteur dans l'automatisation de cette tâche à forte intensité de main-d'œuvre.

Le grand défi est que les méthodes basées sur l'apprentissage en profondeur ont faim de données – elles nécessitent une grande quantité d'images annotées de pixel par pixel pour apprendre, a expliqué Li Zhang, un doctorat. Étudiant au Département de génie électrique et informatique de l'Université de Californie San Diego. La création de tels ensembles de données exige la main-d'œuvre, le temps et les coûts experts. Et pour de nombreuses conditions médicales et paramètres cliniques, ce niveau de données n'existe tout simplement pas.

Pour surmonter cette limitation, Zhang et une équipe de chercheurs dirigée par l'UC San Diego, le professeur d'ingénierie en électricité et informatique, Pengtao Xie, a développé un outil d'IA qui peut apprendre la segmentation d'image à partir d'un petit nombre d'échantillons marqués d'experts. Ce faisant, cela réduit la quantité de données généralement requises par jusqu'à 20 fois. Cela pourrait potentiellement conduire à des outils de diagnostic plus rapides et plus abordables, en particulier dans les hôpitaux et les cliniques avec des ressources limitées.

L'œuvre est publiée dans Communications de la nature.

« Ce projet est né de la nécessité de briser ce goulot d'étranglement et de rendre les outils de segmentation puissants plus pratiques et accessibles, en particulier pour les scénarios où les données sont rares », a déclaré Zhang, qui est le premier auteur de l'étude.

Un nouvel outil d'IA apprend à lire des images médicales avec beaucoup moins de données

L'outil d'IA a été testé sur une variété de tâches de segmentation d'images médicales. Il a appris à identifier les lésions cutanées dans les images de dermoscopie; Cancer du sein dans les échographies; navires placentaires dans les images fœtoscopiques; polypes dans les images de coloscopie; et les ulcères de pied dans des photos de caméra standard, juste pour énumérer plusieurs exemples. La méthode a également été étendue à des images 3D, telles que celles utilisées pour cartographier l'hippocampe ou le foie.

Dans les paramètres où les données annotées étaient extrêmement limitées, l'outil AI a augmenté les performances du modèle de 10 à 20% par rapport aux approches existantes. Il nécessitait 8 à 20 fois moins de données d'entraînement dans le monde réel que les méthodes standard tout en les correspondant ou en les surpassant souvent.

Zhang a décrit comment cet outil d'IA pourrait potentiellement être utilisé pour aider les dermatologues à diagnostiquer le cancer de la peau. Au lieu de rassembler et d'étiqueter des milliers d'images, un expert formé de la clinique pourrait seulement avoir besoin d'annoter 40, par exemple. L'outil d'IA pourrait ensuite utiliser ce petit ensemble de données pour identifier les lésions suspectes des images de dermoscopie d'un patient en temps réel. « Cela pourrait aider les médecins à se faire un diagnostic plus rapide et plus précis », a déclaré Zhang.

Le système fonctionne par étapes. Premièrement, il apprend à générer des images synthétiques à partir de masques de segmentation, qui sont essentiellement des superpositions codées par couleur qui indiquent à un algorithme quelles parties d'une image sont, par exemple, saines ou malades. Ensuite, il utilise ces connaissances pour créer de nouvelles paires de masques d'image artificielles pour augmenter un petit ensemble de données d'exemples réels. Un modèle de segmentation est formé à l'aide des deux. Grâce à une boucle de rétroaction continue, le système affine les images qu'il crée en fonction de la façon dont ils améliorent l'apprentissage du modèle.

La boucle de rétroaction est une grande partie de ce qui fait que ce système fonctionne si bien, a noté Zhang. « Plutôt que de traiter la génération de données et la formation du modèle de segmentation comme deux tâches distinctes, ce système est le premier à les intégrer.

Pour l'avenir, l'équipe prévoit de rendre son outil d'IA plus intelligent et plus polyvalent. Les chercheurs prévoient également d'intégrer les commentaires des cliniciens directement dans le processus de formation pour rendre les données générées plus pertinentes pour une utilisation médicale du monde réel.