La technique d'IA d'apprentissage fédéré unique combine protection de la vie privée et efficacité

La technique d'IA d'apprentissage fédéré unique combine protection de la vie privée et efficacité

Une équipe de recherche a développé une nouvelle technique d’intelligence artificielle (IA) d’apprentissage fédéré unique qui permet une formation efficace de modèles à grande échelle sans partager d’informations personnelles. Ce résultat de recherche est extrêmement important, car il démontre que la protection de la vie privée, l’efficacité de l’apprentissage et la performance des modèles peuvent être garanties simultanément dans le domaine de l’analyse d’images médicales.

La recherche est publiée dans la revue Analyse d'images médicales.

L'équipe était dirigée par le professeur Sang-hyun Park du Département de génie robotique et mécatronique de la DGIST et comprenait des chercheurs de l'Université de Stanford aux États-Unis.

Les données d’imagerie médicale contiennent des informations sensibles sur les patients, ce qui limite le partage d’informations entre les hôpitaux et pose des défis majeurs au développement de modèles d’IA utilisant des ensembles de données à grande échelle. L'apprentissage fédéré (FL), proposé comme solution, permet une formation collaborative en partageant des modèles formés au lieu de données brutes sur les patients. Cependant, les transmissions répétées de modèles entraînent des coûts et des délais considérables. One-shot FL a été étudié comme alternative, mais les méthodes existantes ont continué à souffrir de coûts de calcul élevés et de surajustement.

Pour remédier à ces limites, l'équipe du professeur Park a proposé une méthode qui ajoute du bruit structurel aux images synthétiques et applique la technique de confusion pour générer des échantillons intermédiaires virtuels. Cette approche augmente la diversité des données d'entraînement pour réduire le surajustement, tout en réutilisant des images synthétiques pour éliminer les calculs inutiles, améliorant ainsi considérablement l'efficacité des calculs.

L’équipe de recherche a appliqué cette technique à une gamme d’ensembles de données d’imagerie médicale, notamment des images radiographiques, des images pathologiques, des images dermatoscopiques et des images du fond d’œil. Les résultats ont montré que la méthode proposée permettait d'obtenir une plus grande précision avec moins de calculs par rapport aux approches FL ponctuelles existantes.

Le professeur Park a commenté : « Cette recherche est significative car elle montre que même sous des contraintes réalistes telles que la protection de la vie privée et les limitations de communication, il est possible de former des modèles largement applicables dans le domaine de l'imagerie médicale. À l'avenir, nous continuerons à faire progresser cette technique pour développer des modèles d'IA qui englobent diverses populations de patients tout en préservant la vie privée, contribuant ainsi à l'établissement de systèmes d'aide au diagnostic précis et hautement fiables.