Nouveau système pour rendre la formation à l’IA plus facile et plus précise
Au cours des dernières années, « l’IA » est devenue un mot à la mode majeur dans la technologie. La perspective qu’un ordinateur soit capable d’effectuer des tâches que seul un humain pourrait effectuer est une pensée captivante.
Les IA peuvent être créées à l’aide de plusieurs méthodes différentes, mais l’une des plus populaires à l’heure actuelle implique l’utilisation de réseaux de neurones profonds (DNN). Ces structures tentent d’imiter les connexions neuronales et la fonction du cerveau et sont généralement formées sur un ensemble de données avant d’être déployées dans le monde réel. En les formant au préalable sur un ensemble de données, les DNN peuvent être «enseignés» pour identifier les caractéristiques d’une image. Ainsi, un DNN peut apprendre à identifier une image avec, par exemple, un bateau dedans en étant formé sur un ensemble de données d’images avec des bateaux.
Cependant, l’ensemble de données d’entraînement peut causer des problèmes s’il n’est pas correctement conçu. Par exemple, en ce qui concerne l’exemple précédent, étant donné que les images de bateaux sont généralement prises lorsque le bateau est dans l’eau, le DNN peut ne reconnaître que l’eau, au lieu du bateau, et toujours dire que l’image contient un bateau. C’est ce qu’on appelle un biais de cooccurrence et c’est un problème très courant rencontré lors de la formation des DNN.
Pour résoudre ce problème, une équipe de chercheurs, dont Yi He, un chercheur du Japan Advanced Institute of Science and Technology (JAIST), le maître de conférences Haoran Xie du JAIST, le professeur agrégé Xi Yang de l’Université de Jilin, le maître de conférences du projet Chia-Ming Chang de l’Université de Tokyo, et le professeur Takeo Igarashi, ont fait état d’un nouveau système humain dans la boucle. Un article détaillant ce système a été publié dans le Actes de la 28e Conférence internationale sur les interfaces utilisateur intelligentes (ACM IUI 2023).
Le professeur Xie déclare : « Il existe des méthodes existantes pour résoudre le biais de cooccurrence en réorganisant l’ensemble de données ou en disant au système de se concentrer sur des zones spécifiques de l’image. Mais la réorganisation de l’ensemble de données peut être très difficile, alors que les méthodes actuelles de marquage les régions d’intérêt (ROI) nécessitent de nombreuses annotations pixel par pixel par des humains embauchés pour le faire, ce qui entraîne un coût élevé. Ainsi, nous avons créé une méthode d’attention beaucoup plus simple qui aide les humains à indiquer le retour sur investissement dans l’image en utilisant une méthode simple -méthode de clic. Cela réduit considérablement le temps et les coûts pour la formation DNN, et donc, le déploiement. »
L’équipe s’est rendu compte que les approches précédentes de guidage de l’attention étaient inefficaces car elles n’étaient pas conçues pour être interactives. Ainsi, ils ont proposé une nouvelle méthode interactive pour annoter des images en un clic. Les utilisateurs n’ont qu’à cliquer avec le bouton gauche sur les parties de l’image à identifier et, le cas échéant, avec le bouton droit sur les parties de l’image à ignorer.
Ainsi, dans le cas des images avec des bateaux, les utilisateurs feront un clic gauche sur le bateau et un clic droit sur l’eau qui l’entoure. Cela aide le DNN à mieux identifier le bateau et réduit les effets du biais de cooccurrence inhérent aux ensembles de données de formation. Afin de réduire le nombre d’images à annoter, une nouvelle stratégie d’apprentissage actif utilisant un modèle de mélange gaussien (GMM) a été conçue.
Ce nouveau système a été testé par rapport aux systèmes existants, à la fois numériquement et par le biais d’enquêtes auprès des utilisateurs. Les analyses numériques ont montré que la nouvelle méthode d’apprentissage actif était plus précise que toutes les méthodes existantes, tandis que les enquêtes auprès des utilisateurs ont montré que le système basé sur les clics réduisait le temps nécessaire pour annoter le retour sur investissement de 27 %, et 81 % des participants l’ont préféré à d’autres systèmes.
Xie déclare : « Notre travail peut considérablement améliorer la transférabilité et l’interprétabilité des réseaux de neurones en augmentant leur précision pour les applications du monde réel. Lorsque les systèmes prennent des décisions correctes et claires, cela augmente la confiance des utilisateurs dans l’IA et facilite le déploiement de ces systèmes. dans le monde réel. Ainsi, notre travail se concentre sur l’augmentation de la fiabilité des déploiements DNN, ce qui peut avoir un impact majeur sur l’application et le développement des technologies d’IA dans la société. »
L’équipe pense que leur travail pourrait avoir une forte influence sur l’industrie technologique et permettre davantage d’applications des technologies d’IA dans un avenir proche.
Fourni par Japan Advanced Institute of Science and Technology