Le réseau de neurones formé à l'aide d'un ensemble de données diversifié surpasse les algorithmes formés de manière conventionnelle

Une image d’une population à faibles ressources utilisée dans l’ensemble de données : un poêle au Vietnam d’un ménage qui gagne 237 USD/mois. Crédit : Victrixia Montes pour Dollar Street 2015

Des réseaux de neurones artificiellement intelligents, entraînés par des images et des vidéos disponibles sur Internet, peuvent reconnaître des visages, des objets, etc. Mais il y a un sérieux inconvénient. Enseigner aux algorithmes d’apprentissage automatique comment identifier des personnes ou des éléments en s’appuyant uniquement sur la bibliothèque visuelle de visages et d’objets trouvés en ligne sous-représente les groupes socio-économiques et démographiques.

Un chercheur en apprentissage automatique de l’Université de Harvard et des collaborateurs de MLCommons et Coactive AI ont créé un ensemble de données plus diversifié à l’aide d’images d’objets trouvés dans des ménages du monde entier et ont formé un réseau de neurones pour trier les objets en fonction de cet ensemble de données. Leurs conclusions, présentées lors de la conférence sur les systèmes de traitement de l’information neuronale, révèlent que l’utilisation d’images provenant de populations à faibles ressources peut considérablement améliorer les performances de reconnaissance d’objets des systèmes d’apprentissage automatique.

« Il n’y a pas encore eu d’incitation forte à intégrer l’équité et la représentation égale dans les systèmes d’apprentissage automatique », déclare Vijay Janapa Reddi, professeur associé à la John A. Paulson School of Engineering and Applied Sciences (SEAS) de Harvard et auteur principal. du papier. « C’est la vue d’ensemble que nous essayons de capturer avec cette recherche. »

Reddi, qui est également vice-président et membre du conseil d’administration de ML Commons, un consortium de leaders universitaires et industriels de l’IA, s’est associé à des collègues pour former un réseau de neurones à l’aide d’un ensemble de données de 38 479 images d’objets ménagers. La collection de photographies prises dans 404 maisons à travers 63 pays d’Afrique, d’Amérique, d’Asie et d’Europe est connue sous le nom de « Dollar Street » et a d’abord été développée par la Fondation Gapminder. L’entité basée en Suède a envoyé des photographes du monde entier pour amasser des images de brosses à dents, de toilettes, de téléviseurs, de cuisinières, de lits, de lampes et d’autres objets trouvés dans les maisons de familles dont les revenus mensuels se situaient entre l’équivalent américain de 26,99 $ et 19 671 $.

« Nous devons être conscients des biais plus profonds dans nos systèmes d’apprentissage automatique », déclare Reddi. « Le même mot pourrait être donné pour décrire les poêles à travers le monde, mais si vous regardez ce qu’on appelle un poêle dans les zones sous-représentées par rapport à ce que l’on trouve dans les maisons riches, ces objets peuvent avoir une apparence et un fonctionnement complètement différents. »

Dans leur article, les chercheurs décrivent un autre exemple frappant : dans certains foyers pauvres du monde, une personne peut utiliser sa main pour se brosser les dents. Dans l’ensemble de données de Dollar Street, une image de la main de quelqu’un peut donc être étiquetée à la fois comme « paume de la main » et « brosse à dents ».

Le réseau de neurones formé à l'aide d'un ensemble de données diversifié surpasse les algorithmes formés de manière conventionnelle — Un réchaud au Burundi d’un ménage gagnant 37 $ US/mois. Crédit : Johan Eriksson pour Dollar Street 2015

En utilisant la collection d’images de Dollar Street, qui a été développée par MLCommons dans un ensemble de données robuste contenant des noms/étiquettes d’objets, des données géographiques et le revenu mensuel des ménages, l’équipe a découvert que leur réseau de neurones entraîné fonctionnait considérablement mieux que les systèmes de pointe pour classer avec précision les ménages. articles, en particulier les objets trouvés dans les foyers à faible revenu. Leur algorithme d’apprentissage automatique a correctement identifié les objets 65 % plus fréquemment que les réseaux de neurones couramment utilisés, y compris ImageNet et Open Images, formés sur des ensembles de données moins diversifiés provenant d’Internet.

« Il est choquant de voir ce que les modèles d’apprentissage automatique de pointe tiennent pour acquis et à quel point ils réussissent à identifier correctement les objets à partir de paramètres à faibles ressources », déclare Reddi.

Alors que l’industrie et le gouvernement s’appuient de plus en plus sur les systèmes d’apprentissage automatique pour traiter les informations et prendre des décisions, Reddi affirme que cette recherche de preuve de concept démontre le danger des réseaux de neurones formés sans données inclusives représentant les populations à faibles ressources.

« Dollar Street a été un outil puissant pour lutter contre les idées fausses et les préjugés humains, et nous pensons qu’il a le potentiel de faire de même pour les machines », déclare Cody Coleman, co-auteur principal de l’article, qui est PDG et co-fondateur de IA coactive.

« Dollar Street démontre l’importance des données dans l’apprentissage automatique au sens général, et en particulier la capacité de données soigneusement sélectionnées à avoir un impact démesuré sur les biais », déclare David Kanter, co-auteur de l’article, fondateur et directeur. directeur de MLCommons. « J’espère qu’en hébergeant et en maintenant Dollar Street, nous donnerons à la communauté de la recherche et à l’industrie les moyens de développer des techniques afin que l’apprentissage automatique profite à tous dans le monde, en particulier dans les régions moins développées. »

« Les systèmes artificiellement intelligents, s’ils ne sont pas construits de manière équitable et inclusive, accéléreront le fossé entre les communautés à ressources élevées et celles à faibles ressources », a déclaré Reddi. « Lorsque vous créez des ensembles de données pour former des systèmes d’apprentissage automatique, et que vous construisez ces données à partir d’un endroit riche en ressources et que vous ne vous efforcez pas d’acquérir et d’inclure des données provenant de zones à faibles ressources, les implications pour le biais appris deviennent Une IA responsable signifie rendre l’apprentissage automatique accessible et représentatif à l’échelle mondiale. »

Fourni par l’Université de Harvard