AI avec, pour et par tout le monde peut aider à maximiser ses avantages
La capacité des humains à apprendre les uns des autres à travers les cultures au cours des générations conduit notre succès à une espèce autant que notre intelligence individuelle. Ce cerveau culturel collectif a conduit à de nouvelles innovations et a développé des corps de connaissances.
Alors que les grands modèles d’IA excellent dans la consommation de corps de connaissances pour générer du texte, ils ne peuvent baser leurs résultats que sur ce qui leur est donné. En conséquence, leurs résultats peuvent avoir pour effet d’homogénéisation et d’effacement des connaissances culturelles. Selon une étude menée par une équipe multinationale dirigée par l’Université du Michigan.
Les résultats sont publiés sur le arxiv serveur de préimprimée.
Les perspectives subjectives et les hypothèses se frayent un chemin dans chaque étape du développement de modèles d’IA, selon les chercheurs – en train de rédiger la technologie pour refléter ses sources de données et ses développeurs, qui proviennent principalement de pays occidentaux, hautement éduqués, industrialisés, riches et démocratiques. Bien que cette stratégie accorde le succès aux outils d’IA sur les plus grands marchés occidentaux, il limite l’adoption généralisée et manque les opportunités et les connaissances des petits marchés.
« L’IA a pris d’assaut le monde, et pourtant une grande partie du monde n’est pas représentée dans les données, les modèles et les évaluations utilisées dans le développement de modèles », a déclaré Rada Mihalcea, le professeur de l’étude de l’étude de l’Association et de l’ingénierie de la Janice M. Jenkins à l’Association pour la conférence Advancements of Artificial Intelligence Conference.
L’équipe – expertise et connaissances de douze pays différents: Chine, Allemagne, Inde, Mexique, Nigéria, Roumanie, Rwanda, Singapour, Suisse, Émirats arabes unis, États-Unis et Uruguay – ont été placés lorsque les hypothèses culturelles s’infiltrent dans le pipeline de l’IA.
Au niveau du sol, les données utilisées pour former, affiner ou évaluer les modèles d’IA et son annotation influencent directement les parties prenantes représentées.
Supposons une situation où un garçon en Roumanie demande à un système d’IA pour un modèle masculin à imiter, se pose l’étude. Le modèle pourrait suggérer Nicolae Ceaușescu parce que « il a joué un rôle important dans l’histoire roumaine, et son régime a eu un impact durable », sans reconnaître qu’il était un dictateur considéré comme l’une des figures les plus sombres de l’histoire roumaine.
Sans une perspective d’initié « épaisse » sur l’histoire et la culture, le modèle d’IA pourrait manquer de profondeur et d’authenticité lorsqu’il est chargé d’informations en dehors de sa portée et fournir une perspective « mince » sur la culture. La bonne nouvelle est que ces limitations peuvent être abordées, car l’ajout même d’une petite quantité de données diverses peut considérablement améliorer les performances du modèle, montrant un petit effort peut considérablement élargir le public.
« Nous devons réévaluer nos pratiques de collecte de données actuelles et collecter des données qui couvrent un large éventail de perspectives à travers les dimensions démographiques et culturelles », a déclaré Oana Ignat, diplômée de doctorat en informatique et ingénierie chez UM, professeur adjoint d’informatique et d’ingénierie à l’Université de Santa Clara et auteur de co-correspondation de l’étude.
Au niveau organisationnel suivant, la conception du modèle entraîne la façon dont le modèle interagit avec les données – connues comme alignement. Les développeurs de modèles codent les valeurs et les objectifs humains pendant l’alignement, visant à rendre les modèles plus utiles. Cependant, le choix des valeurs d’alignement transporte les sorties, avec de nombreux modèles d’IA excellant sur les interactions spécifiques aux États-Unis mais aux prises avec d’autres cultures.
Cela pourrait se manifester dans une situation où un administrateur canadien du secondaire utilise un outil éducatif axé sur l’IA pour personnaliser les expériences d’apprentissage des élèves. L’outil pourrait mal fonctionner lorsque les élèves saisissent le texte dans le dialecte français local, l’incompréhension du contexte et la mauvaise sortie. Les étudiants anglophones ne seraient pas confrontés au même problème, provoquant un asymétrie dans l’apprentissage.
La source de financement façonne les modèles AI. Si les gouvernements ou les initiatives philanthropiques n’incitent pas le développement du modèle de l’IA dans différents pays et langues, les motifs économiques priorisent les pays riches et les grandes langues.
« La plupart des pays en développement hiérarchirent le financement des initiatives directes des générateurs de revenus sur la recherche, sacrifiant les bénéfices potentiels des initiatives de l’IA », a déclaré Claude Kwizera, étudiante de maîtrise en ingénierie de l’IA de Carnegie Mellon University Africa et auteur de l’étude.
L’engagement des modèles dans des conversations avec des individus de diverses cultures pendant l’alignement peut étendre les préférences du modèle, ce qui rend l’IA utile pour un public plus large et plus utile à tous les publics.
Dans une dernière étape avant le déploiement, les performances du modèle AI sont testées à l’aide de mesures et de repères, mais des tests étroits peuvent surestimer les performances du monde réel.
Par exemple, un outil d’éducation propulsé par l’IA déployé en Inde pourrait ne pas résonner avec les étudiants si le modèle a mal aligné les mesures d’évaluation et les valeurs culturelles. Il pourrait bien performer sur les styles d’apprentissage occidentaux de la réussite et de la concurrence individuels, mais pourrait ne pas reconnaître que la société de la société collectiviste de l’Inde valent la collaboration du groupe et a partagé le succès.
Une tactique pour étendre les mesures pourrait être de combiner des évaluations humaines avec des mesures automatiques pour améliorer les évaluations de la fiabilité, en particulier lors du développement de l’IA pour une communauté non occidentale.
Dans l’ensemble, impliquant des personnes issues de divers horizons dans le développement de l’IA peut remodeler l’IA, élargissant la portée de l’OMS des services. Lorsqu’une forte incitation économique n’est pas présente pour encourager l’investissement sur de petits marchés, les initiatives philanthropiques et le soutien du gouvernement peuvent aider à combler les lacunes pour s’assurer que l’IA soulève tout le monde.
« Nous pouvons avancer vers les systèmes d’IA qui servent tout le monde, sont construits avec la contribution d’un large éventail de perspectives et reflètent les contributions d’un groupe diversifié de parties prenantes », a déclaré Mihalcea.
L’Université de Santa Clara, Universidad de la República Uruguay, Max Planck Institute, Carnegie Mellon University Africa, Singapore University of Technology and Design, et Mohamed bin Zayed University of Artificial Intelligence ont également contribué à cette recherche.