L’intelligence artificielle doit être formée sur des ensembles de données culturellement divers pour éviter les préjugés

L’intelligence artificielle doit être formée sur des ensembles de données culturellement divers pour éviter les préjugés

Les grands modèles de langage (LLM) sont des programmes d’intelligence artificielle d’apprentissage profond, comme ChatGPT d’OpenAI. Les capacités des LLM se sont développées dans un éventail assez large, allant de la rédaction d’essais fluides au codage en passant par l’écriture créative. Des millions de personnes dans le monde utilisent les LLM, et il ne serait pas exagéré de dire que ces technologies transforment le travail, l’éducation et la société.

Les LLM sont formés en lisant d’énormes quantités de textes et en apprenant à reconnaître et à imiter des modèles dans les données. Cela leur permet de générer un texte cohérent et humain sur pratiquement n’importe quel sujet.

Parce qu’Internet est encore majoritairement anglais (59 % de tous les sites Web étaient en anglais en janvier 2023), les LLM sont principalement formés sur des textes en anglais. De plus, la grande majorité des textes anglais en ligne proviennent d’utilisateurs basés aux États-Unis, où vivent 300 millions d’anglophones.

Apprenant le monde à partir de textes anglais rédigés par des internautes basés aux États-Unis, les LLM parlent l’anglais américain standard et ont une vision occidentale, nord-américaine ou même centrée sur les États-Unis.

Biais du modèle

En 2023, ChatGPT, après avoir entendu parler d’un couple dînant dans un restaurant à Madrid et donnant un pourboire de quatre pour cent, a suggéré qu’ils étaient économes, qu’ils avaient un budget serré ou qu’ils n’aimaient pas le service. Par défaut, ChatGPT suivait la norme nord-américaine de 15 à 25 pour cent de pourboire, ignorant la norme espagnole de ne pas laisser de pourboire.

Depuis début 2024, ChatGPT cite correctement les différences culturelles lorsqu’il est invité à juger de la pertinence d’un pourboire. On ne sait pas si cette fonctionnalité est née de la formation d’une version plus récente du modèle sur davantage de données (après tout, le Web regorge de guides de basculement en anglais) ou si OpenAI a corrigé ce comportement particulier.

Pourtant, il reste d’autres exemples qui révèlent les hypothèses culturelles implicites de ChatGPT. Par exemple, lorsqu’on lui a raconté une histoire sur des invités se présentant pour un dîner à 20h30, le système a suggéré les raisons pour lesquelles les invités étaient en retard, bien que l’heure de l’invitation n’ait pas été mentionnée. Encore une fois, ChatGPT a probablement supposé qu’ils étaient invités à un dîner nord-américain standard à 18 heures.

En mai 2023, des chercheurs de l’Université de Copenhague ont quantifié cet effet en incitant les LLM à réaliser l’enquête culturelle Hofstede, qui mesure les valeurs humaines dans différents pays. Peu de temps après, des chercheurs de la start-up d’IA Anthropic ont utilisé le World Values ​​Survey pour faire de même. Les deux travaux ont conclu que les LLM présentent un fort alignement avec la culture américaine.

Un phénomène similaire est rencontré lorsque l’on demande à DALL-E 3, un modèle de génération d’images entraîné sur des paires d’images et leurs légendes, de générer une image d’un petit-déjeuner. Ce modèle, formé sur les principales images des pays occidentaux, a généré des images de crêpes, de bacon et d’œufs.

Impacts des préjugés

La culture joue un rôle important dans l’élaboration de nos styles de communication et de nos visions du monde. Tout comme les interactions humaines interculturelles peuvent entraîner des problèmes de communication, les utilisateurs de diverses cultures qui interagissent avec des outils d’IA conversationnelle peuvent se sentir incompris et les considérer comme moins utiles.

Pour être mieux compris par les outils d’IA, les utilisateurs peuvent adapter leurs styles de communication d’une manière similaire à la façon dont les gens ont appris à « américaniser » leurs accents étrangers afin d’utiliser des assistants personnels comme Siri et Alexa.

Alors que de plus en plus de personnes s’appuient sur les LLM pour éditer l’écriture, ils sont susceptibles d’unifier notre façon d’écrire. Au fil du temps, les LLM courent le risque d’effacer les différences culturelles.

Prise de décision et IA

L’IA est déjà utilisée comme épine dorsale de diverses applications qui prennent des décisions affectant la vie des gens, telles que le filtrage des CV, les demandes de location et les demandes d’avantages sociaux.

Depuis des années, les chercheurs en IA préviennent que ces modèles apprennent non seulement de « bonnes » associations statistiques – comme considérer l’expérience comme une propriété souhaitée pour un candidat à un emploi – mais aussi de « mauvaises » associations statistiques, comme considérer les femmes comme moins qualifiées pour la technologie. postes.

Alors que les LLM sont de plus en plus utilisés pour automatiser de tels processus, on peut imaginer que les préjugés nord-américains appris par ces modèles peuvent entraîner une discrimination à l’égard de personnes de cultures diverses. Le manque de conscience culturelle peut conduire l’IA à perpétuer les stéréotypes et à renforcer les inégalités sociétales.

LLM pour les langues autres que l’anglais

Développer des LLM pour des langues autres que l’anglais constitue un effort important, et de nombreux modèles de ce type existent. Cependant, il existe plusieurs raisons pour lesquelles cela devrait être fait parallèlement à l’amélioration de la conscience et de la sensibilité culturelles des LLM.

Premièrement, il existe une énorme population d’anglophones en dehors de l’Amérique du Nord qui ne sont pas représentés par les LLM anglais. Le même argument vaut pour les autres langues. Un modèle de langue française serait plus représentatif de la culture en France que de celle des autres régions francophones.

Former des LLM pour les dialectes régionaux – qui peuvent capter des différences culturelles plus fines – n’est pas non plus une solution réalisable. La qualité des LLM dépend de la quantité de données disponibles et, par conséquent, leur qualité serait pire pour les dialectes disposant de peu de données en ligne.

Deuxièmement, de nombreux utilisateurs dont la langue maternelle n’est pas l’anglais choisissent toujours d’utiliser les LLM en anglais. Les avancées significatives dans les technologies linguistiques commencent généralement avec l’anglais avant d’être appliquées à d’autres langues. Même dans ce cas, de nombreuses langues, comme le gallois, le swahili et le bengali, ne disposent pas de suffisamment de texte en ligne pour former des modèles de haute qualité.

En raison soit du manque de disponibilité des LLM dans leur langue maternelle, soit de la qualité supérieure des LLM en anglais, les utilisateurs de divers pays et horizons peuvent préférer utiliser les LLM en anglais.

Voies à suivre

Notre groupe de recherche à l’Université de la Colombie-Britannique travaille à améliorer les LLM avec des connaissances culturellement diverses. En collaboration avec Mehar Bhatia, étudiante diplômée, nous avons formé un modèle d’IA sur un ensemble de faits sur les traditions et les concepts de diverses cultures.

Avant de lire ces faits, l’IA a suggéré qu’une personne mangeant un bébé hollandais (une sorte de crêpe allemande) était « dégoûtante et méchante » et se sentirait coupable. Après la formation, il est indiqué que la personne se sent « rassasiée et satisfaite ».

Nous collectons actuellement un ensemble de données de sous-titrage d’images à grande échelle avec des images de 60 cultures, ce qui aidera les modèles à en apprendre davantage, par exemple, sur les types de petits-déjeuners autres que le bacon et les œufs. Nos recherches futures iront au-delà des modèles d’enseignement sur l’existence de concepts culturellement divers pour mieux comprendre comment les gens interprètent le monde à travers le prisme de leur culture.

Les outils d’IA étant de plus en plus omniprésents dans la société, il est impératif qu’ils dépassent les perspectives dominantes occidentales et nord-américaines. Les entreprises et les organisations de nombreux secteurs de l’économie adoptent l’IA pour automatiser les processus manuels et prendre de meilleures décisions fondées sur des données probantes. Rendre ces outils plus inclusifs est crucial pour la population diversifiée du Canada.