L'IA apprend des langues de la même manière que les humains, montre l'étude

Un système d'IA qui apprend la langue développe de manière autonome une langue structurée de la même manière que le langage humain. Et tout comme nous, les humains, apprenons des générations précédentes, les modèles d'IA s'améliorent lorsqu'ils profitent de la connaissance des parents plus âgés.

Ceci est démontré par une étude de l'Université de technologie de Chalmers et de l'Université de Göteborg, en Suède, qui explore les mécanismes du langage humain et fournit des connaissances importantes pour le développement de l'IA de l'avenir.

L'étude est publiée dans le Journal of Language Evolution.

Les modèles de langage basés sur l'IA comme Chatgpt s'améliorent de mieux en mieux pour imiter le langage humain et sont de plus en plus utilisés comme outil pour produire du texte. Mais les mêmes types de modèles peuvent également nous apprendre à mieux comprendre comment les langues humaines ont évolué.

Dans l'étude, les chercheurs ont exploré un système d'IA pour l'évolution des langues en utilisant deux méthodes différentes dans une combinaison précédemment non testée. D'une part, l'apprentissage du renforcement a été utilisé – où les bonnes actions sont récompensées et donc renforcées – et d'autre part, les chercheurs ont laissé les modèles d'IA apprendre les uns des autres pendant les générations.

« Nous avons découvert que les modèles d'IA ont atteint quelque chose qui est structuré de la même manière que le langage humain, et que l'apprentissage des langues a fonctionné de la même manière que le langage humain. Ainsi, l'étude fournit des informations importantes sur le fonctionnement des modèles d'IA, mais aussi une meilleure compréhension de l'évolution des langues humaines », explique Emil Carlsson, qui, à l'époque de l'étude, était un étudiant doctoral de Chalmers et de l'Université de Gothenburg.

Toutes les langues s'efforcent d'être efficaces

Selon une théorie influente en sciences cognitives, tout le langage humain est façonné par la nécessité de pouvoir communiquer efficacement. Dans le même temps, un équilibre est nécessaire: en tant qu'outil, la langue doit être informative mais aussi simple pour que nous puissions apprendre. Et plus il faut communiquer des informations, plus la langue doit être nuancée.

Un exemple classique est que les langues dans les climats plus froids ont souvent plus de mots pour la neige et la glace que les langues dans des climats plus chauds.

Pour tester la théorie et étudier comment le langage devient efficace, les chercheurs ont créé des agents d'IA – des modèles d'IA difficultés – qui ont joué un jeu de communication les uns avec les autres.

Les agents de l'IA ont reçu une couleur et une liste de symboles qui n'avaient initialement aucun sens. Au fur et à mesure que les agents interagissent, ces symboles sont associés à certaines couleurs et sont utilisés pour communiquer la couleur à l'autre agent.

« La raison pour laquelle nous avons utilisé les couleurs est qu'il existe tellement de données sur la façon dont le spectre de couleurs est nommé dans différentes langues, y compris les données de langues isolées qui n'ont jamais été exposées à d'autres langues. La catégorisation des couleurs varie entre les langues, à la fois en termes de nombre de mots et quelle partie du spectre de couleurs que les mots décrivent », explique Carlsson.

Les récompenses et l'échange générationnel ont donné des résultats pour le développement du langage

Les expériences impliquaient un agent AI communiquant une couleur via l'un des symboles de la liste, et l'agent d'IA récepteur devinerait à quelle couleur le symbole correspondait. Les deux agents ont reçu une récompense commune lorsqu'ils ont fait des progrès dans leur communication. Plus ils se rapprochaient d'une désignation commune de l'ombre de couleur exacte que l'agent récepteur a obtenu, plus les points ont été attribués.

À l'étape suivante, de nouvelles «générations» d'agents d'IA ont été créées, tandis que les anciens agents de l'IA ont été supprimés. Les nouveaux agents de l'IA ont pu voir le dialogue et la langue que la génération précédente avait réussi à développer. Après cela, les nouveaux agents de l'IA ont pu jouer le même jeu de communication entre eux.

« L'idée était de laisser les agents de l'IA apprendre d'abord une langue des générations précédentes, puis de le développer davantage en communiquant entre eux. Tout comme deux petits enfants qui apprennent en écoutant maman et papa parler, puis continuent d'élargir et de développer leurs propres langues », explique Carlsson.

Fournit une connaissance de la façon dont la langue se développe

Le résultat a été un système de nommer des couleurs similaires aux langues de couleur humaine, malgré le fait que les agents de l'IA n'étaient jamais entrés en contact avec eux.

« Ce qui est intéressant, c'est que c'était précisément la combinaison de la résolution de problèmes dans le jeu, ainsi que le fait que les agents de l'IA ont appris des générations précédentes, qui a conduit à un langage efficace qui ressemble à un langage humain. Lorsque les agents de l'IA ont seulement communiqué entre eux pour résoudre le jeu, les langues sont devenues trop complexes », dit-il.

« Nous avons également essayé de laisser les agents de l'IA apprendre uniquement des générations précédentes, sans avoir à faire face à l'aspect de résolution de problèmes du jeu, puis les langues sont devenues beaucoup trop simples. »

Selon Carlsson, les résultats indiquent que notre capacité à communiquer et à apprendre les unes des autres est cruciale pour la façon dont les langues se développent au fil du temps.

« Lorsque nous n'apprenons que quelque chose d'une autre personne, sans peut-être en comprendre les avantages, notre tendance à développer les connaissances diminue. Mais lorsque nous devons réellement utiliser ce que nous avons appris pour résoudre les problèmes et aller de l'avant, c'est à ce moment que des langues structurées et efficaces peuvent être créées », dit-il.

Il espère que les résultats contribueront à de nouvelles idées et idées dans la recherche en langue, ainsi que la recherche en IA et en informatique.

« C'est une connaissance qui peut nous aider à mieux comprendre les mécanismes derrière les langues humaines, mais aussi à comprendre comment les modèles de langue basés sur l'IA fonctionnent.