Apprendre à des robots à apprendre à d'autres robots

Pourrions-nous un jour déchiffrer une langue étrangère ? Découvrir comment l’IA communique pourrait être la clé

Dans le film de science-fiction « Arrival » de 2016, un linguiste est confronté à la tâche ardue de déchiffrer une langue extraterrestre composée de phrases palindromiques, qui se lisent de la même manière à l'envers et à l'avant, écrites avec des symboles circulaires. Au fur et à mesure qu'elle découvre divers indices, différentes nations du monde interprètent les messages différemment, certains pensant qu'ils véhiculent une menace.

Si l’humanité se retrouvait aujourd’hui dans une telle situation, notre meilleure chance serait peut-être de nous tourner vers la recherche découvrant comment l’intelligence artificielle (IA) développe les langages.

Mais qu’est-ce qui définit exactement une langue ? La plupart d’entre nous en utilisent au moins un pour communiquer avec les gens autour de nous, mais comment est-ce arrivé ? Les linguistes réfléchissent à cette question depuis des décennies, mais il n’existe pas de moyen simple de découvrir comment la langue a évolué.

Le langage est éphémère, il ne laisse aucune trace examinable dans les archives fossiles. Contrairement aux os, nous ne pouvons pas déterrer les langues anciennes pour étudier leur évolution au fil du temps.

Même si nous ne sommes peut-être pas en mesure d’étudier la véritable évolution du langage humain, une simulation pourrait peut-être fournir quelques indications. C'est là qu'intervient l'IA : un domaine de recherche fascinant appelé communication émergente, que j'ai étudié ces trois dernières années.

Pour simuler l'évolution du langage, nous confions aux agents (IA) des tâches simples qui nécessitent une communication, comme un jeu dans lequel un robot doit en guider un autre vers un emplacement spécifique sur une grille sans lui montrer de carte. Nous n'imposons (presque) aucune restriction sur ce qu'ils peuvent dire ou comment : nous leur confions simplement la tâche et les laissons la résoudre comme ils le souhaitent.

Parce que la résolution de ces tâches nécessite que les agents communiquent entre eux, nous pouvons étudier comment leur communication évolue au fil du temps pour avoir une idée de la façon dont le langage pourrait évoluer.

Des expériences similaires ont été réalisées avec des humains. Imaginez que vous, un anglophone, soyez jumelé à un non-anglophone. Votre tâche consiste à demander à votre partenaire de ramasser un cube vert parmi un assortiment d'objets sur une table.

Vous pouvez essayer de montrer une forme de cube avec vos mains et de pointer l'herbe à l'extérieur de la fenêtre pour indiquer la couleur verte. Au fil du temps, vous développeriez ensemble une sorte de proto-langage. Peut-être créeriez-vous des gestes ou des symboles spécifiques pour « cube » et « vert ». Grâce à des interactions répétées, ces signaux improvisés deviendraient plus raffinés et cohérents, formant ainsi un système de communication de base.

Cela fonctionne de la même manière pour l’IA. Par essais et erreurs, ils apprennent à communiquer sur les objets qu’ils voient et leurs interlocuteurs apprennent à les comprendre.

Mais comment savoir de quoi ils parlent ? S’ils développent ce langage uniquement avec leur interlocuteur artificiel et non avec nous, comment savons-nous ce que signifie chaque mot ? Après tout, un mot spécifique pourrait signifier « vert », « cube » ou pire, les deux. Ce défi d’interprétation est un élément clé de mes recherches.

Déchiffrer le code

La tâche consistant à comprendre le langage de l’IA peut sembler presque impossible au premier abord. Si j'essayais de parler polonais (ma langue maternelle) à un collaborateur qui ne parle que l'anglais, nous ne pourrions pas nous comprendre ni même savoir où commence et se termine chaque mot.

Le défi avec les langages de l’IA est encore plus grand, car ils pourraient organiser l’information d’une manière totalement étrangère aux modèles linguistiques humains.

Heureusement, les linguistes ont développé des outils sophistiqués utilisant la théorie de l’information pour interpréter des langues inconnues.

Tout comme les archéologues reconstituent des langues anciennes à partir de fragments, nous utilisons des modèles dans les conversations de l’IA pour comprendre leur structure linguistique. Parfois, nous trouvons des similitudes surprenantes avec les langues humaines, et d’autres fois, nous découvrons des moyens de communication entièrement nouveaux.

Ces outils nous aident à jeter un coup d’œil dans la « boîte noire » de la communication de l’IA, révélant comment les agents artificiels développent leurs propres façons uniques de partager des informations.

Mes travaux récents portent sur l'utilisation de ce que les agents voient et disent pour interpréter leur langage. Imaginez avoir la transcription d'une conversation dans une langue que vous ne connaissez pas, ainsi que ce que chaque intervenant regardait. Nous pouvons faire correspondre les modèles de la transcription aux objets dans le champ de vision du participant, établissant ainsi des liens statistiques entre les mots et les objets.

Par exemple, peut-être que l'expression « yayo » coïncide avec un oiseau qui passe devant nous – nous pourrions deviner que « yayo » est le mot utilisé par l'orateur pour « oiseau ». Grâce à une analyse minutieuse de ces modèles, nous pouvons commencer à décoder le sens de la communication.

Dans le dernier article de mes collègues et moi-même, à paraître dans les actes de la conférence de Neural Information Processing Systems (NeurIPS), nous montrons que de telles méthodes peuvent être utilisées pour procéder à l'ingénierie inverse d'au moins certaines parties du langage et de la syntaxe des IA, ce qui nous donne un aperçu de la façon dont ils pourraient structurer la communication.

Aliens et systèmes autonomes

Quel est le lien avec les extraterrestres ? Les méthodes que nous développons pour comprendre les langages de l’IA pourraient nous aider à déchiffrer toute future communication extraterrestre.

Si nous parvenons à obtenir un texte écrit extraterrestre ainsi qu'un certain contexte (comme des informations visuelles relatives au texte), nous pourrions appliquer les mêmes outils statistiques pour les analyser. Les approches que nous développons aujourd’hui pourraient constituer des outils utiles dans l’étude future des langues étrangères, connue sous le nom de xénolinguistique.

Mais nous n’avons pas besoin de trouver des extraterrestres pour bénéficier de ces recherches. Les applications sont nombreuses, depuis l’amélioration des modèles de langage comme ChatGPT ou Claude jusqu’à l’amélioration de la communication entre véhicules autonomes ou drones.

En décodant les langages émergents, nous pouvons rendre les technologies futures plus faciles à comprendre. Qu'il s'agisse de savoir comment les voitures autonomes coordonnent leurs mouvements ou comment les systèmes d'IA prennent des décisions, nous ne créons pas seulement des systèmes intelligents : nous apprenons à les comprendre.