Un neuroscientifique explique pourquoi il est impossible pour l'IA de «comprendre» la langue

En tant que fabricants de sens, nous utilisons un langage parlé ou signé pour comprendre nos expériences dans le monde qui nous entoure. L'émergence d'une intelligence artificielle générative telle que Chatgpt (en utilisant des modèles de langues grands) remet en question la notion même de la définition du «sens».

Une caractérisation populaire des outils d'IA est qu'ils « comprennent » ce qu'ils font. Le lauréat du prix Nobel et le pionnier de l'IA, Geoffrey Hinton, a déclaré: « Ce qui m'a vraiment surpris, c'est à quel point les réseaux neuronaux sont bons pour comprendre le langage naturel – cela s'est produit beaucoup plus vite que je ne le pensais…. Et je suis toujours étonné qu'ils comprennent vraiment ce qu'ils disent. »

Hinton a répété cette affirmation dans une interview avec Adam Smith, directeur scientifique de la sensibilisation du prix Nobel. Dans ce document, Hinton a déclaré que « les filets neuronaux sont bien meilleurs dans le traitement du langage que tout ce qui jamais produit par la Chomskyan School of Linguistics ».

La linguistique de Chomskyan fait référence aux théories du linguiste américain Noam Chomsky sur la nature du langage humain et son développement. Chomsky propose qu'il y ait une grammaire universelle innée chez l'homme, ce qui permet l'acquisition de toute langue de la naissance.

Je recherche comment les humains comprennent la langue depuis les années 1990, y compris plus de 20 ans d'études sur les neurosciences du langage. Cela a inclus la mesure de l'activité des ondes cérébrales lorsque les gens lisent ou écoutent des phrases. Compte tenu de mon expérience, je dois respectueusement être en désaccord avec l'idée que l'IA peut « comprendre » – malgré la popularité croissante de cette croyance.

Génération de texte

Tout d'abord, il est regrettable que la plupart des gens confondent le texte sur un écran avec le langage naturel. Le texte écrit est lié – mais pas la même chose que – le langage.

Par exemple, la même langue peut être représentée par des symboles visuels très différents. Regardez l'hindi et l'ourdou, par exemple. Aux niveaux conversationnels, ceux-ci sont mutuellement intelligibles et donc considérés comme le même langage par les linguistes. Cependant, ils utilisent des scripts d'écriture entièrement différents. Il en va de même pour le serbe et le croate. Le texte écrit n'est pas la même chose que la «langue».

Jetons ensuite un coup d'œil à l'affirmation selon laquelle les algorithmes d'apprentissage automatique « comprennent » le langage naturel. La communication linguistique se produit principalement face à face, dans un contexte environnemental particulier partagé entre le haut-parleur et l'auditeur, aux côtés de signaux tels que le ton et la hauteur parlés, le contact visuel et les expressions faciales et émotionnelles.

L'importance du contexte

Il y a beaucoup plus à comprendre ce qu'une personne dit que de simplement comprendre ses paroles. Même les bébés, qui ne sont pas encore des experts en langue, peuvent comprendre des indices de contexte.

Prenez, par exemple, la phrase simple: «Je suis enceinte» et ses interprétations dans différents contextes. S'il est prononcé par moi, à mon âge, il est probable que mon mari tombe mort avec incrédulité. Comparez ce niveau de compréhension et de réponse à un adolescent racontant à son petit ami une grossesse non planifiée, ou une femme annonçant la nouvelle à son mari après des années de traitements de fertilité.

Dans chaque cas, le destinataire du message attribue un sens différent – et une compréhension – à la même phrase.

Dans mes propres recherches récentes, j'ai montré que même l'état émotionnel d'un individu peut modifier les modèles d'ondes cérébrales lors du traitement de la signification d'une phrase. Nos cerveaux (et donc nos pensées et nos processus mentaux) ne sont jamais sans contexte émotionnel, comme d'autres neuroscientifiques l'ont également souligné.

Ainsi, bien que certains code informatiques puissent répondre au langage humain sous forme de texte, il ne se rapproche pas de capturer ce que les humains – et leur cerveau – se compliquent dans leur compréhension.

Il convient de rappeler que lorsque les travailleurs de l'IA parlent de réseaux de neurones, ils signifient des algorithmes informatiques, et non les réseaux cérébraux biologiques réels qui caractérisent la structure et la fonction du cerveau. Imaginez constamment confondre le mot « vol » (comme chez les oiseaux migrant) par rapport au « vol » (comme dans les routes des compagnies aériennes) – cela pourrait conduire à de sérieux malentendus!

Enfin, examinons mieux l'allégation concernant le langage de traitement des réseaux de neurones que les théories produites par la linguistique Chomskyan. Ce champ suppose que toutes les langues humaines peuvent être comprises via des systèmes grammaticaux (en plus du contexte), et que ces systèmes sont liés à une grammaire universelle.

Chomsky a mené des recherches sur la théorie syntaxique en tant que théoricien en papier et crayon. Il n'a pas mené des expériences sur les bases psychologiques ou neuronales de la compréhension du langage. Ses idées en linguistique sont absolument silencieuses sur les mécanismes qui sous-tendent le traitement et la compréhension des phrases.

Cependant, ce que fait l'école de linguistique Chomskyan, c'est poser des questions sur la façon dont les nourrissons et les tout-petits humains peuvent apprendre le langage avec une telle facilité, à l'exception des déficits neurobiologiques ou des traumatismes physiques.

Il y a au moins 7 000 langues sur la planète, et personne ne peut choisir là où ils sont nés. Cela signifie que le cerveau humain doit être prêt à comprendre et à apprendre la langue de leur communauté à la naissance.

De ce fait sur le développement du langage, Chomsky a posé un module inné (abstrait) pour l'apprentissage des langues – pas le traitement. D'un point de vue neurobiologique, le cerveau doit être prêt à comprendre le langage de la naissance.

Bien qu'il existe de nombreux exemples de spécialisation du langage chez les nourrissons, les mécanismes neuronaux précis sont encore inconnus, mais pas inconnaissables. Mais les objets d'étude deviennent inconnaissables lorsque les termes scientifiques sont mal utilisés ou mal appliqués. Et c'est précisément le danger: confondre l'IA avec la compréhension humaine peut entraîner des conséquences dangereuses.