Ce défenseur de la justice sociale a ouvert la voie à l’IA. Est-ce que ça l’empêche de dormir la nuit ?
Noam Chomsky, le génie vénéré et vilipendé autrefois décrit comme « l’intellectuel le plus important du monde », a eu 95 ans le 6 décembre. Il est une figure monumentale de la linguistique moderne, et une divinité légèrement moindre en psychologie, en philosophie et en activisme politique.
Son travail établissant les sciences cognitives en tant que discipline est si fondamental pour l’essor de l’IA qu’il est rarement reconnu aujourd’hui.
Au milieu de l’inquiétude persistante selon laquelle les machines simulant le langage pourraient devenir un net négatif pour l’humanité, nous sommes-nous trop éloignés de la vision de Chomsky d’une science de l’esprit humain ?
La racine de la renommée de Chomsky
Chomsky fait irruption sur la scène universitaire en 1957 avec Syntactic Structures, une monographie linguistique hautement technique qui révolutionne l’étude du langage.
Cependant, sa véritable célébrité survient en 1959 avec sa critique légendaire du Verbal Behaviour de BF Skinner. Skinner, psychologue et comportementaliste, était sous le feu des projecteurs dans les cercles de psychologie avec sa théorie du « conditionnement opérant ».
Il explique comment le renforcement et la punition peuvent être utilisés pour créer des associations dans l’esprit des gens, qui encouragent ensuite certains comportements. Par exemple, une étoile d’or décernée par un enseignant pour un bon comportement encouragera les élèves à en faire davantage.
Dans Verbal Behaviour, Skinner a tenté d’étendre cette idée à la linguistique en décomposant le langage en composants censés être acquis via le conditionnement opérant.
Chomsky n’était absolument pas d’accord. Il a déchiré les théories de Skinner, démontrant que le langage ne pouvait pas être compris de cette façon.
D’une part, a-t-il souligné, les enfants ne sont pas suffisamment exposés au langage pour apprendre toutes les phrases possibles. D’autre part, le langage est créatif : nous prononçons fréquemment des phrases qui n’ont jamais été entendues auparavant, ce qui signifie qu’elles ne peuvent pas avoir été acquises par un simple processus de récompense et de punition.
La révolution cognitive et l’IA
La critique cinglante de Chomsky a fait plus que exclure le behaviorisme de la linguistique.
Il a montré à quel point il pouvait être utile d’examiner l’esprit plutôt que simplement le comportement dans des domaines liés au langage comme l’anthropologie, la psychologie et les neurosciences. Cela a contribué à déclencher la révolution cognitive, donnant finalement naissance au domaine des sciences cognitives.
Une idée fondamentale développée par Chomsky, avec d’autres chercheurs en sciences cognitives, est que la cognition humaine (pensée, mémoire, apprentissage, langage, perception et prise de décision) peut être comprise en termes de processus informatiques. Même s’il existait déjà diverses théories pour expliquer différents aspects de la cognition, aucune n’offrait le cadre séduisant de la métaphore informatique : notre cerveau est le matériel, la cognition est le logiciel, et nos pensées et nos sentiments sont les résultats.
L’approche de Chomsky est un fil conducteur qui a connecté des générations de chercheurs en IA, à commencer sans doute par son collègue du MIT et pionnier de l’IA, Marvin Minsky, l’un des organisateurs de l’atelier de recherche de Dartmouth en 1956 qui a lancé la recherche sur l’IA.
À l’époque des débuts de l’IA, les théories de Chomsky sur le langage ont ouvert la voie à l’extension des idées d’Alan Turing sur l’intelligence artificielle au traitement du langage.
Génératif et profond
Plus précisément, deux concepts clés popularisés par Chomsky sont encore aujourd’hui intégrés à l’IA.
La première est la « grammaire générative ». C’est l’idée selon laquelle il existe un ensemble spécifique de règles qui déterminent ce qui rend une phrase grammaticalement correcte (ou incorrecte) dans une langue donnée.
La deuxième idée est celle de « structure profonde ». Chomsky a déclaré que les linguistes accordaient trop d’attention à la grammaire traditionnelle, ou à la « structure superficielle », de langues particulières. Cela fait référence aux différents composants (tels que les mots, les syllabes et les phrases) qui composent une phrase prononcée.
Au lieu de cela, Chomsky voulait élaborer la « structure profonde » de tout langage, dont nous sommes en grande partie inconscients. Cette structure profonde est ce qui détermine la composante sémantique d’une phrase, c’est-à-dire son sens sous-jacent.
Il n’est pas difficile de voir comment les idées de Chomsky sur la grammaire générative et la structure profonde s’accordent avec l’IA générative et l’apprentissage profond d’aujourd’hui.
Chomsky a posé le défi fondamental de tout cet effort : élaborer les règles profondes qui génèrent le langage. Sans cela, les experts n’auraient pas pu approfondir autant les réseaux de neurones. Ils n’auraient pas suffisamment bien compris la langue pour même commencer.
Les réflexions de Chomsky sur l’IA
Soixante ans plus tard, des modèles comme ChatGPT ont rattrapé Chomsky.
Alors que certains linguistes estiment que le succès des grands modèles linguistiques (LLM) invalide l’approche linguistique de Chomsky, il soutient que les modèles imitent simplement plutôt que de véritablement « apprendre ». Selon Chomsky, la connaissance des règles profondes du langage qu’elles contiennent est un gâchis statistique et non une analyse significative.
Dans un essai invité par le New York Times avec Ian Roberts et Jeffrey Watumull intitulé La fausse promesse de ChatGPT, Chomsky dit qu’il est « comique et tragique » que « tant d’argent et d’attention soient concentrés sur si peu de chose ».
Son principal reproche est que de tels systèmes constituent une impasse dans la recherche d’une véritable intelligence artificielle générale (IAG). Il les considère plutôt comme un outil de saisie semi-automatique optimisé, utile pour créer du code informatique ou tricher sur des dissertations, mais pas grand-chose d’autre.
Il craint que leur popularité ne retarde l’exploration d’autres architectures d’IA qui ne reposent pas sur l’analyse statistique des données par force brute. Surtout, il ne croit pas que les réseaux neuronaux (à la base d’une grande partie de l’IA actuelle) soient l’architecture appropriée pour reproduire l’intelligence humaine.
Bien qu’il ne soit pas impressionné par ChatGPT, Chomsky voit le potentiel de l’IA pour jouer le rôle du monstre dans un avenir sombre. Dans l’essai, il écrit que les réponses de ChatGPT peuvent exsuder « la banalité du mal : le plagiat, l’apathie et l’obviation ».
Il semble néanmoins considérer l’IA comme une préoccupation secondaire par rapport au changement climatique.
IA commerciale : la revanche des behavioristes ?
Il existe une différence importante entre les travaux éthiques et optimistes de Chomsky en sciences cognitives et ce qui se passe actuellement dans l’industrie de l’IA.
Les progrès dans la modélisation de la cognition ne se produisent plus principalement dans les universités. Au lieu de cela, de grandes entreprises telles que Google, Microsoft et OpenAI accumulent des ressources.
Certains chercheurs se tournent désormais vers les modèles d’IA pour obtenir des indices sur la pensée humaine. Si vous êtes d’accord avec Chomsky et d’autres, il est peu probable que cela vous apporte beaucoup d’informations. Mais ce n’est pas le but de ces modèles, n’est-ce pas ?
Leur but est de gagner de l’argent. Les utilisateurs leur envoient un stimulus et obtiennent une réponse. Si c’est utile, ils vous le demanderont à nouveau. Au fil du temps, le modèle apprendra quels modèles de stimulus et de réponse fonctionnent et utilisera ces connaissances pour devenir plus addictif et plus influent, renforçant ainsi notre utilisation de ces modèles et potentiellement même modifiant nos comportements.
Stimulus, réponse, renforcement et comportement. Semble familier?
Chomsky s’est battu avec acharnement pour exclure le behaviorisme de la linguistique et a grandement contribué à notre compréhension de la façon dont le langage peut être lié aux processus mentaux. Ironiquement, il semble que ces contributions nous aient conduits dans l’arène idéale pour l’expérimentation behavioriste facilitée par l’IA.