L'IA va à la «maternelle» afin d'apprendre des tâches plus complexes

Nous devons apprendre nos lettres avant de pouvoir apprendre à lire et nos chiffres avant de pouvoir apprendre à ajouter et à soustraire. Les mêmes principes sont vrais avec l’IA, une équipe de scientifiques de l’Université de New York a montré à travers des expériences de laboratoire et une modélisation informatique.

Dans leur travail, publié dans la revue Intelligence de la machine de la natureles chercheurs ont découvert que lorsque les réseaux de neurones récurrents (RNN) sont d’abord formés sur des tâches cognitives simples, ils sont mieux équipés pour gérer des tâches plus difficiles et complexes plus tard.

Les auteurs de l’article ont étiqueté cette forme de formation d’apprentissage du curriculum de la maternelle alors qu’il se concentre d’abord pour inculquer une compréhension des tâches de base, puis combiner la connaissance de ces tâches pour effectuer des tâches plus difficiles.

« Dès le début de la vie, nous développons un ensemble de compétences de base comme le maintien de l’équilibre ou le jeu avec une balle », explique Cristina Savin, professeur agrégé au NYU’s Center for Neural Science et Center for Data Science.

« Avec l’expérience, ces compétences de base peuvent être combinées pour soutenir un comportement complexe, par exemple, jongler avec plusieurs balles tout en faisant du vélo.

« Notre travail adopte ces mêmes principes pour améliorer les capacités des RNN, qui apprennent d’abord une série de tâches faciles, stockent ces connaissances, puis appliquent une combinaison de ces tâches apprises pour accomplir avec succès des tâches plus sophistiquées. »

Les RNN – les réseaux en neurones conçus pour traiter les informations séquentielles basées sur les connaissances stockées – sont particulièrement utiles dans la reconnaissance vocale et la traduction du langage.

Cependant, en ce qui concerne les tâches cognitives complexes, la formation des RNN avec des méthodes existantes peut s’avérer difficile et ne pas capturer des aspects cruciaux du comportement animal et humain que les systèmes d’IA visent à reproduire.

Pour y remédier, les auteurs de l’étude – qui comprenaient également David Hocker, chercheur postdoctoral au Center for Data Science de NYU, et Christine Constantinople, professeur au Centre de science des données de NYU – a mené une série d’expériences avec des rats de laboratoire.

Les animaux ont été entraînés pour rechercher une source d’eau dans une boîte avec plusieurs ports compartimentés. Cependant, afin de savoir quand et où l’eau serait disponible, les rats devaient apprendre que la livraison de l’eau était associée à certains sons et à l’éclairage des lumières du port – et que l’eau n’a pas été livrée immédiatement après ces indices.

Afin d’atteindre l’eau, les animaux devaient donc développer des connaissances de base de plusieurs phénomènes (par exemple, les sons précèdent la livraison de l’eau, en attendant après les signaux visuels et audio avant d’essayer d’accéder à l’eau), puis d’apprendre à combiner ces tâches simples afin de compléter un objectif (récupération de l’eau).

Ces résultats ont souligné les principes de la façon dont les animaux ont appliqué la connaissance des tâches simples pour entreprendre des tâches plus complexes.

Les scientifiques ont pris ces conclusions pour former les RNN de la même manière, mais, au lieu de la récupération de l’eau, les RNN ont géré une tâche de paris qui nécessitait ces réseaux pour s’appuyer sur la prise de décision de base afin de maximiser le gain au fil du temps. Ils ont ensuite comparé cette approche d’apprentissage du curriculum de la maternelle des méthodes de formation RNN existantes.

Dans l’ensemble, les résultats de l’équipe ont montré que les RNN se sont entraînés sur le modèle de la maternelle ont appris plus rapidement que ceux formés sur les méthodes actuelles.

« Les agents de l’IA doivent d’abord passer par la maternelle pour être en mesure de mieux apprendre des tâches complexes », observe Savin.

« Dans l’ensemble, ces résultats indiquent des moyens d’améliorer l’apprentissage dans les systèmes d’IA et de demander une compréhension plus holistique de la façon dont les expériences passées influencent l’apprentissage des nouvelles compétences. »