DeepMind dévoile l'auto-formation RoboCat

DeepMind dévoile l’auto-formation RoboCat

1 crédit

Un admirateur inconnu des félins a un jour fait remarquer : « Les chats et les ordinateurs ont tous deux une chose en commun : ils gouvernent tous les deux Internet.

Chez DeepMind de Google, des chercheurs ont récemment marié l’intelligence artificielle à un robot nommé RoboCat, et bien qu’il ne gouverne pas encore Internet, il devrait faire un grand pas dans un monde futur d’automates auto-formés.

Utilisant la même technologie derrière les grands modèles de langage, l’équipe DeepMind, composée de plus de 30 chercheurs, a déclaré avoir fait une percée avec un chat robotique qui non seulement apprend rapidement de nouvelles tâches, mais peut améliorer ses performances en construisant ses propres données de performance.

« RoboCat a un cercle vertueux de formation », a déclaré DeepMind dans un article publié sur le serveur de préimpression arXiv. « Plus il apprend de nouvelles tâches, mieux il apprend de nouvelles tâches supplémentaires. »

Jusqu’à présent, les robots ont généralement effectué des tâches spécifiques et préprogrammées. Avec l’introduction de grands modèles de langage, les ensembles de compétences des robots ont commencé à s’élargir, bien que la formation sur les volumes massifs de données ait nécessité d’énormes quantités de temps.

DeepMind a déclaré que Robocat, cependant, peut rapidement apprendre de nouvelles tâches, telles que placer des pièces de puzzle de différentes formes dans les trous appropriés ou placer des fruits dans un bol. Il a ensuite pu progresser et effectuer des tâches plus complexes « basées sur un ensemble de données de millions de trajectoires » à partir de tâches antérieures et de nouvelles données auto-générées.

« Ces améliorations sont dues à l’étendue croissante de l’expérience de RoboCat, similaire à la façon dont les gens développent une gamme plus diversifiée de compétences à mesure qu’ils approfondissent leur apprentissage dans un domaine donné », ont déclaré les chercheurs.

Au fur et à mesure que RoboCat améliorait sa technique, ses nouveaux comportements appris étaient transférés à d’autres robots qui, à leur tour, s’appuyaient sur ces compétences.

Le robot a affiné ses performances sur entre 100 et 1 000 démonstrations à partir d’un bras robotique contrôlé par l’homme. Les modèles dérivés ont ensuite été formés à des tâches spécifiques et ces données ont été saisies dans le pool d’instructions générales.

Alors que RoboCat a initialement atteint un taux de réussite de 36 % en s’attaquant à des tâches qu’il n’avait pas apprises auparavant, il a amélioré ses performances au fil du temps. Grâce à l’autoformation, son taux de réussite a doublé.

« RoboCat apprend beaucoup plus rapidement que les autres modèles de pointe », ont déclaré les chercheurs de DeepMind. « Il peut prendre en charge une nouvelle tâche avec aussi peu que 100 démonstrations, car il s’appuie sur un ensemble de données vaste et diversifié. »

Le développement est considéré comme une étape majeure vers l’accélération de la recherche en robotique, « car il réduit le besoin de formation supervisée par l’homme et constitue une étape importante vers la création d’un robot à usage général ».

L’article, « RoboCat : A Self-Improving Foundation Agent for Robotic Manipulation », a été publié le 20 juin.

Ces robots finiront-ils par se dispenser de toute intervention humaine ?

Cette question a été abordée il y a 100 ans dans la pièce de 1921 « RUR : Rossum’s Universal Robots », un conte de l’écrivain tchèque Karel Čapek.

La pièce imaginait une usine qui créait des humanoïdes synthétiques qui fonctionnaient en continu et réduisaient finalement les coûts de main-d’œuvre de 80%. Le mot « robot » a été utilisé pour la première fois dans cette pièce, après le mot tchèque « robota », qui signifiait « travail forcé par des serfs ».

À la fin, les robots se sont rebellés et ont éteint l’humanité.

RoboCats, nous pouvons l’espérer, sera plus convivial.

Bien que nous devions également nous souvenir de ce que l’humoriste Will Rogers a dit un jour : « Laisser le chat sortir du sac est beaucoup plus facile que de le remettre dedans. »