Être parent d'un robot de 3 ans

Être parent d’un robot de 3 ans

L’Université Carnegie Mellon et les chercheurs de Meta ont annoncé RoboAgent, un agent d’IA qui tire parti des observations passives et de l’apprentissage actif pour permettre à un robot d’acquérir des capacités de manipulation comparables à celles d’un tout-petit. Crédit : Université Carnegie Mellon

Les humains sont des créatures sociales et apprennent les uns des autres, même dès leur plus jeune âge. Les nourrissons observent attentivement leurs parents, frères et sœurs ou soignants. Ils regardent, imitent et rejouent ce qu’ils voient pour apprendre des compétences et des comportements.

La façon dont les bébés apprennent et explorent leur environnement a inspiré des chercheurs de l’Université Carnegie Mellon et de Meta à développer une nouvelle façon d’enseigner aux robots comment apprendre simultanément plusieurs compétences et les exploiter pour s’attaquer à des tâches quotidiennes invisibles. Les chercheurs ont entrepris de développer un agent d’IA robotique avec des capacités de manipulation équivalentes à celles d’un enfant de 3 ans.

L’équipe a annoncé RoboAgent, un agent d’intelligence artificielle qui tire parti des observations passives et de l’apprentissage actif pour permettre à un robot d’acquérir des capacités de manipulation comparables à celles d’un tout-petit.

« RoboAgent est une étape critique vers des agents robotiques généraux qui sont des apprenants efficaces, efficaces dans de nouvelles situations et capables d’étendre leurs comportements au fil du temps », a déclaré Vikash Kumar, professeur auxiliaire à l’Institut de robotique de l’École d’informatique.

« Les robots actuels sont hautement spécialisés et formés pour des tâches individuelles isolées. En revanche, nous avons décidé de créer un seul agent d’intelligence artificielle capable de présenter un large éventail de compétences dans des scénarios invisibles. RoboAgent apprend comme des bébés humains, en tirant parti d’une combinaison d’abondantes observations passives et jeu actif limité. »

RoboAgent peut compléter 12 compétences de manipulation dans différentes scènes. Cette recherche pointe vers une plate-forme d’apprentissage robotique adaptable à des environnements changeants. Contrairement aux recherches antérieures, l’équipe a démontré son travail dans des environnements réels – et non dans des simulations – et l’a fait avec beaucoup moins de données que les projets précédents.

Être parent d'un robot de 3 ans

Crédit : Université Carnegie Mellon

« Les RoboAgents sont capables d’une complexité de compétences beaucoup plus riche que ce que d’autres ont réalisé », a déclaré Abhinav Gupta, professeur agrégé à l’Institut de robotique. « Nous avons montré une plus grande diversité de compétences que tout ce qui a jamais été réalisé par un seul agent robotique du monde réel avec une efficacité et une échelle de généralisation à des scénarios invisibles qui est unique. »

L’agent de l’équipe apprend grâce à une combinaison d’expériences personnelles et d’observations passives contenues dans les données Internet. Comme un parent guiderait son enfant, les chercheurs ont téléopéré le robot à travers des tâches pour lui fournir des expériences de soi utiles.

Être parent d'un robot de 3 ans

Crédit : Université Carnegie Mellon

« L’efficacité et l’efficience de notre approche découlent de notre nouvelle architecture politique qui permet à nos agents de raisonner même avec des expériences limitées », a déclaré Homanga Bharadwaj, titulaire d’un doctorat. étudiant en robotique. « RoboAgent agit en réponse à des objectifs textuels/visuels spécifiés en prédisant et en agrégeant les décisions en termes de blocs temporels de mouvements au lieu d’actions par pas de temps couramment utilisées. »

Les robots apprennent principalement de leurs propres expériences, pas de ce qui se passe passivement autour d’eux. Cette cécité inhérente à ce qui se passe dans leur environnement limite fondamentalement à la fois la diversité des expériences auxquelles les robots sont exposés et leur capacité à s’adapter à de nouvelles situations. Pour surmonter ces limitations, RoboAgent apprend à partir de vidéos sur Internet, ce qui ressemble à la façon dont les bébés acquièrent des connaissances et des comportements en observant passivement leur environnement.

« RoboAgent exploite les informations contenues dans ces vidéos pour apprendre comment les humains interagissent avec les objets et utilise diverses compétences pour accomplir avec succès des tâches », a déclaré Mohit Sharma, titulaire d’un doctorat. étudiant en robotique. « De plus, l’observation de compétences similaires dans plusieurs scénarios lui permet d’apprendre ce qui est et n’est pas nécessaire pour accomplir une tâche. Il tire parti de ces leçons lorsqu’il est présenté avec des tâches inconnues ou des environnements invisibles. »

Être parent d'un robot de 3 ans

Crédit : Université Carnegie Mellon

« Un agent capable de ce type d’apprentissage nous rapproche d’un robot général qui peut accomplir une variété de tâches dans divers environnements invisibles et évoluer continuellement à mesure qu’il accumule plus d’expériences », a déclaré Shubham Tulsiani, professeur adjoint à l’Institut de robotique. « RoboAgent peut former rapidement un robot en utilisant des données limitées dans le domaine tout en s’appuyant principalement sur des données gratuites disponibles en abondance sur Internet pour apprendre une variété de tâches. Cela pourrait rendre les robots plus utiles dans des environnements non structurés comme les maisons, les hôpitaux et d’autres espaces publics. »

L’équipe met en open source ses modèles formés, sa base de code, ses pilotes matériels et, plus particulièrement, l’ensemble des données collectées lors de cette recherche. RoboSet est le plus grand ensemble de données robotiques accessible au public sur le matériel de base. L’équipe espère que cela permettra à d’autres de le réutiliser, de l’adapter et de le transmettre, menant à un agent robotique général véritablement fondamental au fil du temps.