Le système apprend après avoir regardé des vidéos pratiques

Le système apprend après avoir regardé des vidéos pratiques

Les chercheurs de l’Université de Cornell ont développé un nouveau cadre robotique propulsé par l’intelligence artificielle – une rime

Les robots peuvent être des apprenants capricieux. Historiquement, ils ont nécessité des directions précises et étape par étape pour effectuer des tâches de base et ont tendance à l’appeler en train de cesser lorsque les choses se déroulent, comme après avoir abandonné un outil ou perdu une vis. La rime pourrait cependant accélérer le développement et le déploiement de systèmes robotiques en réduisant considérablement le temps, l’énergie et l’argent nécessaires pour les former, ont déclaré les chercheurs.

« L’une des choses ennuyeuses à propos de travailler avec des robots est de collecter tellement de données sur le robot effectuant différentes tâches », a déclaré Kushal Kedia, doctorante dans le domaine de l’informatique. « Ce n’est pas comme ça que les humains font des tâches. Nous considérons les autres comme une inspiration. »

Kedia présentera un article intitulé « Imitation unique sous une exécution décalée », en mai à l’Institut des ingénieurs électriques et électroniques Conférence internationale sur la robotique et l’automatisation, à Atlanta. Le travail est également disponible sur le arxiv serveur de préimprimée.

Les assistants de robot domestique sont encore loin car ils n’ont pas d’esprit pour naviguer dans le monde physique et ses innombrables contingences. Pour mettre les robots à jour, des chercheurs comme Kedia les forment avec ce qui équivaut à des vidéos pratiques – des démonstrations humaines de diverses tâches en laboratoire. L’espoir de cette approche, une branche de l’apprentissage automatique appelé «apprentissage d’imitation», est que les robots apprendront une séquence de tâches plus rapidement et pourront s’adapter aux environnements réels.

« Notre travail est comme traduire le français en anglais – nous traduisons une tâche donnée de l’homme au robot », a déclaré l’auteur principal Sanjiban Choudhury, professeur adjoint d’informatique.

Cette tâche de traduction est toujours confrontée à un défi plus large: les humains se déplacent trop de manière fluide pour qu’un robot puisse suivre et imiter, et la formation des robots avec la vidéo nécessite des gobes. De plus, les démonstrations vidéo – de, par exemple, ramassant une serviette ou des assiettes à dîner – doivent être effectuées lentement et sans faille, car tout décalage dans les actions entre la vidéo et le robot a historiquement orthographié le destin pour l’apprentissage du robot, ont déclaré les chercheurs.

« Si un humain se déplace d’une manière différente de la façon dont un robot bouge, la méthode s’effondre immédiatement », a déclaré Choudhury. « Notre pensée était: » Pouvons-nous trouver un moyen de principe de gérer cette inadéquation entre la façon dont les humains et les robots font des tâches? «  »

Rhyme est la réponse de l’équipe – une approche évolutive qui rend les robots moins capricieux et plus adaptatifs. Il surcharge un système robotique pour utiliser sa propre mémoire et connecter les points lors de l’exécution de tâches qu’il n’a visionnées qu’une seule fois en dessinant des vidéos qu’elle a vues. Par exemple, un robot équipé de rimes a montré une vidéo d’un humain récupérant une tasse du comptoir et le placer dans un évier à proximité mettra à peigner sa banque de vidéos et s’inspirera d’actions similaires, comme saisir une tasse et abaisser un ustensile.

La rime ouvre la voie à des robots pour apprendre les séquences en plusieurs étapes tout en réduisant considérablement la quantité de données de robot nécessaires à la formation, ont déclaré les chercheurs. La rime ne nécessite que 30 minutes de données robotiques; En laboratoire, les robots formés à l’aide du système ont atteint une augmentation de plus de 50% du succès des tâches par rapport aux méthodes précédentes, ont déclaré les chercheurs.

« Ce travail est un écart par rapport à la façon dont les robots sont programmés aujourd’hui. Le statu quo des robots de programmation est des milliers d’heures de télé-opération pour enseigner au robot comment faire des tâches. C’est tout simplement impossible », a déclaré Choudhury. « Avec Rhyme, nous nous éloignons de cela et apprenons à former des robots de manière plus évolutive. »

Avec Kedia et Choudhury, les auteurs du journal sont Prithwish Dan, Angela Chao et Maximus Pace.