Une technique de deep learning pour améliorer la façon dont les robots saisissent les objets
Crédit : domaine public Unsplash/CC0
La plupart des humains adultes sont naturellement capables de ramasser des objets dans leur environnement et de les tenir de manière à faciliter leur utilisation. Par exemple, lorsqu’ils ramassent un ustensile de cuisine, ils le saisissent normalement par le côté qui ne sera pas placé à l’intérieur de la marmite ou de la poêle.
Les robots, en revanche, doivent être formés sur la meilleure façon de ramasser et de tenir des objets tout en accomplissant différentes tâches. Il s’agit souvent d’un processus délicat, étant donné que le robot peut également rencontrer des objets qu’il n’a jamais rencontrés auparavant.
Le groupe de recherche sur les systèmes intelligents autonomes (AIS) de l’Université de Bonn a récemment développé un nouveau pipeline d’apprentissage pour améliorer la capacité d’un bras robotique à manipuler des objets de manière à mieux soutenir leur utilisation pratique. Leur approche, présentée dans un article publié sur le serveur de pré-impression arXivpourrait contribuer au développement d’assistants robotiques capables d’effectuer des tâches manuelles plus efficacement.
« Un objet est saisi fonctionnellement s’il peut être utilisé, par exemple : un index sur la gâchette d’une perceuse », a déclaré à Tech Xplore Dmytro Pavlichenko, l’un des chercheurs qui ont mené l’étude. « Une telle saisie spécifique n’est pas toujours accessible, ce qui rend la manipulation nécessaire. Dans cet article, nous abordons la manipulation adroite avant la saisie avec une main anthropomorphe. »
L’article récent de Pavlichenko et du co-auteur Sven Behnke s’appuie sur les efforts de recherche antérieurs du groupe AIS, en particulier un article présenté à la conférence internationale IEEE-RAS 2019 sur les robots humanoïdes à Toronto. Dans le cadre de cette étude antérieure, l’équipe a développé une approche sophistiquée pour la re-saisie robotique à deux bras d’objets qui reposait sur plusieurs composants complexes conçus à la main.
« La motivation de notre nouvel article était de remplacer un pipeline aussi complexe par un réseau neuronal », a expliqué Pavlichenko. « Cela réduit la complexité et supprime les stratégies de manipulation codées en dur, augmentant ainsi la flexibilité de l’approche. »
L’approche simplifiée de manipulation préalable que les chercheurs ont introduite dans leur nouvel article repose sur l’apprentissage par renforcement profond, une technique très performante et bien connue pour entraîner les algorithmes d’IA. Grâce à cette technique, l’équipe a entraîné un modèle à manipuler adroitement des objets avant de les saisir, s’assurant ainsi que le robot les tient finalement de manière efficace, exactement comme demandé.
« Notre modèle apprend en utilisant une fonction de récompense dense à plusieurs composants, qui incite à rapprocher un objet de la saisie fonctionnelle cible donnée par l’interaction doigt-objet », a déclaré Pavlichenko. « Combiné à une simulation basée sur GPU Isaac Gym, l’apprentissage peut se faire rapidement. »
Jusqu’à présent, les chercheurs ont évalué leur approche dans un environnement de simulation appelé Isaac Gym et ont constaté qu’elle avait donné des résultats très prometteurs. Lors de leurs premiers tests, leur modèle a permis à des robots simulés d’apprendre à déplacer des objets de forme distincte dans leurs mains, pour finalement trouver la meilleure façon de les manipuler sans nécessiter de démonstrations humaines.
Notamment, l’approche d’apprentissage proposée par Pavlichenko et son Behnke pourrait facilement être appliquée à une variété de bras et de mains robotiques, tout en prenant également en charge la manipulation de nombreux objets de formes différentes. Dans le futur, il pourrait ainsi être déployé et testé sur différents robots physiques.
« Nous avons démontré qu’il est possible d’apprendre un comportement dynamique complexe, semblable à celui d’un humain, en utilisant un seul ordinateur avec plusieurs heures de formation », a déclaré Pavlichenko. « Nos projets de recherche future impliquent d’appliquer le modèle appris au monde réel, en obtenant des performances similaires sur un robot réel. Ceci est généralement assez difficile, nous pensons donc qu’une étape d’apprentissage supplémentaire, désormais en ligne sur le robot réel, pourrait être nécessaire pour comblez l’écart entre la simulation et la réalité. »