Utiliser l'apprentissage par renforcement de la simulation au réel pour entraîner des robots à effectuer des tâches simples dans des environnements étendus
Une équipe de roboticiens de l'Université de Californie à Berkeley rapporte qu'il est possible d'entraîner des robots à effectuer des tâches relativement simples en utilisant l'apprentissage par renforcement de la simulation au réel pour les entraîner. Dans leur étude, publiée dans la revue Robotique scientifiquele groupe a entraîné un robot à marcher dans des environnements inconnus tout en transportant différentes charges, le tout sans basculer.
Au cours des dernières années, les roboticiens ont utilisé diverses techniques pour entraîner les robots à se déplacer efficacement et rapidement dans des environnements variés. Mais comme le notent les chercheurs de ce nouvel effort, ces robots n’ont pas beaucoup d’applications utiles. Ils suggèrent que des robots capables d’effectuer des tâches banales de manière lente mais efficace seraient bien plus utiles. À cette fin, ils se sont tournés vers l’apprentissage par renforcement de la simulation au réel.
La technique consiste à entraîner une version simulée d'un robot pour effectuer les tâches souhaitées en l'exposant à des milliards d'exemples dans des environnements simulés. La méthode implique également l'utilisation d'un système de récompense/pénalité dans le cadre de l'entraînement du robot : s'il fait quelque chose de bien alors qu'il tente d'atteindre un objectif, il est récompensé en recevant un « 1 », par exemple. Cependant, s'il fait quelque chose de mal, il reçoit un « -1 ». Au fil du temps, il améliore ses performances en cherchant à augmenter son nombre de récompenses.
L'équipe de recherche a utilisé cette approche pour entraîner un robot appelé Digit à parcourir un chemin le long d'un trottoir dans une partie inconnue d'une ville et à récupérer après avoir été agressé à plusieurs reprises par une grosse balle, à surmonter une contrainte physique, à marcher sur des matériaux qui pourraient le faire trébucher, porter un sac à dos, transporter un sac poubelle jusqu'à une poubelle et utiliser un sac fourre-tout pour transporter des objets personnels.
Les chercheurs suggèrent que l’apprentissage par renforcement de la simulation à la réalité pourrait être utilisé pour former des robots dans des environnements réels tels que la maison, le bureau ou l’usine. L’idée, notent-ils, est de rendre les robots plus utiles.