Les robots trotteurs révèlent l’émergence de transitions de démarche animale

Les robots trotteurs révèlent l’émergence de transitions de démarche animale

Un robot à quatre pattes entraîné par l'apprentissage automatique par des chercheurs de l'EPFL a appris à éviter les chutes en alternant spontanément entre marche, trot et pronking. Une étape importante pour les roboticiens ainsi que les biologistes intéressés par la locomotion animale.

Grâce à une forme d'apprentissage automatique appelée apprentissage par renforcement profond (DRL), le robot de l'EPFL a notamment appris à passer du trot au pronking (une démarche bondissante et arquée utilisée par des animaux comme le springbok et les gazelles) pour naviguer sur un terrain difficile avec écarts allant de 14 à 30 cm. L'étude, dirigée par le Laboratoire de BioRobotique de la Faculté d'Ingénieurs de l'EPFL, offre de nouvelles perspectives sur pourquoi et comment de telles transitions de démarche se produisent chez les animaux.

« Des recherches antérieures ont introduit l'efficacité énergétique et la prévention des blessures musculo-squelettiques comme les deux principales explications des transitions de démarche. Plus récemment, des biologistes ont soutenu que la stabilité sur un terrain plat pourrait être plus importante.

« Mais les expériences animales et robotiques ont montré que ces hypothèses ne sont pas toujours valables, notamment sur des terrains accidentés », explique le docteur. étudiant Milad Shafiee, premier auteur d'un article publié dans Communications naturelles.

Shafiee et ses co-auteurs Guillaume Bellegarda et Auke Ijspeert, directeur du BioRobotics Lab, se sont donc intéressés à une nouvelle hypothèse expliquant pourquoi les transitions de démarche se produisent : la viabilité ou l'évitement des chutes. Pour tester cette hypothèse, ils ont utilisé DRL pour entraîner un robot quadrupède à traverser différents terrains.

Sur un terrain plat, ils ont constaté que différentes allures présentaient différents niveaux de robustesse face aux poussées aléatoires et que le robot passait du pas au trot pour maintenir sa viabilité, tout comme le font les animaux quadrupèdes lorsqu'ils accélèrent.

Confronté aux interstices successifs de la surface expérimentale, le robot passait spontanément du trot au pronk pour éviter les chutes. De plus, la viabilité était le seul facteur amélioré par de telles transitions de démarche.

« Nous avons montré que sur des terrains plats et des terrains discrets difficiles, la viabilité conduit à l'émergence de transitions de démarche, mais que l'efficacité énergétique n'est pas nécessairement améliorée », explique Shafiee. « Il semble que l'efficacité énergétique, que l'on pensait auparavant être un moteur de telles transitions, puisse être une conséquence plus importante. Lorsqu'un animal navigue sur un terrain difficile, il est probable que sa première priorité ne soit pas de tomber, suivie par l'efficacité énergétique. »

Une architecture d’apprentissage bio-inspirée

Pour modéliser le contrôle de la locomotion dans leur robot, les chercheurs ont pris en compte les trois éléments en interaction qui déterminent le mouvement des animaux : le cerveau, la moelle épinière et le retour sensoriel du corps. Ils ont utilisé le DRL pour entraîner un réseau neuronal afin d'imiter la transmission des signaux cérébraux au corps par la moelle épinière lorsque le robot traversait un terrain expérimental.

Ensuite, l’équipe a attribué différentes pondérations à trois objectifs d’apprentissage possibles : l’efficacité énergétique, la réduction des forces et la viabilité. Une série de simulations informatiques a révélé que parmi ces trois objectifs, la viabilité était le seul qui incitait le robot à modifier automatiquement sa démarche, sans instruction des scientifiques.

L’équipe souligne que ces observations représentent le premier cadre de locomotion basé sur l’apprentissage dans lequel les transitions de démarche émergent spontanément au cours du processus d’apprentissage, ainsi que le franchissement le plus dynamique d’écarts consécutifs aussi importants pour un robot quadrupède.

« Notre architecture d'apprentissage bio-inspirée a démontré l'agilité d'un robot quadrupède de pointe sur des terrains difficiles », explique Shafiee.

Les chercheurs visent à étendre leurs travaux avec des expériences supplémentaires plaçant différents types de robots dans une plus grande variété d’environnements difficiles. En plus d’élucider davantage la locomotion animale, ils espèrent qu’à terme, leurs travaux permettront une utilisation plus répandue des robots pour la recherche biologique, réduisant ainsi le recours aux modèles animaux et les problèmes éthiques associés.