Une nouvelle approche utilise l’IA générative pour imiter le mouvement humain

Un groupe international de chercheurs a créé une nouvelle approche pour imiter le mouvement humain en combinant des générateurs de modèles centraux (CPG) et un apprentissage par renforcement profond (DRL). La méthode imite non seulement les mouvements de marche et de course, mais génère également des mouvements pour des fréquences où les données de mouvement sont absentes, permet des mouvements de transition en douceur de la marche à la course et permet une adaptation aux environnements comportant des surfaces instables.

Les détails de leur percée ont été publiés dans la revue Lettres IEEE sur la robotique et l'automatisation le 15 avril 2024.

Nous n’y pensons peut-être pas beaucoup, mais marcher et courir impliquent des redondances biologiques inhérentes qui nous permettent de nous adapter à l’environnement ou de modifier notre vitesse de marche/course. Compte tenu de la complexité de ce phénomène, reproduire ces mouvements semblables à ceux des humains dans des robots est notoirement difficile.

Les modèles actuels ont souvent du mal à s’adapter à des environnements inconnus ou difficiles, ce qui les rend moins efficaces. En effet, l’IA est adaptée pour générer une ou un petit nombre de solutions correctes. Avec les organismes vivants et leurs mouvements, il n’existe pas qu’un seul modèle correct à suivre. Il existe toute une gamme de mouvements possibles, et il n'est pas toujours clair lequel est le meilleur ou le plus efficace.

Le DRL est un moyen par lequel les chercheurs ont cherché à surmonter ce problème. DRL étend l'apprentissage par renforcement traditionnel en tirant parti des réseaux neuronaux profonds pour gérer des tâches plus complexes et apprendre directement à partir d'entrées sensorielles brutes, permettant ainsi des capacités d'apprentissage plus flexibles et plus puissantes. Son inconvénient est l’énorme coût de calcul lié à l’exploration d’un vaste espace d’entrée, en particulier lorsque le système dispose d’un degré élevé de liberté.

Une autre approche est l’apprentissage par imitation, dans laquelle un robot apprend en imitant les données de mesure de mouvement d’un humain effectuant la même tâche de mouvement. Bien que l'apprentissage par imitation soit efficace pour apprendre dans des environnements stables, il rencontre des difficultés lorsqu'il est confronté à de nouvelles situations ou à de nouveaux environnements qu'il n'a pas rencontrés au cours de la formation. Sa capacité à modifier et à naviguer efficacement est limitée par la portée étroite de ses comportements appris.

« Nous avons surmonté bon nombre des limites de ces deux approches en les combinant », explique Mitsuhiro Hayashibe, professeur à la Graduate School of Engineering de l'Université de Tohoku. « L'apprentissage par imitation a été utilisé pour former un contrôleur de type CPG et, au lieu d'appliquer l'apprentissage profond aux CPG eux-mêmes, nous l'avons appliqué à une forme de réseau neuronal réflexe prenant en charge les CPG. »

Les CPG sont des circuits neuronaux situés dans la moelle épinière qui, comme un conducteur biologique, génèrent des schémas rythmiques d'activité musculaire. Chez les animaux, un circuit réflexe fonctionne en tandem avec les CPG pour fournir une rétroaction adéquate qui leur permet d'ajuster leur vitesse et leurs mouvements de marche/course en fonction du terrain.

En adoptant la structure du CPG et de son homologue réflexif, la méthode CPG imitée adaptative (AI-CPG) atteint une adaptabilité et une stabilité remarquables dans la génération de mouvement tout en imitant le mouvement humain.

Une IA générative qui imite le mouvement humain

« Cette avancée établit une nouvelle référence en matière de génération de mouvements de type humain en robotique, avec une capacité d'adaptation environnementale sans précédent », ajoute Hayashibe. « Notre méthode représente une avancée significative dans le développement de technologies d'IA générative pour le contrôle des robots, avec des applications potentielles dans diverses industries. « .

Le groupe de recherche était composé de membres de la Graduate School of Engineering de l'Université du Tohoku et de l'École Polytechnique Fédérale de Lausanne, ou de l'École polytechnique fédérale de Lausanne.