La recherche améliore le quadrupède avec une méthode d'apprentissage efficace

La recherche améliore le quadrupède avec une méthode d’apprentissage efficace

Architecture de contrôle et flux de travail de formation et de déploiement, comprenant deux parties : pré-ajustement et apprentissage par renforcement approfondi (DRL). Après la formation, le modèle est déployé directement sur le vrai robot. PD, proportionnelle-dérivée. Crédit: IET Cyber-Systèmes et Robotique (2022). DOI : 10.1049/csy2.12062

Dans une étude publiée dans un numéro spécial de la revue IET Cyber-Systèmes et Robotiquedes chercheurs de l’Université du Zhejiang expérimentés dans le mouvement et le contrôle des robots à pattes, ont préformé le réseau de neurones (NN) à l’aide des données d’un robot exploité par des contrôleurs conventionnels basés sur des modèles.

Cette pré-formation a servi de mesure préliminaire pour empêcher le dépassement du comportement et le piratage des récompenses, une situation dans laquelle les agents obtiennent des récompenses de manière inattendue, généralement en raison de l’optimisation atteignant par inadvertance un optimum local plutôt que celui prévu. À la suite de la pré-formation, l’équipe a mis en œuvre l’apprentissage par renforcement profond (DRL), une approche novatrice basée sur l’apprentissage dans le contrôle de la locomotion des jambes.

Notamment, une fonction de récompense a été conçue en tenant compte des points de contact et des phases, qui ont renforcé la symétrie et la périodicité de la marche, aboutissant à une amélioration des performances de délimitation. Les méthodes DRL développées ont d’abord été apprises dans un environnement simulé puis déployées avec succès sur un véritable robot quadrupède, le Jueying Mini.

La locomotion résultante a été testée dans divers environnements, à l’intérieur et à l’extérieur, démontrant un calcul efficace et d’excellents résultats de locomotion. La méthode de contrôle développée pour le robot Jueying Mini s’est avérée produire des allures bondissantes robustes dans les paramètres de simulation et du monde réel. Cela a d’énormes implications pour améliorer l’agilité et l’adaptabilité des robots quadrupèdes dans des environnements intérieurs et extérieurs variés.

Les prochaines étapes de l’étude consistent à intégrer la méthode actuelle à des outils de perception environnementale, tels que des caméras ou des systèmes LiDAR. Bien que ceux-ci n’aient pas été utilisés dans l’étude actuelle, ils peuvent offrir une localisation plus précise du robot et une navigation pour délimiter différents terrains.

Dans une autre étude publiée dans le numéro spécial, les chercheurs ont été les premiers à utiliser des gyroscopes à moment de contrôle (CMG) pour améliorer la stabilité des robots bipèdes, en particulier lors d’opérations à grande vitesse. Les robots bipèdes, de plus en plus utilisés dans toutes les industries, luttent contre l’équilibre et le rejet des perturbations à mesure que leur vitesse augmente.

La nouvelle stratégie d’assistance CMG améliore leur capacité à résister à l’impact et à retrouver rapidement l’équilibre. Les résultats de la simulation confirment l’efficacité des CMG dans l’amélioration significative de la stabilité des robots. Cette utilisation innovante des CMG représente un bond en avant dans la robotique bipède, avec des plans pour intégrer davantage les CMG pour améliorer les performances réelles dans les mouvements à haute dynamique.

Fourni par l’Université du Zhejiang