Une approche IA donne naissance à un chien robot « athlétiquement intelligent »

Un jour, en cas de tremblements de terre, d’incendies et d’inondations, les premiers intervenants pourraient être des meutes de chiens de sauvetage robotisés se précipitant pour aider les âmes bloquées. Ces quadrupèdes alimentés par batterie utiliseraient la vision par ordinateur pour évaluer les obstacles et utiliseraient l’agilité d’un chien pour les surmonter.

Pour atteindre ce noble objectif, des chercheurs en IA de l’Université de Stanford et de l’Institut Qi Zhi de Shanghai affirment avoir développé un nouvel algorithme basé sur la vision qui aide les chiens robots à escalader des objets élevés, à sauter par-dessus les interstices, à ramper sous les seuils et à se faufiler à travers les crevasses, puis à se précipiter vers le sol. prochain challenge. L’algorithme représente le cerveau du robot-chien.

« L’autonomie et la gamme de compétences complexes acquises par notre robot quadrupède sont assez impressionnantes », a déclaré Chelsea Finn, professeur adjoint d’informatique et auteur principal d’un nouvel article évalué par des pairs annonçant l’approche du monde des équipes, qui sera présenté lors de la prochaine conférence sur l’apprentissage des robots qui se tiendra du 6 au 9 novembre à Atlanta. « Et nous l’avons créé à l’aide de robots disponibles dans le commerce à faible coût – en fait, deux robots disponibles dans le commerce différents. »

La principale avancée, selon les auteurs, est que leur robot-chien est autonome, c’est-à-dire qu’il est capable d’évaluer les défis physiques et d’imaginer, puis d’exécuter, un large éventail de compétences d’agilité basées simplement sur les obstacles qu’il voit devant lui.

« Ce que nous faisons, c’est combiner à la fois la perception et le contrôle, en utilisant les images d’une caméra de profondeur montée sur le robot et l’apprentissage automatique pour traiter toutes ces entrées et déplacer les jambes afin de franchir, passer et contourner les obstacles », a déclaré Zipeng. Fu, doctorant dans le laboratoire de Finn et premier auteur de l’étude, avec Ziwen Zhuang de l’Institut Qi Zhi de Shanghai.

Simplifier pour optimiser

Ce n’est pas le premier chien robot à faire preuve d’une telle agilité – une classe d’athlétisme connue sous le nom de « parkour » – mais il est le premier à combiner l’autosuffisance avec un large éventail de compétences.

« Nos robots ont à la fois une vision et une autonomie, l’intelligence athlétique nécessaire pour relever un défi et sélectionner et exécuter eux-mêmes des compétences de parkour en fonction des exigences du moment », a déclaré Fu.

Les méthodes d’apprentissage existantes reposent souvent sur des systèmes de récompense complexes qui doivent être adaptés à des obstacles physiques spécifiques. En conséquence, ils ne s’adaptent pas bien aux environnements nouveaux ou inconnus. D’autres approches connexes apprennent à utiliser des données du monde réel pour imiter les compétences d’agilité d’autres animaux. Ces chiens robots ne disposent pas d’un large éventail de compétences et n’ont pas les capacités de vision des nouveaux chiens robots. Les deux méthodes existantes sont également « en retard » sur le plan informatique, en d’autres termes, lentes.

Il s’agit de la première application open source à atteindre ces objectifs avec un système de récompense simple n’utilisant aucune donnée de référence réelle, écrivent les auteurs dans l’étude.

Pour réussir, ils ont d’abord synthétisé et perfectionné l’algorithme à l’aide d’un modèle informatique, puis l’ont transféré à deux chiens robots du monde réel. Ensuite, dans un processus appelé apprentissage par renforcement, les robots ont tenté d’avancer comme bon leur semblait et ont été récompensés en fonction de leurs performances. C’est ainsi que l’algorithme finit par apprendre la meilleure façon d’aborder un nouveau défi.

En pratique, la plupart des systèmes de récompense d’apprentissage par renforcement existants impliquent trop de variables pour être efficaces, ce qui ralentit les performances informatiques. C’est ce qui rend le processus de récompense rationalisé pour le parkour robodog exceptionnel, bien qu’étonnamment simple.

« C’est en fait assez simple », a déclaré Finn. « Nous nous sommes basés principalement sur la distance parcourue par le robot et sur la quantité d’effort qu’il a déployé pour le faire. Finalement, le robot acquiert des capacités motrices plus complexes qui lui permettent d’avancer. »

Tests en situation réelle

L’équipe a ensuite réalisé des expériences approfondies en utilisant des robots-chiens du monde réel pour démontrer leur nouvelle approche d’agilité dans des environnements particulièrement difficiles en utilisant uniquement les ordinateurs, les capteurs visuels et les systèmes d’alimentation de ces robots.

En chiffres bruts, les nouveaux robots-chiens améliorés étaient capables de gravir des obstacles représentant plus d’une fois et demie leur hauteur, de sauter des espaces supérieurs à une fois et demie leur longueur, de ramper sous les barrières aux trois quarts. de leur hauteur, et s’inclinent afin de se faufiler par une fente plus fine que leur largeur.

Ensuite, l’équipe espère tirer parti des progrès de la vision et des graphiques 3D pour ajouter des données du monde réel à ses environnements simulés afin d’apporter un nouveau niveau d’autonomie réelle à leur algorithme.