Entraîner des robots à apprendre, prendre des décisions à la volée

par le département de génie aérospatial de l’Université de l’Illinois

Le modèle de processus gaussien profond proposé est formé sur la base de données hors ligne avec un méta-apprentissage profond avec des lacunes de déploiement contrôlées, qui divise à plusieurs reprises l’ensemble de formation en formation moyenne et formation du noyau et apprend les paramètres du noyau pour minimiser les résidus des modèles moyens. En déploiement, le décideur utilise le modèle formé et l’adapte aux données acquises en ligne. Crédit : Département de génie aérospatial de l’Université de l’Illinois

Les rovers martiens ont des équipes d’experts humains sur Terre qui leur disent quoi faire. Mais les robots en mission d’atterrisseur sur des lunes en orbite autour de Saturne ou de Jupiter sont trop éloignés pour recevoir des commandes en temps opportun de la Terre.

Des chercheurs des départements de génie aérospatial et d’informatique de l’Université de l’Illinois à Urbana-Champaign ont mis au point une nouvelle méthode basée sur l’apprentissage afin que les robots sur des corps extraterrestres puissent décider eux-mêmes où et comment prélever des échantillons de terrain.

« Plutôt que de simuler comment ramasser tous les types possibles de roches ou de matériaux granulaires, nous avons créé une nouvelle façon pour les atterrisseurs autonomes d’apprendre à apprendre à ramasser rapidement un nouveau matériau qu’ils rencontrent », a déclaré Pranay Thangeda, titulaire d’un doctorat. étudiant au Département de génie aérospatial.

« Il apprend également à s’adapter à l’évolution des paysages et de leurs propriétés, telles que la topologie et la composition des matériaux », a-t-il déclaré.

En utilisant cette méthode, Thangeda a déclaré qu’un robot peut apprendre à ramasser un nouveau matériau avec très peu de tentatives. « S’il fait plusieurs mauvaises tentatives, il apprend qu’il ne doit pas écoper dans cette zone et il essaiera ailleurs. »

L’un des défis de cette recherche est le manque de connaissances sur les mondes océaniques comme Europe.

« Avant d’envoyer les récents rovers sur Mars, les orbiteurs nous donnaient d’assez bonnes informations sur les caractéristiques du terrain », a déclaré Thangeda. « Mais la meilleure image que nous ayons d’Europe a une résolution de 256 à 340 mètres par pixel, ce qui n’est pas assez clair pour déterminer les caractéristiques. »

Le conseiller de Thangeda, Melkior Ornik, a déclaré: « Tout ce que nous savons, c’est que la surface d’Europe est de la glace, mais cela pourrait être de gros blocs de glace ou beaucoup plus fins comme de la neige. Nous ne savons pas non plus ce qu’il y a sous la glace. »

Pour certains essais, l’équipe a caché du matériel sous une couche d’autre chose. Le robot ne voit que le matériau supérieur et pense qu’il pourrait être bon de ramasser. « Quand il ramasse et frappe la couche inférieure, il apprend qu’il est impossible de ramasser et se déplace vers une autre zone », a déclaré Thangeda.

Entraîner des robots à apprendre, prendre des décisions à la volée — A partir de ces 12 matériaux et terrains constitués d’une composition unique d’un ou plusieurs matériaux, une base de données de 6 700 a été créée. Crédit : Département de génie aérospatial de l’Université de l’Illinois

La NASA souhaite envoyer des rovers alimentés par batterie plutôt que nucléaires en Europe car, entre autres considérations spécifiques à la mission, il est essentiel de minimiser le risque de contamination des mondes océaniques avec des matières potentiellement dangereuses.

« Bien que les alimentations nucléaires aient une durée de vie de plusieurs mois, les batteries ont une durée de vie d’environ 20 jours. Nous ne pouvons pas nous permettre de perdre quelques heures par jour à échanger des messages. C’est une autre raison pour laquelle l’autonomie du robot pour prendre des décisions en soi est vital », a déclaré Thangeda.

Cette méthode d’apprentissage pour apprendre est également unique car elle permet au robot d’utiliser la vision et très peu d’expérience en ligne pour réaliser des actions de ramassage de haute qualité sur des terrains inconnus, surpassant considérablement les méthodes non adaptatives et d’autres méthodes de pointe. méthodes de méta-apprentissage.

L’équipe a utilisé un robot du Département d’informatique de l’Illinois. Il est calqué sur le bras d’un atterrisseur avec des capteurs pour collecter des données de ramassage sur une variété de matériaux, des grains de sable de 1 millimètre aux roches de 8 centimètres, ainsi que des matériaux de différents volumes tels que du carton déchiqueté et des cacahuètes d’emballage. La base de données résultante dans la simulation contient 100 points de connaissance pour chacun des 67 terrains différents, soit 6 700 points au total.

« À notre connaissance, nous sommes les premiers à ouvrir un ensemble de données à grande échelle sur des supports granulaires », a déclaré Thangeda. « Nous avons également fourni du code pour accéder facilement à l’ensemble de données afin que d’autres puissent commencer à l’utiliser dans leurs applications. »

Le modèle créé par l’équipe sera déployé sur le banc d’essai d’autonomie Ocean World Lander du Jet Propulsion Laboratory de la NASA.

« Nous sommes intéressés par le développement de capacités robotiques autonomes sur des surfaces extraterrestres, et en particulier sur des surfaces extraterrestres difficiles », a déclaré Ornik. « Cette méthode unique contribuera à informer l’intérêt continu de la NASA pour l’exploration des mondes océaniques. »

« La valeur de ce travail réside dans l’adaptabilité et la transférabilité des connaissances ou des méthodes de la Terre à un corps extraterrestre, car il est clair que nous n’aurons pas beaucoup d’informations avant que l’atterrisseur n’arrive. Et en raison de la courte durée de vie de la batterie, nous n’aura pas beaucoup de temps pour le processus d’apprentissage. L’atterrisseur peut ne durer que quelques jours, puis mourir, donc apprendre et prendre des décisions de manière autonome est extrêmement bénéfique.

Fourni par le département d’ingénierie aérospatiale de l’Université de l’Illinois