La théorie de l'enseignement de l'esprit aux robots peut améliorer la collaboration

La nature regorge d’animaux qui collaborent en grand nombre. Les abeilles prennent les meilleurs spots d’alimentation et font savoir aux autres où ils se trouvent. Les fourmis construisent des maisons hiérarchiques complexes construites pour la défense. Des troupeaux d’étourneaux se déplacent à travers le ciel sous de belles formations comme s’ils étaient une seule entité.

Cependant, aucun de ces animaux ne collabore à la manière dont les humains. Les comportements de ruche-esprit résultent de règles simples suivies de nombreuses personnes. Les humains, cependant, ont la capacité de sympathiser les uns avec les autres et de prédire les actions de l’autre – un trait connu sous le nom de théorie de l’esprit.

Maintenant, un groupe de chercheurs de l’Université Duke et de l’Université Columbia a compris comment utiliser ce trait uniquement humain pour former rapidement des groupes de robots pour effectuer des tâches complexes. Alors que d’autres algorithmes de contrôle dirigent les robots à travers des mécanismes plus similaires aux comportements de ruche-esprit, ce cadre nouvellement démontré appelé HUMAC enseigne des groupes de robots comment collaborer à travers des idées fournies par un seul coach humain.

L’étude est publiée sur le arxiv serveur de préimprimée.

La recherche, acceptée à la Conférence internationale de l’IEEE sur la robotique et l’automatisation (ICRA 2025), qui se tiendra du 19 au 23 mai 2025 à Atlanta, en Géorgie, montre comment les robots peuvent apprendre à anticiper les actions des coéquipiers, adapter des stratégies en temps réel et résoudre des défis qui nécessitent une intelligence collective et coordonnée humaine.

Le travail pourrait être une aubaine pour des applications telles que la réponse des incendies de forêt et les tâches de survie sauvage où les robots doivent coopérer et collaborer sous des contraintes, avec des structures d’équipe hiérarchiques, l’incertitude des limites de la bande passante de l’environnement et de la communication.

« Les humains commencent à développer la compétence de la théorie de l’esprit vers l’âge de quatre ans », a expliqué Boyuan Chen, professeur adjoint de la famille Dickinson en génie mécanique et science des matériaux, génie électrique et informatique et informatique à l’Université Duke. « Cela nous permet d’interpréter et de prédire les intentions des autres, permettant à la collaboration d’émerger. C’est une capacité essentielle que nos robots actuels manquent pour leur permettre de travailler en équipe avec d’autres robots et humains. Nous avons conçu HUMAC pour aider les robots à apprendre de la façon dont les humains pensent et se coordonnent de manière efficace. »

Il y a eu d’autres approches pour enseigner aux robots pour collaborer à des tâches significatives. L’une consiste à utiliser l’apprentissage du renforcement, où les robots apprennent en interagissant dans le même environnement avec des millions à des milliards d’essais et d’erreurs, ce qui est inefficace sans aucune garantie de succès. Une autre méthode implique l’imitation l’apprentissage de grands groupes d’experts humains collaboratifs, qui est coûteux et peu pratique.

HUMAC adopte une approche radicalement différente. Pendant l’entraînement, le cadre permet à un seul opérateur humain de prendre brièvement le contrôle de différents robots au sein d’une équipe si nécessaire, en les guidant à des moments stratégiques clés, tout comme un entraîneur donnant des conseils ciblés lors d’un match de football. Ces interactions montrent aux groupes comment mener des tactiques collaboratives sophistiquées comme une embuscade et encerclant.

Après ces brèves démonstrations, le système intègre les interventions humaines dans les algorithmes des robots. L’idée clé est que pour que les robots puissent apprendre à collaborer, ils doivent apprendre à former une représentation mentale pour prédire simultanément quels sont les plans de leurs coéquipiers et ce que leurs joueurs adverses feront. En d’autres termes, intégrer implicitement toutes les décisions de tous les joueurs dans leurs propres plans – Théorie de l’esprit.

« Notre cadre imagine l’avenir de l’homme-AI faisant équipe où les humains sont des leaders », a déclaré Chen. « Dans ce cas, un humain guide un plus grand nombre d’agents d’une manière rapide et adaptable, ce qui n’a jamais été fait auparavant. »

L’équipe a testé HUMAC dans un jeu dynamique de cache-cache, où une équipe de trois robots chercheurs essaie d’attraper une équipe de trois robots Hider plus rapides dans une arène carrée bornée remplie d’obstacles aléatoires, en s’appuyant uniquement sur des observations visuelles partielles. Ce cadre est difficile, car les chercheurs non collaboratifs qui continuent de poursuivre les cachés les plus proches ne peuvent atteindre qu’un taux de réussite de 36%.

Avec HUMAC, un entraîneur humain prend sélectivement le contrôle des robots individuels si nécessaire. Après seulement 40 minutes de guidage, l’équipe de robots présente de solides comportements collaboratifs tels que la suppression et le passage. Dans les simulations, le taux de réussite est passé à 84%, et même dans les tests de véhicules au sol physiques, le taux de réussite est resté fort à 80%.

« Nous avons observé des robots commençant à se comporter comme de véritables coéquipiers », a déclaré Zhengran Ji, auteur d’étudiant et étudiant diplômé au laboratoire de Chen. « Ils ont prédit les mouvements de chacun et se coordonné naturellement, sans commandes explicites. »

« C’était vraiment excitant à regarder, et nous pensons qu’il ouvre de nombreuses opportunités pour les futures équipes de robots collaboratives et les équipes de robot humain dans diverses applications », a ajouté Chen.

Imaginez un essaim de drones coordonnant en temps réel pour localiser les survivants après une catastrophe naturelle, balayant efficacement les zones recouvertes de débris sans chemins qui se chevauchent. Toute application où un petit nombre d’humains doit enseigner un grand nombre de robots à collaborer pourraient utiliser cette approche. Les chercheurs travaillent déjà à l’élargissement de la HUMAC à de plus grandes équipes de robots et à des tâches plus complexes tout en explorant des méthodes d’interaction plus riches pour rationaliser et améliorer les équipes de robots humains.

« L’IA n’est pas seulement un outil pour les humains, c’est un coéquipier. La forme finale de super-intelligence ne sera pas seule l’IA ni les humains seuls, c’est l’intelligence collective des humains et de l’IA », a déclaré Chen. « Tout comme les humains ont évolué pour collaborer, l’IA deviendra plus adaptative pour travailler les uns avec les autres et avec nous. HUMAC est un pas vers cet avenir. »