Renversés mais pas vaincus : les robots apprennent le football

Renversés mais pas vaincus : les robots apprennent le football

Crédit: arXiv (2023). DOI : 10.48550/arxiv.2304.13653

Deep Blue contre Kasparov. Watson contre Ken Jennings et Brad Rutter. Deepmind contre Atari. Alpha Go contre Lee Sedol.

Les grandes compétitions machine contre humain au cours des dernières décennies n’ont laissé aucun doute sur qui est le patron.

Tous ces matchs ont été joués de la manière la plus courtoise. Les défis impliquaient tous des activités intellectuelles.

Mais que se passera-t-il lorsque l’IA se lancera dans des jeux de contact physique, lorsque, par exemple, des robots se livreront à pousser, bousculer ou renverser des adversaires ?

Les chercheurs de DeepMind ont abordé cette question lors d’essais de robots humanoïdes formés pour jouer au football. Aucun sujet humain n’était impliqué dans ces concours, pas encore en tout cas. Mais il y a eu un jeu difficile.

Dans un article publié la semaine dernière du arXiv serveur de prépublication, Tuomas Haarnoja et plus de deux douzaines de collègues ont rendu compte de leurs efforts réussis pour enseigner des compétences de mouvement complexes et une stratégie de jeu de base aux robots.

Les chercheurs ont déclaré que de nombreux projets menés par d’autres ces dernières années impliquant des robots quadrupèdes ont donné des résultats impressionnants. Parmi eux, le chien robot Spot de Boston Dynamics a excellé dans la navigation fluide dans des environnements inconnus, non structurés et hostiles.

Moins de projets ont abordé le mouvement bipède. Les chercheurs affirment que la mobilité à deux jambes pose des défis supplémentaires en matière de stabilité et de sécurité. En matière de sport, ces défis sont encore plus grands.

« Le football nécessite un ensemble diversifié de mouvements très agiles et dynamiques, notamment la course, les virages, les pas de côté, les coups de pied, les passes, la récupération après une chute, l’interaction avec des objets et bien d’autres », a déclaré Haarnoja.

« Les joueurs doivent en outre être capables de faire des prédictions sur le ballon, les coéquipiers et les adversaires, et d’adapter leurs mouvements au contexte du jeu. Les joueurs doivent également coordonner leurs mouvements sur de longues échelles de temps pour obtenir un jeu tactique et coordonné. »

L’équipe de DeepMind a conçu des robots humanoïdes miniatures avec 20 articulations contrôlables et a utilisé Deep RL (Deep Reinforcement Learning) pour leur enseigner les compétences de base du football. Ils se sont concentrés sur les habiletés motrices adaptées au contexte telles que « marcher, courir, tourner, donner des coups de pied et récupérer après une chute ».

Les robots ont montré « des capacités de mouvement robustes et dynamiques », a déclaré Haarnoja. Le rapport, intitulé « Apprendre des compétences de football agiles pour un robot bipède avec apprentissage par renforcement en profondeur », a également été publié sur un blog Google la semaine dernière.

Le projet de football robotique différait de nombreux projets similaires antérieurs en ce sens qu’il se concentrait sur l’utilisation de l’ensemble du corps robotique – pas seulement des mains ou des pieds – pour s’engager dans un jeu stratégique.

« Créer une intelligence incarnée générale, c’est-à-dire créer des agents capables d’agir dans le monde physique avec agilité, dextérité et compréhension – comme le font les animaux ou les humains – est l’un des objectifs de longue date des chercheurs en IA et des roboticiens », a déclaré Haarnoja.

La publication du projet DeepMind a suscité de nombreuses discussions sur les réseaux sociaux, mais un bref clip vidéo a particulièrement attiré l’attention. Dans le clip, un chercheur pousse continuellement un robot essayant de marquer un but. Le robot procédait héroïquement à chaque fois pour récupérer et se remettre sur pied.

Bien qu’il soit clairement fait pour tester et améliorer la capacité du robot à se remettre des trébuchements et autres erreurs, « l’abus » a incité les utilisateurs de Twitter à réagir.

« C’est difficile de ne pas anthropomorphiser. Mon cerveau me dit : CESSEZ D’ÊTRE MÉCHANT ! Lol », a déclaré John Weller.

« À quel moment faire [the robots] apprendre qu’il est plus facile de taper dans le ballon quand un humain ne le pousse pas constamment et ensuite prendre des mesures pour que cela ne se produise pas afin qu’il puisse jouer au ballon ? », a demandé N4GERACS.

« Je dois dire, personnellement, étant donné la vitesse à laquelle l’IA évolue ces jours-ci, je ne serais pas si cavalier pour pousser ces robots », a averti Jeff Kirsch.

Et une mise en garde de Jing Lang : « J’espère qu’ils nous pardonneront pour cela. »

Peut-être que ceux qui sont énervés par la bousculade seront réconfortés par la sagesse d’un grand athlète d’un sport différent, feu le grand cogneur de baseball Babe Ruth, qui a dit un jour : « Vous ne pouvez pas battre la personne qui n’abandonne pas. »