Ce n’était qu’une question de temps avant que quelqu’un apprenne à une intelligence artificielle à jouer au football. l’esprit profond est dessus
Que l’on aime plus ou moins le football, que l’on soit un fan passionné ou que l’on se fiche de l’évolution de la Ligue, il faut avouer une chose : ce n’est pas facile de bien jouer. Ce n’est pas pour nous les humains. Et encore moins pour les machines. Se déplacer sur le terrain avec un ballon aux pieds demande de la coordination et de l’équilibre, mais aussi des compétences pour concourir en équipe.
Cela peut vous sembler une évidence, quelque chose d’abordable pour quiconque s’entraîne assez dur. Pour une intelligence artificielle (IA), pas tellement. Si nous parvenons à lui faire assumer les fondamentaux nécessaires pour se déplacer librement dans un champ, nous aurons peut-être facilité, en fait, qu’à l’avenir, il y aura des robots capables de bouger plus naturellementplus proche de celle de l’homme.
Chez DeepMind, filiale de Alphabet – la société mère de Google – ils le savent et ont formé une IA pour qu’elle devienne peut-être un jour un Luka Modrić numérique. Comment? Bien suivant une dynamique pas très différent de celui qui serait utilisé dans n’importe quelle école de football pour apprendre à jouer à un enfant. Seulement à partir de zéro et à un rythme beaucoup plus rapide.
Chez Alphabet, ils ont commencé par donner à l’IA le contrôle de figures numériques avec une forme humaine et des mouvements articulaires quelque peu similaires à ceux que nous avons. Pas à pas – jamais mieux dit – les scientifiques leur ont appris à marcher, à dribbler, à lancer des balles et, enfin, à jouer avec d’autres figures, en commençant par des compétitions de base avec des équipes de seulement deux membres.
De l’école aux jeux
Au cours de la première phase, les chiffres acquis Capacités de base de la locomotion et du maniement du ballon. Le processus a consommé les 24 premières heures d’entraînement, mais il a représenté environ un an et demi de matchs simulés. Déjà dans une deuxième étape de l’expérience, des comportements de coopération et de travail d’équipe typiques d’un vrai match ont commencé à être appliqués.
Nouveau scientifique précis que las habilidades del trabajo en equipo, claves para que la IA pudiera intuir dónde iba a recibir un pase, exigieron algo más de tiempo: alrededor de dos o tres décadas de partidos simulados, lo que equivale aproximadamente a dos o tres semanas en el mundo réel.
« Nos agents ont acquis des compétences telles que la locomotion agile, le dépassement et la division du travailcomme en témoignent un certain nombre de statistiques, y compris des mesures utilisées dans l’analyse sportive du monde réel », explique l’esprit profond. Parmi les capacités dont fait preuve l’IA, on distingue par exemple la capacité à anticiper le comportement de ses coéquipiers.
« Au début de l’entraînement, tous les agents couraient juste vers le ballon. Après quelques jours, nous avons vu qu’ils se rendaient compte que l’un de leurs coéquipiers avait le contrôle du ballon, ils se retournaient et couraient sur le terrain, anticipant qu’il essaierait de marquer ou peut-être de passer le ballon », explique Wired Guy Levermembre de l’équipe qui a façonné leurs études dans Robotique scientifique.
La coordination est la clé de l’intelligence humaine, mais il est difficile d’apprendre en utilisant des récompenses artisanales. De nouvelles recherches en @SciRobotics décrit comment la coordination peut émerger, même avec une réalisation complexe.
Blog: https://t.co/YcotJLaxIs
Rôle: https://t.co/mDIB9b1ZET 1/ pic.twitter.com/lOS9oNMxha– DeepMind (@DeepMind) 31 août 2022
Il y a environ cinq ans, des chercheurs ont déjà essayé d’enseigner aux figures articulées comment s’attaquer à un parcours d’obstacles. L’expérience a laissé des leçons sur les avantages du système d’essais et d’erreurs et sur la apprentissage par renforcement (RL), mais ses schémas de mouvement étaient « non naturels », avec un certain côté comique. Le problème, l’esprit profond avouec’est que « ne serait pas pratique » pour la robotique.
L’enjeu n’est pas tant d’avoir une IA capable de déplacer des figures imitant les humains que d’atteindre des « comportements bien réglés », indispensables pour marcher sur des terrains accidentés ou encore manipuler des objets fragiles. « Les mouvements nerveux ils peuvent endommager le robot lui-même ou son environnement ou au moins vider la batterie », commente la filiale Alphabet. D’où les efforts pour réaliser des robots au comportement « sûr et efficace » qui répondent aux commandes qu’ils reçoivent.
Et dans cet effort, le jeu de Maradona et Pelé peut devenir un allié inattendu. « Le football est depuis longtemps un défi pour la recherche sur l’intelligence incarnée, car il nécessite des compétences individuelles et un jeu d’équipe coordonné », détaillé dans DeepMind.
Pour atteindre leur objectif, les scientifiques ont utilisé les primitives motrices probabilistes neuronales (NPMP), qui fonde l’apprentissage sur les schémas de mouvement prélevés sur les humains et les animaux et aide à traduire les commandes de contrôle. « Nous avions déjà montré qu’un comportement coordonné peut émerger dans des équipes qui se font concurrence. Le NPMP nous a permis d’observer un effet similaire dans un scénario nécessitant un contrôle moteur. nettement plus avancé”, la compagnie abonde.
« Cela oriente fondamentalement son contrôle moteur vers un comportement humain réaliste, des mouvements humains réalistes. Et cela est appris de la capture de mouvement, dans ce cas, des acteurs humains jouant au football. » raconte l’équipe à Wired. Dans le cadre du même processus, l’IA a également été récompensée pour ne pas s’écarter des stratégies définies pour chaque scénario.
Est-ce à dire que Google veut devenir le champion absolu du Coupe Robo?
Eh bien, pour l’instant, cela indique que cela fonctionne pour que demain nous puissions voir l’IA avec des mouvements plus efficaces. Après tout… Qui a dit que le football était juste un jeu?
Images | esprit profond Oui Robotique scientifique