Le Dreamer AI de Google apprend à s'améliorer avec le temps en maîtrisant Minecraft

Un trio de chercheurs d’IA chez Google Deepmind de Google, en collaboration avec un collègue de l’Université de Toronto, signale que le rêveur de l’algorithme d’IA peut apprendre à s’auto-s’améliorer en maîtrisant Minecraft dans un court laps de temps. Dans leur étude publiée dans la revue NatureDanijar Hafner, Jurgis Pasukonis, Timothy Lillicrap et Jimmy BA ont programmé l’application AI pour jouer Minecraft sans être formé et atteindre un niveau d’expert en seulement neuf jours.

Au cours des dernières années, les informaticiens ont beaucoup appris sur la façon dont l’apprentissage en profondeur peut être utilisé pour former des applications d’IA pour mener des activités apparemment intelligentes telles que la réponse aux questions. Les chercheurs ont également constaté que les applications d’IA peuvent être formées pour jouer à des jeux et fonctionner mieux que les humains. Cette recherche s’est étendue au jeu vidéo, ce qui peut sembler redondant, car que pourriez-vous obtenir d’un ordinateur en jouant un autre ordinateur?

Dans cette nouvelle étude, les chercheurs ont constaté qu’il pouvait produire des avancées telles que aider une application AI à apprendre à améliorer ses capacités sur une courte période, ce qui pourrait donner aux robots les outils dont ils ont besoin pour bien performer dans le monde réel.

Dans cet effort, les chercheurs ont programmé le rêveur de jouer au jeu vidéo populaire Minecraft en créant un système de récompenses, en particulier des récompenses pour trouver des diamants. Avec cette approche, l’application n’avait pas besoin d’être appris à jouer au jeu; Il avait juste besoin de connaître les paramètres dans lesquels il pourrait fonctionner, dont l’un comprenait une imagination d’un monde futur virtuel.

Une fois que l’algorithme a appris à jouer à Minecraft, les chercheurs ont ajouté une nouvelle torsion – ils l’ont permis de jouer dans un scénario donné pendant 30 minutes à la fois. À ce stade, le jeu serait redémarré avec un tout nouvel univers virtuel. En utilisant cette approche, les chercheurs ont constaté que l’algorithme s’améliorait rapidement, atteignant le statut d’experts après avoir joué au jeu pendant seulement neuf jours.

Le Dreamer AI de Google apprend à s'améliorer avec le temps en maîtrisant Minecraft

L’équipe de recherche suggère que la capacité de l’algorithme à imaginer un avenir où tous ses objectifs ont été atteints ont permis de rester concentré sur les tâches qui ont conduit à l’objectif souhaité, puis à les utiliser dans chaque nouveau monde virtuel qu’il a rencontré. Ce résultat pourrait éventuellement être utilisé pour aider les robots à apprendre à atteindre des objectifs prédéfinis dans le monde réel.