Le modèle d'IA imite la fixation des objectifs humains grâce à la création de jeux

Bien que nous soyons remarquablement capables de générer nos propres objectifs, de commencer par le jeu de l’enfant et de continuer à l’âge adulte, nous n’avons pas encore de modèles informatiques pour comprendre cette capacité humaine.

Cependant, une équipe de scientifiques de l’Université de New York a maintenant créé un modèle informatique qui peut représenter et générer des objectifs humains en apprenant de la façon dont les gens créent des jeux.

L’œuvre, rapportée dans le journal Intelligence de la machine de la naturepourrait conduire à des systèmes d’IA qui comprennent mieux les intentions humaines et plus fidèlement modéliser et s’aligner sur nos objectifs. Cela peut également conduire à des systèmes d’IA qui peuvent nous aider à concevoir plus de jeux humains.

« Bien que les objectifs soient fondamentaux pour le comportement humain, nous savons très peu sur la façon dont les gens représentent et les proposent – et manquons de modèles qui capturent la richesse et la créativité des objectifs générés par l’homme », explique Guy Davidson, auteur principal du journal et doctorant NYU.

« Nos recherches fournissent un nouveau cadre pour comprendre comment les gens créent et représentent des objectifs, ce qui pourrait aider à développer des systèmes d’IA plus créatifs, originaux et efficaces. »

Malgré des travaux expérimentaux et informatiques considérables sur les objectifs et les comportements axés sur les objectifs, les modèles d’IA sont encore loin de capturer la richesse des objectifs humains quotidiens. Pour combler cette lacune, les auteurs de l’article ont étudié comment les humains créent leurs propres objectifs, ou tâches, afin d’éclairer potentiellement la façon dont les deux sont générés.

Les chercheurs ont commencé par capturer comment les humains décrivent les actions de fixation d’objectifs à travers une série d’expériences en ligne.

Ils ont placé les participants dans une salle virtuelle qui contenait plusieurs objets. Les participants ont été invités à imaginer et à proposer un large éventail de buts ludiques, ou jeux, liés au contenu de la pièce – EG, rebondissant dans une poubelle en le jetant d’abord d’un mur ou en empilant des jeux impliquant des tours de blocs en bois.

Les chercheurs ont enregistré les descriptions par les participants de ces objectifs liés aux jeux conçus, ce qui est entièrement 100 matchs au total. Ces descriptions ont formé un ensemble de données de jeux à partir desquels le modèle des chercheurs a appris.

Bien que la génération d’humangiste puisse sembler illimitée, les objectifs que les participants à l’étude ont créés ont été guidés par un nombre fini de principes simples du bon sens (les objectifs doivent être physiquement plausibles) et la recombinaison (de nouveaux objectifs sont créés à partir d’éléments de jeu partagés).

Par exemple, les participants ont créé des règles dans lesquelles une balle pourrait être lancée de manière réaliste dans un bac ou rebondir sur un mur (plausibilité) et combiner des éléments de lancement de base pour créer divers jeux (hors du mur, sur le lit, lancer du bureau, avec ou sans renvoyer des blocs, etc., comme exemples de récupération).

Les chercheurs ont ensuite formé le modèle d’IA pour créer des jeux axés sur les objectifs en utilisant les règles et objectifs développés par les participants humains.

Pour déterminer si ces objectifs créés par l’IA s’alignent avec ceux créés par les humains, les chercheurs ont demandé à un nouveau groupe de participants d’évaluer plusieurs attributs, tels que le plaisir, la créativité et la difficulté. Les participants ont évalué à la fois les jeux générés par l’human

Jeu créé par l’homme:

Gameplay: lancez une balle pour qu’il touche un mur puis le prendre ou le toucher
Scoring: vous obtenez 1 point pour chaque fois que vous lancez le ballon avec succès, il touche un mur, et vous le retirez à nouveau ou le touchez après son vol

Jeu créé par AI:

Gameplay: lance des balles de dodge pour qu’ils atterrissent et viennent se reposer sur l’étagère supérieure; Le jeu se termine après 30 secondes
Scoring: vous obtenez 1 point pour chaque ballon de dodge qui repose sur l’étagère supérieure à la fin du jeu

Dans l’ensemble, les participants humains ont donné des notes similaires aux jeux créés par l’homme et à ceux générés par le modèle d’IA. Ces résultats indiquent que le modèle a capturé avec succès les façons dont les humains développent de nouveaux objectifs et ont généré ses propres objectifs ludiques qui étaient indiscernables de ceux créés par l’homme.

Cette recherche aide à approfondir notre compréhension de la façon dont nous formons des objectifs et de la façon dont ces objectifs peuvent être représentés aux ordinateurs. Il peut également nous aider à créer des systèmes qui aident à concevoir des jeux et d’autres activités ludiques.