Une IA nommée Cicero peut battre les humains dans Diplomacy, un jeu complexe de création d’alliances. Voici pourquoi c’est une grande nouvelle
Dans une rare bonne nouvelle de Meta, les chercheurs en intelligence artificielle de l’entreprise viennent d’annoncer une percée scientifique. Leur programme d’IA nommé Cicero peut désormais jouer au jeu de société Diplomacy à un niveau humain.
Maintenant, avant que vous ne soyez trop excité, Cicéron ne joue pas à un niveau surhumain. Il a été battu par environ 10% des humains contre lesquels il a joué. En comparaison, dans les étapes précédentes de l’IA, comme l’IA battant les humains aux échecs ou au Go, les humains ont depuis longtemps été complètement dépassés.
L’IA Go-playing de DeepMind est, par exemple, un « dieu Go » – selon le grand maître chinois Ke Jie. Même le champion du monde de go humain perdrait désormais 100-0 face à l’ordinateur.
La diplomatie est un jeu simplifié et abstrait, impliquant des armées et des marines rivales envahissant ou n’envahissant pas les territoires des autres. Il est juste de dire qu’il lui manque la complexité et la subtilité du type de diplomatie entreprise dans les couloirs des Nations Unies.
Néanmoins, la nouvelle de la performance de Cicero était dans l’œil des rivaux technologiques tels que Google, propriétaire de DeepMind. Le PDG et fondateur de DeepMind, Demis Hassabis, est un expert en diplomatie. Il a remporté le championnat du monde par équipe en 2004 et a terminé 4e au monde lors du championnat du monde 2006.
Je m’attends à ce que Hassabis puisse facilement battre Cicéron en raison de certaines des limitations que je soulignerai sous peu.
Le jeu de la diplomatie
La diplomatie est ce que les chercheurs en intelligence artificielle appellent un « jeu à sept joueurs, à somme nulle et déterministe d’informations imparfaites ». Une partie à sept joueurs est beaucoup plus difficile à résoudre qu’une partie à deux joueurs comme les échecs ou le go. Vous devez considérer les nombreuses stratégies possibles non pas d’un mais de six autres joueurs. Cela rend beaucoup plus difficile d’écrire une IA pour jouer au jeu.
La diplomatie est aussi un jeu d’informations imparfaites, car les joueurs effectuent des mouvements simultanément. Contrairement à des jeux tels que les échecs ou le go, où vous savez tout sur les mouvements de votre adversaire, les joueurs de Diplomacy effectuent des mouvements sans savoir ce que leurs adversaires sont sur le point de faire. Ils doivent donc prédire les prochaines actions de leurs adversaires. Cela ajoute également au défi d’écrire une IA pour y jouer.
Enfin, Diplomacy est un jeu à somme nulle dans lequel si vous gagnez, je perds. Et le résultat est déterministe et ne dépend pas du hasard. Néanmoins, avant la victoire ou la défaite, il est toujours payant pour les joueurs de former des alliances et de faire équipe les uns sur les autres. En effet, l’un des vrais défis du jeu est de gérer les négociations informelles avec les autres joueurs avant d’effectuer des coups simultanés.
La principale raison pour laquelle la performance de Cicéron est une percée scientifique est qu’il peut à la fois bien jouer le jeu et effectuer ces négociations informelles. Cette combinaison de traitement du langage naturel et de raisonnement stratégique est une première pour toute IA de jeu.
Battre Cicéron
Une lecture attentive du article Meta publié sur Cicéron dans le journal La science offre quelques indices sur la façon dont vous pouvez le battre.
Premièrement, Cicéron est presque entièrement honnête (contrairement au célèbre romain il porte son nom). D’un autre côté, Diplomacy est un jeu de trahison et de malhonnêteté. Les joueurs proposent de former des alliances mais renoncent souvent instantanément à ces accords. Cicéron non. Ça joue toujours droit.
L’honnêteté est une stratégie étonnamment efficace en diplomatie, mais pas si vos adversaires savent que vous ne les trahirez jamais. C’est le hic. Cicéron a joué de manière anonyme, donc ses adversaires humains n’auraient probablement pas réussi à résoudre ce problème. Mais si vous connaissez ce fait, il sera facile d’en profiter.
Deuxièmement, Cicéron (cette fois comme son homonyme) est très bavard. Les joueurs experts en diplomatie échangent deux fois plus de messages avec d’autres joueurs que les non-experts. L’astuce consiste à former des alliances et à rassurer vos adversaires sur votre intention. Cicéron échange également deux fois plus de messages que les joueurs humains qu’il a tendance à battre.
Bien sûr, étant un bot, il est beaucoup plus facile pour Cicero de gérer six conversations simultanées. Et cela, je dirais, est un avantage injuste d’être un ordinateur dans ce scénario.
Et ensuite ?
On ne sait pas comment Meta a l’intention de s’appuyer sur cette recherche. Un ordinateur capable de raisonner sur les croyances, les objectifs et les intentions des autres, ainsi que de persuader et d’établir des relations par le dialogue, est un outil puissant. C’est un qui pourrait être facilement utilisé à mauvais escient. N’oublions pas qu’il y a plusieurs années, Facebook (qui appartient à Meta) a fait l’objet de nombreuses critiques justifiées pour une expérience visant à manipuler les émotions des utilisateurs.
Pourtant, il est difficile de dire exactement quelles pourraient être les applications réelles de Cicero. Après tout, la diplomatie dans le monde réel n’est ni à somme nulle ni déterministe. Deux pays peuvent convenir de ne pas entrer en guerre, et les deux gagneront.
Ensuite, il existe une multitude de facteurs aléatoires qui peuvent modifier un résultat. L’Armada espagnole, par exemple, a perdu plus de navires à cause des tempêtes estivales inattendues que des tirs ennemis.
Quelle que soit l’intention de Meta, la percée est un autre exemple de la façon dont les grandes entreprises technologiques prennent le contrôle de la course à l’IA avec des investissements d’un milliard de dollars qui ne peuvent être égalés par le secteur public. Cicero a été produit par une équipe de plus de 25 chercheurs. Personne travaillant dans une université n’a ce genre de ressources pour résoudre un jeu de société.
En tant que chercheur en intelligence artificielle dans l’une de ces universités, je suis en conflit. Je me souviens d’un célèbre graffito à Pompéi qui a dit
Suti Ciciiro vapla bis
« Tu aimeras Cicéron, ou tu seras fouetté ».