15 points par xguru 2022-11-24 | 1 commentaires | Partager sur WhatsApp
  • Meta AI a développé et publié une intelligence artificielle capable de montrer des performances de niveau humain dans le célèbre jeu de stratégie Diplomacy
  • Dans la version en ligne de ce jeu, elle s’est hissée dans les 10 % supérieurs avec un score plus de deux fois supérieur à celui des humains
  • Diplomacy constituait depuis des décennies un défi jugé impossible pour l’IA
    • Dans ce jeu, il faut comprendre les motivations et les points de vue des autres pour élaborer des plans complexes et ajuster sa stratégie
    • Il faut aussi communiquer avec eux en langage naturel pour parvenir à des accords et inspirer confiance sur les partenariats et les alliances
    • CICERO négociait si bien qu’il était parfois préféré à d’autres participants humains
    • Si l’on ne détecte pas qu’un autre joueur bluffe, ou si l’on ne comprend pas un comportement agressif, on perd très vite
    • De plus, si l’on ne parle pas comme une vraie personne (faire preuve d’empathie, créer une relation, montrer sa connaissance du jeu, etc.), les autres ne voudront pas coopérer
  • Le cœur de cette réussite a été le développement de nouvelles techniques à l’intersection de deux domaines totalement différents de l’IA
    • le raisonnement stratégique (Strategic Reasoning) utilisé dans des systèmes comme AlphaGo et Pluribus
    • le traitement du langage naturel (NLP) utilisé dans des modèles comme GPT-3, BlenderBot 3, LaMDA et OPT-175B
  • Par exemple, CICERO peut déduire qu’il aura besoin du soutien d’un joueur précis en fin de partie, puis élaborer une stratégie pour gagner sa faveur
  • Le code et l’article de recherche ont été publiés ensemble

1 commentaires

 
xguru 2022-11-24

Diplomacy est un jeu de société sorti dès 1959, au point qu’une édition du 50e anniversaire est même parue en 2008. Dans le jeu, les joueurs incarnent l’un des 7 pays d’Europe d’avant la Première Guerre mondiale (Royaume-Uni, France, Autriche-Hongrie, Allemagne, Italie, Russie, Turquie). La partie commence au printemps 1901, puis des actions sont effectuées à chaque tour de printemps et d’automne. Il n’existe que deux types d’unités, l’armée de terre et la flotte, et l’on choisit entre se déplacer vers une région adjacente (y compris pour attaquer), soutenir l’attaque ou la défense d’un allié dans une région voisine, ou rester sur place. Toutes les unités ont la même force d’attaque de 1 et la même capacité de déplacement de 1. Bien sûr, l’armée de terre ne peut se déplacer que sur terre, et peut être transportée par mer via une flotte (Convoy). En d’autres termes, il n’y a que 4 actions possibles : Hold/Move/Support/Convoy

La carte, qui couvre toute l’Europe, comporte au total 34 centres de ravitaillement (Supply Center) marqués d’une étoile, et la victoire revient au pays qui en contrôle 18. Tous les pays commencent avec 3 centres de ravitaillement, sauf la Russie qui en a 4. Les 12 autres sont donc vides au départ. À la fin de chaque tour d’automne, chaque pays peut entretenir autant d’unités qu’il possède de centres de ravitaillement. Les forces de départ diffèrent selon les pays : certains commencent avec 2 armées et 1 flotte, d’autres avec 2 flottes et 1 armée. Le Royaume-Uni, dominant en puissance navale, commence avec des flottes à Londres et Édimbourg, et une armée à Liverpool ; la France commence avec des armées à Paris et Marseille, et une flotte à Brest. Bien sûr, la Russie commence avec des armées à Moscou et Varsovie, et des flottes à Sébastopol et Saint-Pétersbourg. Les régions sont de trois types : intérieures, maritimes et côtières. Les régions intérieures ne peuvent être occupées que par des armées, les zones maritimes uniquement par des flottes, et les régions côtières par l’une ou l’autre.

Le déroulement du jeu lui-même est très simple. Il n’y a absolument ni dés ni aucun autre élément de hasard ; à chaque tour, chacun doit obtenir l’aide des pays voisins via des négociations diplomatiques afin de favoriser les déplacements de ses propres forces. La diplomatie peut se faire publiquement ou en secret. Comme on parle souvent d’un déroulement asynchrone, on fixe parfois une limite de temps. Ensuite, chacun soumet les « ordres » que ses unités doivent exécuter, et le maître du jeu les rassemble puis les résout. C’est pourquoi il est aussi possible d’y jouer sous la forme dite Play By Mail, où l’on s’échange le contenu par courrier. On peut considérer que chacun remet ses ordres puis qu’ils sont révélés simultanément. Chaque ordre ne peut contenir qu’une seule instruction par unité. Par exemple, pour une France disposant de 3 unités, le formulaire d’ordres serait : "A Par–Bur, A Mar–Spa, F Bre–Pic". Cela signifie : « déplacer l’armée de Paris vers la Bourgogne / déplacer l’armée de Marseille vers l’Espagne / déplacer la flotte de Brest vers la Picardie ».

Pourquoi procéder ainsi ? Parce que la force de toutes les unités est identique, à savoir 1, mais qu’une seule unité (armée) peut se trouver dans chaque région ; donc si deux unités se déplacent vers la même région, cette action est annulée. Ce qui permet de résoudre cela, c’est le soutien (Support) d’une unité alliée située dans une région voisine. Si, grâce à ce soutien, le nombre d’unités attaquantes devient supérieur au nombre d’unités qui défendent, alors la région est conquise. Pour obtenir ce que l’on veut, il faut donc négocier avec acharnement.

« Je compte attaquer l’Ukraine cette fois, tu ne voudrais pas m’aider ? Avançons ensemble vers l’ouest. »
« Pas envie ! » / « Et moi, qu’est-ce que j’y gagne ? »

En pratique, c’est un jeu qui, du début à la fin, repose entièrement sur des interactions diplomatiques menées par la conversation, donc le fait qu’une IA y joue correctement est vraiment impressionnant.