- DeepMind a présenté Scalable Instructable Multiworld Agent (SIMA)
- Google DeepMind possède une longue histoire dans l’IA et le jeu vidéo, des jeux Atari jusqu’au système AlphaStar capable de jouer à StarCraft II au niveau de grands maîtres humains
- SIMA est un agent IA généraliste pour les environnements virtuels 3D, capable de suivre des instructions en langage naturel dans différents univers de jeux vidéo
- Cette recherche vise à passer d’une approche centrée sur des jeux individuels à un agent d’IA de gameplay généraliste et pilotable par instructions
- Le système a été entraîné en collaboration avec plusieurs développeurs sur différents jeux vidéo
- Elle montre pour la première fois qu’un agent IA peut comprendre un large éventail d’univers vidéoludiques et y exécuter des tâches à partir d’instructions en langage naturel
Apprendre à partir des jeux vidéo
- SIMA a été entraîné et testé sur 9 jeux vidéo différents, dont Hello Games No Man’s Sky et Teardown de Tuxedo Labs
- Pour l’exposer à des environnements variés, DeepMind a travaillé avec des développeurs de jeux et noué des partenariats avec 8 studios
- SIMA a appris diverses compétences, de l’exploration simple et de l’utilisation des menus jusqu’à l’extraction de ressources, le pilotage d’un vaisseau spatial et la fabrication d’un casque
- Il a également été utilisé dans 4 environnements de recherche, dont Construction Lab, un nouvel environnement construit avec Unity
SIMA : un agent IA polyvalent
- SIMA est un agent IA capable de percevoir et de comprendre différents environnements, puis d’agir pour atteindre l’objectif demandé
- Il comprend un modèle destiné à un alignement image-langage précis ainsi qu’un modèle vidéo qui prédit ce qui va se passer ensuite à l’écran
- Il n’a pas besoin d’accéder au code source des jeux ni à des API spécifiques : seules l’image à l’écran et de simples instructions en langage naturel fournies par l’utilisateur sont nécessaires
- SIMA exécute ces instructions en contrôlant le personnage principal du jeu via des sorties clavier et souris
Généralisation dans les jeux et au-delà
- Les agents entraînés sur plusieurs jeux obtiennent de meilleures performances que ceux entraînés sur un seul jeu
- Davantage de recherche est nécessaire pour atteindre des performances de niveau humain, non seulement dans les environnements d’entraînement, mais aussi dans des environnements jamais vus
- Les performances de SIMA dépendent du langage ; sans entraînement linguistique ni instruction, il agit de manière adéquate mais sans objectif
Faire progresser la recherche sur les agents IA
- Les résultats de SIMA montrent le potentiel du développement d’agents IA généralistes fondés sur le langage
- Il s’agit d’une recherche à un stade précoce, et l’on peut s’attendre à de nouveaux progrès en intégrant davantage d’environnements d’entraînement et des modèles plus performants
- L’objectif final est de construire des systèmes et agents d’IA généralistes capables de comprendre et d’exécuter en toute sécurité diverses tâches utiles pour les personnes, en ligne comme dans le monde réel
L’avis de GN⁺
- SIMA constitue une recherche importante qui montre la capacité de l’IA à comprendre des consignes et à agir comme un humain dans des environnements variés
- Ce type de recherche pourrait ouvrir la voie à un futur où l’IA irait au-delà de la simple exécution de tâches pour mener des plans stratégiques complexes et du multitâche
- Cependant, beaucoup de recherche et de progrès restent nécessaires pour que l’IA atteigne un niveau de performance humain
- Il faut discuter de la manière dont cette technologie pourrait être appliquée à la résolution de problèmes du monde réel, ainsi que des limites potentielles de la capacité de généralisation de l’IA
- Parmi les autres projets d’IA aux fonctionnalités similaires, on trouve OpenAI Gym, une plateforme d’IA permettant d’apprendre à partir de différents jeux vidéo
1 commentaires
Commentaires sur Hacker News