Beyond A* : une meilleure planification grâce aux transformeurs
- Les modèles de type transformeur ont permis d’importants progrès dans de nombreux domaines d’application, mais ils restaient en retrait par rapport aux méthodes traditionnelles de planification symbolique pour résoudre des tâches complexes de prise de décision.
- Les chercheurs présentent une méthode pour entraîner des transformeurs à résoudre des tâches de planification complexes et ont développé un modèle appelé Searchformer, capable de résoudre de manière optimale des puzzles Sokoban jamais vus auparavant en 93,7 % du temps, tout en utilisant jusqu’à 26,8 % d’étapes de recherche en moins que la recherche A* classique.
- Searchformer est un modèle transformeur encodeur-décodeur entraîné à prédire le comportement de recherche d’A*, puis affiné via expert iteration afin de générer des plans optimaux tout en effectuant moins d’étapes de recherche qu’A*.
Méthode d’entraînement et performances
- Dans la méthode d’entraînement, le comportement de recherche d’A* est représenté comme une séquence de tokens indiquant les moments où des états sont ajoutés puis retirés de l’arbre de recherche dans la planification symbolique.
- Dans une étude d’ablation sur la navigation dans des labyrinthes, Searchformer surpasse largement un modèle de référence qui prédit directement le plan optimal, avec une taille de modèle 5 à 10 fois plus petite et un jeu de données d’entraînement 10 fois plus réduit.
- Les chercheurs montrent que Searchformer est efficace, pour des tâches de prise de décision plus vastes et complexes comme Sokoban, à la fois pour augmenter la proportion de problèmes résolus et pour réduire le comportement de recherche nécessaire.
L’avis de GN⁺
- Cette recherche montre de nouvelles possibilités d’usage des modèles transformeurs en intelligence artificielle. En proposant une approche plus efficace que les méthodes symboliques existantes pour résoudre des tâches complexes de prise de décision, elle constitue une avancée importante qui élargit le champ d’application de l’IA.
- Le modèle Searchformer démontre des capacités de résolution plus rapides et plus efficaces en utilisant moins de ressources. Cela peut représenter un avantage majeur, en particulier pour déployer de l’IA dans des environnements aux ressources limitées.
- Cette étude suggère que les progrès de l’IA ne dépendent pas uniquement de davantage de données et de modèles toujours plus grands, mais peuvent aussi venir de méthodologies plus intelligentes et d’améliorations algorithmiques. C’est une approche très intéressante et utile du point de vue de la durabilité et de l’efficacité de la recherche en IA.
1 commentaires
Avis Hacker News