Sans algorithme d’échecs de niveau grand maître
- Ce dépôt propose une implémentation de l’article « Sans algorithme d’échecs de niveau grand maître »
- Les succès récents du machine learning s’expliquent principalement par de grandes architectures fondées sur l’attention et des jeux de données d’une ampleur sans précédent
- Cet article étudie l’impact de l’apprentissage à grande échelle pour les échecs
- Contrairement aux moteurs d’échecs traditionnels, il ne s’appuie ni sur des heuristiques complexes ni sur une recherche explicite
- Un modèle Transformer de 270 millions de paramètres est entraîné de manière supervisée sur un jeu de données de 10 millions de parties d’échecs
- Les valeurs d’action du moteur Stockfish 16 sont utilisées pour annoter chaque position, ce qui génère environ 15 milliards de points de données
- Le plus grand modèle atteint un Elo blitz Lichess de 2895 contre des humains et résout des puzzles d’échecs difficiles sans algorithme de recherche explicite
- Il surpasse les réseaux de politique et de valeur d’AlphaZero (sans recherche) ainsi que GPT-3.5-turbo-instruct
- Une étude systématique de la taille du modèle et du jeu de données montre que de fortes performances aux échecs n’apparaissent qu’à une échelle suffisante
- De vastes expérimentations sur les choix de conception et les hyperparamètres ont été menées afin de valider les résultats
Le récapitulatif de GN⁺
- Ce projet constitue une recherche importante montrant qu’il est possible d’atteindre de hautes performances aux échecs sans algorithme de recherche traditionnel
- Il explore de nouvelles possibilités pour les moteurs d’échecs en s’appuyant sur de grands jeux de données et des modèles Transformer
- Comparé à des moteurs d’échecs déjà très puissants comme AlphaZero, il montre de meilleures performances
- Il fournit des informations intéressantes et utiles pour les personnes qui s’intéressent aux échecs, tout en suggérant de nouvelles possibilités d’application du machine learning
- Parmi les projets aux fonctionnalités similaires figurent AlphaZero et Leela Chess Zero
1 commentaires
Avis sur Hacker News
Il est difficile de trouver un adversaire d’échecs correspondant exactement au niveau souhaité par l’utilisateur. La plupart des moteurs réduisent la profondeur de recherche pour abaisser la difficulté, mais cela ne fonctionne pas très bien.
Un utilisateur a fait une présentation sur la distillation de connaissances appliquée aux échecs, expliquant comment distiller une fonction de recherche non linéaire complexe en un modèle de transformer quasi linéaire pour des entrées standard comme celles des échecs.
Pour les personnes intéressées par les réseaux neuronaux pour les échecs, il recommande un dépôt GitHub proposant un code simple en PyTorch et une architecture similaire aux réseaux neuronaux d’échecs les plus performants actuellement.
Il existe un billet de blog comparant le réseau LC0 et le réseau de transformers de DeepMind.
L’article « Grandmaster-Level Chess Without Search » souligne l’importance d’une architecture à grande échelle fondée sur l’attention et des jeux de données, et entraîne un modèle de transformer de 270M de paramètres pour apprendre les échecs.
Le grand jeu de données synthétique a été généré à l’aide d’une recherche traditionnelle, ce qui revient à encoder l’arbre de recherche dans le modèle de transformer.
Matthew Sadler a configuré Leela Zero pour qu’il joue de manière intuitive, ce qui lui permet d’effectuer efficacement des parties d’entraînement sans recherche.
Résoudre les échecs génère un arbre beaucoup trop grand, et il existe deux approches pour l’optimiser.
Les états du plateau sont encodés en convertissant les chaînes FEN en chaînes de longueur fixe, et les actions sont enregistrées en notation UCI.