DeepMind publie en open source le cœur d’AlphaGo et d’AlphaZero

xguru · 2023-02-17T14:33:34+09:00

Présent dans un dépôt nommé Mctx (MCTS-in-JAX) Une bibliothèque extrêmement rapide qui implémente l’algorithme Monte Carlo Tree Search (MCTS) de façon native en JAX Un algorithme de recherche qui choisit le meilleur coup dans les jeux au tour par tour selon le processus « sélection → expansion → simulation → mise à jour des nœuds de l’arbre de politique » Il s’agit du composant le plus complexe d’AlphaGo, et le rendre efficace est vraiment crucial Utilisé non seulement dans AlphaGo, mais aussi dans AlphaZero (Go, Chess, Shogi) et MuZero (AlphaZero + jeux Atari)

Présent dans un dépôt nommé Mctx (MCTS-in-JAX)
Une bibliothèque extrêmement rapide qui implémente l’algorithme Monte Carlo Tree Search (MCTS) de façon native en JAX
- Un algorithme de recherche qui choisit le meilleur coup dans les jeux au tour par tour selon le processus « sélection → expansion → simulation → mise à jour des nœuds de l’arbre de politique »
Il s’agit du composant le plus complexe d’AlphaGo, et le rendre efficace est vraiment crucial
Utilisé non seulement dans AlphaGo, mais aussi dans AlphaZero (Go, Chess, Shogi) et MuZero (AlphaZero + jeux Atari)

1 commentaires

xguru 2023-02-17

J’ai vu ce tweet lui-même sur HN : https://news.ycombinator.com/item?id=34801636
En réalité, ce repo a été rendu public il y a environ un an, et il y a aussi des commentaires qui le critiquent en disant que ce n’est pas l’intégralité d’AlphaGo et que le titre est donc trompeur.
Il paraît aussi que l’implémentation originale d’AlphaGo repose sur TensorFlow/TPU, et qu’il ne s’agit ici que d’une réimplémentation en JAX.

DeepMind publie en open source le cœur d’AlphaGo et d’AlphaZero

À lire aussi

1 commentaires