Les limites de Leela Chess Zero
- Leela Chess Zero est devenue championne du monde après des milliards d’itérations d’apprentissage par auto-jeu
- Mais elle a subi une défaite écrasante face à Stockfish
- Même en entraînant un réseau plus grand, elle n’a pas réussi à battre Stockfish
- Stockfish utilisait un modèle bien plus petit que Leela, mais l’a emporté grâce à de meilleures capacités de recherche
Réflexions supplémentaires sur la victoire de Stockfish
- Leela a perdu son titre de championne du monde parce qu’elle ne savait pas bien rechercher
- L’ajout de capacités de recherche aux LLM se rapproche, mais passe inaperçu
- Les modèles de fondation comme GPT-4 n’ont pas de capacité de recherche
- L’hypothèse dominante est qu’il faut des modèles plus grands pour permettre la recherche, mais il existe des contre-exemples
- Selon des recherches de DeepMind, un comportement de recherche émerge naturellement dans les algorithmes d’échecs
- Puisqu’il existe des algorithmes de recherche efficaces, il n’est pas nécessaire d’attendre qu’une recherche préalable inefficace émerge par hasard dans de grands modèles
- Les modèles actuels sont suffisamment grands pour rendre la recherche possible, et ils pourraient même être inutilement grands
La recherche permet d’allouer des ressources de calcul à un domaine cible
- Supposons qu’une entreprise pharmaceutique cherche à développer de nouveaux médicaments à l’aide de l’IA
- Dans un monde où la recherche en IA est possible, deux options existent
- attendre 2030 en espérant qu’OpenAI publie un modèle 10 000 fois plus grand
- utiliser dès aujourd’hui 10 000 fois plus de ressources de calcul d’inférence
- L’entreprise pharmaceutique préférera la deuxième option
- Grâce à la recherche, il devient possible d’exploiter dès maintenant des capacités de niveau ASI prévues pour 2030
Scénario de progrès de l’IA fondé sur la recherche
- On découvre que la recherche fonctionne sur les modèles existants
- Les gouvernements ou les grands laboratoires réalisent qu’ils peuvent immédiatement appliquer la recherche à la recherche en IA ou à la collecte d’informations à l’étranger
- Comme les ressources de calcul d’inférence sont limitées, les gouvernements ou grands laboratoires les réservent à la sécurité ou à la recherche en IA
- Un progrès de l’IA guidé par la recherche conduit à la découverte d’algorithmes de recherche et d’architectures de modèles plus efficaces
- La recherche n’exige pas davantage de données d’entraînement, ce qui résout le problème du « mur des données »
- L’explosion de l’intelligence commence dès l’année prochaine, et non en 2030
Possibilité d’appliquer la recherche à la recherche de l’IA elle-même
- Si l’IA progresse assez pour pouvoir se rechercher elle-même, on peut s’attendre à une dynamique de progrès brutale
- De la même manière qu’une entreprise pharmaceutique peut rechercher de nouveaux médicaments sans attendre GPT-8, les laboratoires d’IA pourront faire de la recherche en IA sans attendre des modèles plus grands
- Il faudra peut-être lever davantage de restrictions pour remplacer les chercheurs humains en IA
- Mais même un simple chatbot doté d’une intelligence de niveau GPT-8 devrait suffire à accélérer le progrès de l’IA
1 commentaires
Avis Hacker News
Résumé des commentaires Hacker News