L’IA de DeepMind résout des problèmes de l’Olympiade internationale de mathématiques à un niveau médaille d’argent
(deepmind.google)- AlphaProof et AlphaGeometry 2 de Google DeepMind ont résolu des problèmes de l’Olympiade internationale de mathématiques
- AlphaProof : système de raisonnement mathématique fondé sur l’apprentissage par renforcement
- AlphaGeometry 2 : système amélioré de résolution de problèmes de géométrie
- Les deux systèmes ont résolu 4 problèmes sur 6 à l’Olympiade internationale de mathématiques (IMO) de cette année, atteignant un niveau équivalent à une médaille d’argent
Les avancées de l’IA dans la résolution de problèmes mathématiques complexes
-
Présentation de l’IMO
- Le plus ancien et le plus prestigieux concours annuel de mathématiques pour les jeunes, organisé depuis 1959
- Les problèmes du concours portent sur l’algèbre, la combinatoire, la géométrie, la théorie des nombres, etc.
- De nombreux lauréats de la médaille Fields sont issus de l’IMO
-
Le défi IMO pour les systèmes d’IA
- AlphaProof et AlphaGeometry 2 ont résolu les problèmes de l’IMO de cette année
- Les problèmes ont été notés selon les règles officielles du concours
- AlphaProof a résolu 2 problèmes d’algèbre et 1 problème de théorie des nombres
- AlphaGeometry 2 a résolu 1 problème de géométrie
- Les 2 problèmes de combinatoire n’ont pas été résolus
- Le score total a été de 28 points sur 42, soit un niveau équivalent à une médaille d’argent
AlphaProof : une approche de raisonnement formel
-
Fonctionnement d’AlphaProof
- Prouve des énoncés mathématiques dans le langage formel Lean
- Combine un modèle de langage préentraîné et l’algorithme d’apprentissage par renforcement AlphaZero
- Traduit les problèmes en langage naturel en énoncés formels pour résoudre des problèmes de niveaux de difficulté variés
- Lorsqu’un problème lui est présenté, AlphaProof génère des candidats de solution puis les prouve ou les réfute
- Les résultats prouvés renforcent le modèle de langage d’AlphaProof, améliorant sa capacité à résoudre des problèmes plus difficiles
-
Processus d’entraînement
- Entraîné en prouvant ou réfutant des millions de problèmes
- Pendant la compétition aussi, une boucle d’entraînement a été appliquée pour prouver des variantes des problèmes
AlphaGeometry 2, encore plus compétitif
-
Les améliorations d’AlphaGeometry 2
- Modèle de langage basé sur Gemini et système hybride neuro-symbolique
- Entraîné avec 10 fois plus de données synthétiques que la version précédente
- Amélioration de la vitesse et de la précision dans la résolution de problèmes de géométrie
- Utilise un mécanisme de partage des connaissances lors de la résolution de nouveaux problèmes
-
Résultats à l’IMO 2024
- A résolu 83 % des problèmes de géométrie de l’IMO des 25 dernières années
- A résolu le problème 4 en 19 secondes lors de la compétition de cette année
Une nouvelle frontière pour le raisonnement mathématique
-
Expérimentation d’un système de raisonnement en langage naturel
- Expérimentation d’un système de raisonnement en langage naturel basé sur Gemini
- Capable de résoudre des problèmes sans les traduire en langage formel
- Exploration des possibilités de combinaison avec d’autres systèmes d’IA
-
Perspectives d’avenir
- Les mathématiciens pourraient collaborer avec des outils d’IA pour explorer de nouvelles hypothèses, tester de nouvelles approches de résolution et raccourcir le processus de démonstration
- Des systèmes d’IA comme Gemini améliorent les capacités en mathématiques et en raisonnement général
Le résumé de GN⁺
- AlphaProof et AlphaGeometry 2 montrent le potentiel de l’IA en raisonnement mathématique
- Leur performance de niveau médaille d’argent à l’Olympiade internationale de mathématiques démontre les capacités de l’IA à résoudre des problèmes mathématiques
- Ils ouvrent la voie à une collaboration entre mathématiciens et IA pour explorer de nouvelles approches de résolution de problèmes
- Parmi les projets aux fonctionnalités similaires figurent des modèles de traitement du langage naturel comme GPT-3 d’OpenAI
3 commentaires
Plus il y aura de mathématiciens contribuant au développement de bibliothèques de mathématiques formelles, plus il sera facile de créer une IA mathématique performante. À ma connaissance, il y a actuellement trois Coréens qui transfèrent vers Mathlib, la bibliothèque mathématique de Lean, des théories mathématiques qu’ils ont eux-mêmes formalisées dans le langage de l’assistant de preuve Lean.
L’an dernier, j’ai participé un peu au travail de portage de Mathlib de Lean 3 vers Lean 4, et cette année, j’ai démontré un théorème non résolu de la bibliothèque Batteries de Lean 4.
Avis Hacker News
Premier avis
Deuxième avis
Troisième avis
Quatrième avis
Cinquième avis
Sixième avis
Septième avis
Huitième avis
Neuvième avis
Dixième avis
Ces meilleures discussions peuvent être consultées ici : https://leanprover.zulipchat.com/#narrow/stream/219941-Machine-Learnin…