- GPT-5.4 Pro a résolu un problème de type Ramsey lié aux hypergraphes en collaboration avec Kevin Barreto et Liam Price
- L’auteur du problème, Will Brian, a vérifié l’exactitude de la solution, et l’intégralité des échanges ainsi que le document explicatif final de l’IA ont été rendus publics
- La solution élimine l’inefficacité des constructions de borne inférieure existantes et présente une structure symétrique de la borne supérieure, atteignant ainsi une cohérence rare en théorie de Ramsey
- Par la suite, plusieurs modèles ont résolu le même problème dans le cadre FrontierMath: Open Problems, ce qui a confirmé sa validité comme outil d’évaluation des capacités de raisonnement mathématique de l’IA
- Ce résultat est considéré comme un exemple montrant que l’IA peut contribuer de manière concrète à la résolution de problèmes mathématiques ouverts
Résolution d’un problème de type Ramsey sur les hypergraphes
- GPT-5.4 Pro a résolu un problème de type Ramsey difficile lié aux hypergraphes en collaboration avec Kevin Barreto et Liam Price
- L’auteur du problème, Will Brian, a vérifié l’exactitude de la solution
- L’intégralité des échanges pendant la résolution ainsi que le document explicatif final de GPT-5.4 Pro ont été publiés
- Brian estime que cette solution supprime l’inefficacité des constructions de borne inférieure existantes et met en évidence la complexité et la structure symétrique de la construction de borne supérieure
- Le fait que borne inférieure et borne supérieure coïncident de manière cohérente permet d’atteindre un niveau de cohérence rare pour un problème de théorie de Ramsey
- Il prévoit de mettre ce résultat en forme dans un article, avec possiblement des travaux supplémentaires dérivés des idées de l’IA
- Par la suite, Epoch AI a finalisé le framework de test FrontierMath: Open Problems et a appliqué le même problème à plusieurs modèles
- Les modèles Opus 4.6 (max), Gemini 3.1 Pro et GPT-5.4 (xhigh) ont eux aussi réussi à résoudre le problème
- Cela montre que l’environnement FrontierMath est pertinent pour évaluer les capacités de raisonnement mathématique des modèles d’IA
Définition du problème
- Le problème porte sur l’amélioration de la borne inférieure d’une suite (H(n)), apparue dans l’étude de la convergence simultanée d’ensembles de séries infinies
- Dire qu’un hypergraphe ((V, \mathcal H)) contient une partition de taille (n) signifie qu’il existe
(D \subseteq V), (\mathcal P \subseteq \mathcal H) tels que (|D| = n), et
que chaque élément de (D) appartient à exactement un élément de (\mathcal P)
- (H(n)) est défini comme le nombre maximal de sommets (k) d’un hypergraphe sans sommet isolé et ne contenant aucune partition de taille strictement supérieure à (n)
- La borne inférieure connue de (H(n)) est probablement sous-optimale, et l’on pense qu’elle peut être améliorée grâce à une nouvelle construction d’hypergraphe
- L’objectif est de trouver un algorithme satisfaisant (H(n) \ge c \cdot k_n) (avec (c > 1))
- (k_n) est défini par la récurrence (k_1 = 1), (k_n = \lfloor n/2 \rfloor + k_{\lfloor n/2 \rfloor} + k_{\lfloor (n+1)/2 \rfloor})
Étapes de construction du problème
-
Étape Warm-up
- Construire un hypergraphe pour des valeurs de (n) pour lesquelles une solution est déjà connue
- Conditions : (|V| ≥ 64), (|H| ≤ 20), aucune partition de taille supérieure à 20
-
Étape Single Challenge
- Trouver un hypergraphe, sous les mêmes contraintes, pour des valeurs de (n) pour lesquelles aucune solution connue n’existe
- Conditions : (|V| ≥ 66), (|H| ≤ 20), aucune partition de taille supérieure à 20
-
Étape Full Problem
- Demande un algorithme général fonctionnant pour toutes les valeurs de (n)
- Pour une entrée (n), il doit générer un hypergraphe satisfaisant (H(n) ≥ c \cdot k_n)
- Pour (n ≤ 100), l’exécution doit être possible en moins de 10 minutes sur un ordinateur portable standard
Évaluation par les mathématiciens
- Les mathématiciens familiers de ce problème sont de l’ordre d’une dizaine, dont beaucoup de chercheurs du domaine
- Le nombre de mathématiciens ayant réellement tenté de le résoudre est estimé à 5 à 10
- Le temps estimé pour qu’un expert le résolve est de 1 à 3 mois
- Une résolution est jugée d’un niveau publiable dans une revue scientifique spécialisée
- En raison de la richesse du problème, sa résolution a de fortes chances d’ouvrir de nouvelles pistes de recherche mathématique
- Dans les conditions énoncées, la probabilité que le problème soit résoluble est estimée entre 95 et 99 %
Aucun commentaire pour le moment.