2 points par GN⁺ 2026-03-25 | Aucun commentaire pour le moment. | Partager sur WhatsApp
  • GPT-5.4 Pro a résolu un problème de type Ramsey lié aux hypergraphes en collaboration avec Kevin Barreto et Liam Price
  • L’auteur du problème, Will Brian, a vérifié l’exactitude de la solution, et l’intégralité des échanges ainsi que le document explicatif final de l’IA ont été rendus publics
  • La solution élimine l’inefficacité des constructions de borne inférieure existantes et présente une structure symétrique de la borne supérieure, atteignant ainsi une cohérence rare en théorie de Ramsey
  • Par la suite, plusieurs modèles ont résolu le même problème dans le cadre FrontierMath: Open Problems, ce qui a confirmé sa validité comme outil d’évaluation des capacités de raisonnement mathématique de l’IA
  • Ce résultat est considéré comme un exemple montrant que l’IA peut contribuer de manière concrète à la résolution de problèmes mathématiques ouverts

Résolution d’un problème de type Ramsey sur les hypergraphes

  • GPT-5.4 Pro a résolu un problème de type Ramsey difficile lié aux hypergraphes en collaboration avec Kevin Barreto et Liam Price
    • L’auteur du problème, Will Brian, a vérifié l’exactitude de la solution
    • L’intégralité des échanges pendant la résolution ainsi que le document explicatif final de GPT-5.4 Pro ont été publiés
  • Brian estime que cette solution supprime l’inefficacité des constructions de borne inférieure existantes et met en évidence la complexité et la structure symétrique de la construction de borne supérieure
    • Le fait que borne inférieure et borne supérieure coïncident de manière cohérente permet d’atteindre un niveau de cohérence rare pour un problème de théorie de Ramsey
    • Il prévoit de mettre ce résultat en forme dans un article, avec possiblement des travaux supplémentaires dérivés des idées de l’IA
  • Par la suite, Epoch AI a finalisé le framework de test FrontierMath: Open Problems et a appliqué le même problème à plusieurs modèles
    • Les modèles Opus 4.6 (max), Gemini 3.1 Pro et GPT-5.4 (xhigh) ont eux aussi réussi à résoudre le problème
    • Cela montre que l’environnement FrontierMath est pertinent pour évaluer les capacités de raisonnement mathématique des modèles d’IA

Définition du problème

  • Le problème porte sur l’amélioration de la borne inférieure d’une suite (H(n)), apparue dans l’étude de la convergence simultanée d’ensembles de séries infinies
    • Dire qu’un hypergraphe ((V, \mathcal H)) contient une partition de taille (n) signifie qu’il existe (D \subseteq V), (\mathcal P \subseteq \mathcal H) tels que (|D| = n), et que chaque élément de (D) appartient à exactement un élément de (\mathcal P)
    • (H(n)) est défini comme le nombre maximal de sommets (k) d’un hypergraphe sans sommet isolé et ne contenant aucune partition de taille strictement supérieure à (n)
  • La borne inférieure connue de (H(n)) est probablement sous-optimale, et l’on pense qu’elle peut être améliorée grâce à une nouvelle construction d’hypergraphe
    • L’objectif est de trouver un algorithme satisfaisant (H(n) \ge c \cdot k_n) (avec (c > 1))
    • (k_n) est défini par la récurrence (k_1 = 1), (k_n = \lfloor n/2 \rfloor + k_{\lfloor n/2 \rfloor} + k_{\lfloor (n+1)/2 \rfloor})

Étapes de construction du problème

  • Étape Warm-up

    • Construire un hypergraphe pour des valeurs de (n) pour lesquelles une solution est déjà connue
    • Conditions : (|V| ≥ 64), (|H| ≤ 20), aucune partition de taille supérieure à 20
  • Étape Single Challenge

    • Trouver un hypergraphe, sous les mêmes contraintes, pour des valeurs de (n) pour lesquelles aucune solution connue n’existe
    • Conditions : (|V| ≥ 66), (|H| ≤ 20), aucune partition de taille supérieure à 20
  • Étape Full Problem

    • Demande un algorithme général fonctionnant pour toutes les valeurs de (n)
    • Pour une entrée (n), il doit générer un hypergraphe satisfaisant (H(n) ≥ c \cdot k_n)
    • Pour (n ≤ 100), l’exécution doit être possible en moins de 10 minutes sur un ordinateur portable standard

Évaluation par les mathématiciens

  • Les mathématiciens familiers de ce problème sont de l’ordre d’une dizaine, dont beaucoup de chercheurs du domaine
  • Le nombre de mathématiciens ayant réellement tenté de le résoudre est estimé à 5 à 10
  • Le temps estimé pour qu’un expert le résolve est de 1 à 3 mois
  • Une résolution est jugée d’un niveau publiable dans une revue scientifique spécialisée
  • En raison de la richesse du problème, sa résolution a de fortes chances d’ouvrir de nouvelles pistes de recherche mathématique
  • Dans les conditions énoncées, la probabilité que le problème soit résoluble est estimée entre 95 et 99 %

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.