Un modèle d’OpenAI a réfuté une conjecture centrale en géométrie discrète

(openai.com)

1 points par GN⁺ 2 시간 전 | 1 commentaires | Partager sur WhatsApp

Le problème des distances unitaires est un problème posé par Erdős en 1946, qui demande le nombre maximal de paires de points séparées par une distance égale à 1 parmi n points du plan, et une conjecture centrale de longue date a été réfutée
Le modèle de raisonnement généraliste d’OpenAI a brisé l’idée selon laquelle la famille des réseaux carrés était essentiellement optimale, en produisant une famille infinie d’exemples et une amélioration de niveau polynomial
La nouvelle construction produit plus de n^{1+δ} paires de points à distance unitaire pour une infinité de valeurs de n, et une amélioration due à Will Sawin montre que δ = 0.014 est possible
La preuve applique à un problème géométrique des outils de théorie algébrique des nombres, au-delà des entiers de Gauss, notamment une tour de corps de classes infinie et la théorie de Golod–Shafarevich
Le résultat montre que l’IA peut contribuer à des découvertes mathématiques originales sur des problèmes ouverts anciens, tandis que l’expertise humaine devient encore plus importante pour le choix des problèmes et leur interprétation

Une percée sur le problème des distances unitaires

Le problème des distances unitaires est un problème de géométrie combinatoire qui demande combien de paires de points exactement à distance 1 on peut obtenir au maximum parmi n points placés dans le plan
Il a été posé par Paul Erdős en 1946, et le livre de 2005 de Brass, Moser et Pach, Research Problems in Discrete Geometry, le décrit comme « probablement le problème le plus connu et le plus facile à expliquer en géométrie combinatoire »
Le combinatoricien de Princeton Noga Alon l’a présenté comme l’un des problèmes qu’Erdős préférait particulièrement, et Erdős avait assorti sa résolution d’une récompense
Pendant longtemps, on a cru que la famille de constructions sur le réseau carré produisait essentiellement le nombre maximal de paires de points à distance unitaire
Un modèle interne d’OpenAI a construit une famille infinie d’exemples qui réfute cette ancienne conjecture et fournit une amélioration de niveau polynomial
La preuve a été examinée par un groupe externe de mathématiciens, qui ont également rédigé un article d’accompagnement traitant de l’argument, du contexte et de la portée du résultat
Le texte original de la preuve est disponible dans unit-distance-proof.pdf, l’article d’accompagnement dans unit-distance-remarks.pdf, et une version abrégée de la chaîne de raisonnement du modèle dans unit-distance-cot.pdf

La méthode trouvée par l’IA

La preuve ne provient ni d’un système entraîné spécialement pour les mathématiques, ni d’un scaffolding dédié à la recherche de stratégies de démonstration, ni d’un système conçu spécifiquement pour le problème des distances unitaires, mais d’un modèle de raisonnement généraliste
L’évaluation s’inscrivait dans un effort plus large visant à déterminer si des modèles avancés pouvaient contribuer à la recherche de pointe, en s’appuyant sur un ensemble de problèmes d’Erdős, et dans ce cas une preuve résolvant un problème ouvert a été générée
Les mathématiques constituent un domaine particulièrement clair pour tester les capacités de raisonnement, car les problèmes y sont précis, les preuves candidates peuvent être vérifiées, et les longues démonstrations doivent rester cohérentes du début à la fin
La preuve applique à un problème géométrique d’apparence élémentaire des idées de théorie algébrique des nombres à la fois inattendues et sophistiquées
Dans l’article d’accompagnement, Tim Gowers qualifie ce résultat de « jalon pour les mathématiques de l’IA »
Le théoricien des nombres Arul Shankar estime qu’il montre que les modèles d’IA actuels peuvent aller au-delà d’un rôle d’assistant pour les mathématiciens humains, en produisant des idées originales et sophistiquées et en les menant à terme

Le contenu mathématique du problème des distances unitaires

u(n) est défini comme le nombre maximal de paires de points à distance unitaire possibles parmi n points du plan
Une construction simple consiste à placer n points sur une droite pour obtenir n−1 paires, tandis que le réseau carré produit environ 2n paires
La meilleure construction connue jusqu’ici venait d’un réseau carré remis à l’échelle, et produisait n^{1 + C / log log(n)} paires de points à distance unitaire pour une certaine constante C
Comme log log(n) croît lorsque n augmente, le terme supplémentaire dans l’exposant tend vers 0, de sorte que la croissance de cette construction restait à peine supérieure à la linéarité
Pendant des décennies, on a largement considéré que ce taux était essentiellement optimal, et Erdős conjecturait techniquement une borne supérieure de la forme n^{1+o(1)}
Le nouveau résultat réfute cette conjecture en construisant, pour une infinité de valeurs de n, une configuration de n points possédant au moins n^{1+δ} paires de points à distance unitaire, pour un exposant fixe δ > 0
La preuve initiale fournie par l’IA ne donnait pas de valeur explicite pour δ, mais une amélioration ultérieure du professeur de mathématiques de Princeton Will Sawin a montré qu’on peut prendre δ = 0.014

Pourquoi le résultat est surprenant

Depuis la construction originale d’Erdős en 1946, la meilleure borne inférieure connue était restée essentiellement inchangée
La meilleure borne supérieure connue, O(n^{4/3}), provenait du travail de Spencer, Szemerédi et Trotter en 1984, et elle est restée essentiellement stable malgré des améliorations et l’étude de structures connexes par Székely, Katz et Silier, Pach, Raz, Solymosi et d’autres
Matoušek ainsi qu’Alon-Bucić-Sauermann ont étudié ce problème pour des distances non euclidiennes dans le plan, et ont obtenu des résultats montrant que « la plupart » de ces distances non euclidiennes vérifient, dans un certain sens, la conjecture d’Erdős, ce qui la renforçait encore
Il est particulièrement surprenant que l’ingrédient central de cette nouvelle construction provienne de la théorie algébrique des nombres, un domaine qui semble éloigné de la géométrie et des distances
La théorie algébrique des nombres est le domaine qui traite de notions comme la factorisation dans les extensions des entiers appelées corps de nombres algébriques

De nouvelles techniques venues de la théorie algébrique des nombres

La nouvelle preuve part d’idées géométriques familières, puis s’étend dans une direction inattendue
La borne inférieure originale d’Erdős peut être comprise à travers les entiers de Gauss de la forme a + bi
Ici, a et b sont des entiers et i est une racine carrée de −1
Les entiers de Gauss étendent les entiers ordinaires et possèdent, comme eux, des propriétés telles que la factorisation unique en nombres premiers
Ce type d’extension des entiers ou des rationnels est appelé corps de nombres algébrique
Le nouvel argument remplace les entiers de Gauss par une généralisation plus complexe issue de la théorie algébrique des nombres, où des symétries plus riches permettent de produire davantage de différences de longueur unitaire
L’argument précis utilise des outils comme une tour de corps de classes infinie et la théorie de Golod–Shafarevich pour montrer que les corps de nombres requis existent réellement
Ces idées étaient bien connues des spécialistes de théorie algébrique des nombres, mais le fait qu’elles puissent avoir un impact sur un problème géométrique dans le plan euclidien a été accueilli comme une grande surprise

Ce que cela signifie pour les mathématiques

Le fait qu’un système d’IA ait résolu de manière autonome un ancien problème ouvert situé au cœur d’un domaine actif constitue un moment important dans l’interaction entre l’IA et les mathématiques
Le travail d’accompagnement des mathématiciens externes offre une image plus riche que celle qui ressort de la seule solution initiale
Dans l’article d’accompagnement, Thomas Bloom écrit que pour évaluer l’importance d’une preuve générée par l’IA, il faut se demander si cette preuve nous a appris quelque chose de nouveau sur le problème et si elle nous a permis de mieux comprendre la géométrie discrète
Bloom estime que ce résultat montre que les constructions issues de la théorie des nombres peuvent en dire bien davantage qu’on ne l’attendait sur ce type de questions, et que la théorie des nombres nécessaire peut être très profonde
Bloom pense que, dans les mois à venir, de nombreux spécialistes de théorie algébrique des nombres examineront de près d’autres problèmes ouverts de géométrie discrète
Le lien inattendu entre théorie algébrique des nombres et géométrie discrète ne se contente pas de résoudre une conjecture particulière, il devient aussi un pont permettant d’explorer davantage de problèmes connexes
Ce résultat montre que l’IA peut contribuer non seulement à des réponses, mais aussi à des découvertes mathématiques dont le sens devient plus clair et plus riche grâce à la compréhension humaine qui suit

Pourquoi c’est important

Un meilleur raisonnement mathématique peut faire de l’IA un partenaire de recherche plus puissant
Elle peut maintenir de manière cohérente de longues chaînes de pensée difficiles, relier des idées entre domaines de connaissance éloignés, et révéler des pistes prometteuses que les experts n’auraient peut-être pas placées en priorité
Elle peut aider les chercheurs à progresser sur des problèmes trop complexes ou trop chronophages pour être abordés facilement
Ces capacités sont utiles au-delà des mathématiques, notamment en biologie, en physique, en science des matériaux, en ingénierie et en médecine
Si elle peut maintenir des raisonnements complexes de manière cohérente, relier des domaines de connaissance éloignés et produire des résultats qui passent l’examen d’experts, cela fait partie de la trajectoire de long terme vers des systèmes de recherche davantage automatisés
Il est avancé que l’IA va commencer à jouer un rôle très sérieux dans la partie créative de la recherche, en particulier dans la recherche sur l’IA elle-même
De tels progrès renforcent l’urgence de comprendre le problème de l’alignement de systèmes très intelligents, les prochaines étapes du développement de l’IA et l’avenir de la collaboration entre humains et IA
Cet avenir dépend toujours du jugement humain
L’expertise ne perd pas en importance, elle devient au contraire plus précieuse
L’IA peut aider à explorer, proposer et vérifier, mais ce sont les humains qui choisissent les problèmes importants, interprètent les résultats et décident quelles questions poursuivre ensuite

1 commentaires

GN⁺ 2 시간 전

Réactions sur Hacker News

Ce fil HN m’a rendu morose, et je me demande encore pourquoi
Si on retire les éloges façon communiqué de presse d’OpenAI, il reste beaucoup de questions intéressantes et nuancées sur le rôle des LLM dans la recherche mathématique
Je recommande vraiment de lire les commentaires des mathématiciens publiés avec le résultat, en particulier ceux de Tim Gowers
Mais les commentaires sont devenus un champ de bataille fait de débats sur les LLM, de réfutations et de contre-réfutations furieuses qui tournent en boucle depuis 2023
C’est triste de voir le même combat se rejouer autour de lignes de front tracées il y a 3 ans, et je me demande si ce sera encore le cas dans 2 ans
- Dans 2 ans, ici comme sur tous les forums Internet, ce sera toujours comme ça
  On vit mieux en gardant à l’esprit cette phrase célèbre de Nietzsche : « Je ne veux pas faire la guerre à la laideur. Je ne veux pas accuser, je ne veux même pas accuser les accusateurs. Détourner le regard, voilà ce qui doit être ma seule négation »
- Les gens s’inquiètent pour leur gagne-pain, donc c’est une réaction naturelle
- Je comprends. Il est courant d’évaluer l’intelligence humaine et l’IA comme une concurrence à somme nulle, parce que les employeurs le comprennent souvent ainsi et que les fournisseurs de modèles de langage les commercialisent de cette façon
  Plus l’IA démontre ses capacités, plus cela penche dans une direction inconfortable pour tous ceux qui n’ont pas une sécurité de l’emploi très solide
  Il faudra du temps avant que les gens reconnaissent que l’IA possède un ensemble de capacités très différent de l’intelligence humaine, et qu’elle la complète assez bien
  Il est peu probable qu’elle dépasse massivement l’intelligence humaine à grande échelle, et les entreprises qui misent là-dessus finiront à la traîne
- Dès qu’un camp commence à lancer des pierres, le contenu du texte cesse d’importer, et tout se transforme en combat pour savoir si le billet est bon ou si c’est une ordure
  J’aimerais avoir une vraie discussion sur ce sujet, mais comme tout le monde croit que seule sa propre réalité est vraie et que la réalité opposée est fausse, ça ne fait que s’envenimer
  Il m’arrive de faire de longues pauses après avoir réalisé que je viens sur HN seulement pour me mettre en colère
  Je ne sais pas pourquoi on s’inflige ça, alors qu’au fond je pense qu’on veut souvent la même chose
- Dans 2 ans, ce ne sera plus comme ça. D’ici là, mon camp aura gagné
À ceux qui disent que « les LLM ne font qu’interpoler les données d’entraînement » : Ayer et le premier Wittgenstein, chacun à sa manière, estimaient que les vérités mathématiques ne rapportent pas de nouveaux faits sur le monde
L’idée qu’une démonstration ne fait que déployer ce qui est déjà implicitement contenu dans les axiomes, les définitions, les symboles et les règles est profondément intéressante, sans que cela empêche d’attribuer le mérite de la découverte aux mathématiciens
Donc soit la recombinaison de matériaux existants n’est pas disqualifiante, soit une bonne partie des médailles Fields devrait être rendue
- La plupart des adultes fonctionnels comprennent, je pense, que la médaille Fields et presque tous les « prix » annuels récompensent à la fois l’innovation recombinatoire et l’innovation de type « changement de dimension »
  Les humains non plus ne produisent pas chaque année, dans tous les domaines, des innovations qui changent de dimension
  On peut dire que les LLM « ne font que » recombiner, mais je doute toujours qu’un LLM nourri de toute la littérature d’algèbre, de géométrie et de trigonométrie d’avant Newton/Leibniz puisse inventer le calcul infinitésimal
  Cela dit, ce type d’innovation est précisément un domaine où les LLM excellent, et cela ne veut pas dire que les humains n’ont plus besoin d’être bons dans l’innovation recombinatoire
  Il semble qu’en matière de synthèse d’idées nouvelles, il y ait encore beaucoup de choses que les humains peuvent faire et que les LLM ne savent pas faire
- On peut imaginer chaque fragment du savoir humain comme un point discret dans un vaste espace du savoir de grande dimension
  Si l’on trace la grande enveloppe convexe autour de tous ces points, les LLM, ayant appris à l’intérieur, peuvent interpoler entre les points existants et atteindre de nouveaux points qui restent à l’intérieur de cette enveloppe
  La question de savoir si les LLM peuvent atteindre des points situés hors de l’enveloppe reste débattue
  Mais atteindre de nouveaux points à l’intérieur de l’enveloppe est déjà extrêmement utile
  Beaucoup de nouvelles découvertes et démonstrations, peut-être même la plupart des découvertes et démonstrations utiles, sont de tels points accessibles à partir de ce que nous avons déjà
  Beaucoup n’ont simplement jamais été découvertes parce que personne n’y a encore consacré le temps et l’effort nécessaires, et les LLM peuvent grandement accélérer cela
  À l’inverse, il existe aussi des points hors de l’enveloppe, inaccessibles par extrapolation ou interpolation à partir des points existants, qui exigent un véritable saut conceptuel
  Le passage de la physique newtonienne à la relativité générale serait un bon exemple possible
  Demis Hassabis a déjà proposé, comme test d’AGI, de fournir à une IA uniquement les connaissances en physique disponibles avant 1915, de lui montrer l’orbite de Mercure, et de voir si elle parvient indépendamment à la relativité générale
  Je doute que les LLM actuels puissent faire un tel saut, et la plupart des humains non plus
  Si l’on qualifie Einstein de génie, c’est parce qu’il a accompli seul ce saut vers la relativité générale ; chez les humains, on a donc une preuve d’existence que cela arrive parfois, mais pour l’IA, il faut encore voir
- La plupart des découvertes sont effectivement impliquées par les axiomes, mais il y a parfois des moments où, faute de meilleure expression, on peut dire qu’une nouvelle mathématique est créée
  Des gens comme Descartes, Newton, Leibniz, Gauss, Euler, Ramanujan ou Galois traitaient les mathématiques davantage comme un art que comme une science
  Par exemple, beaucoup pensent que résoudre l’hypothèse de Riemann nécessitera probablement un nouveau type de mathématiques, et il me semble peu probable qu’un LLM l’invente soudainement
- J’espère qu’on va bientôt dépasser ce stade où l’on évalue les capacités des LLM sur une règle unidimensionnelle arbitraire, avec « pas humain » à une extrémité et « surhumain » à l’autre
  C’est vide de sens et peu pertinent
  Quand Deep Blue a battu Kasparov, tout n’a pas changé d’un coup ; animaux et machines ont toujours été « meilleurs » que les humains sur certaines dimensions
  Il n’y a pas de règle unique au départ, et même s’il y en avait une, elle ne serait ni unidimensionnelle ni linéaire ; chacun change de règle et de bornes avec le temps
  Cela ne revient pas non plus à concéder la victoire aux suprémacistes de l’IA
  Les LLM sont des outils extrêmement utiles et ils vont continuer à s’améliorer de façon spectaculaire, mais ils ne dépasseront pas les humains sur toutes les dimensions que certains humains jugent essentielles
  Il n’y aura pas de moment où l’IA sera universellement reconnue comme supérieure aux humains simplement parce qu’elle aura franchi un seuil sur une liste d’indicateurs quantifiés
  Parce que ce qui est « important » est lui-même subjectif
- L’idée générale sur le rythme des découvertes mathématiques humaines est bonne, mais Ayer racontait n’importe quoi, et le Wittgenstein tardif a réfuté le premier Wittgenstein
  Pour que l’affirmation « c’était déjà implicitement contenu » soit vraie, il faudrait que les mathématiques forment un système fermé, et il est déjà démontré que ce n’est pas le cas
  On peut sortir des mathématiques par les mathématiques elles-mêmes, d’où la nécessité de divers points d’ancrage axiomatiques, dont Zermelo-Fraenkel
  En réalité, nous ne comprenons pas très bien l’immensité de ce que nous pourrions appeler objectivement « les mathématiques », et il est possible que les mathématiques telles que nous les percevons ne soient qu’une partie de mathématiques plus vastes, ou qu’elles soient gravement erronées
  On ignore si ces mathématiques plus vastes possèdent les mêmes propriétés systémiques de clôture
Pour ceux qui utilisent beaucoup les LLM pour coder, ce n’est pas si surprenant, c’était une question de temps
Les mathématiciens font de nouvelles découvertes en construisant et en appliquant des outils mathématiques de façons inédites
Cela implique énormément de travail itératif : suivre des intuitions et explorer des connexions
Les LLM n’ont pas d’intuition de ce que signifie une « découverte », donc il est difficile de dire qu’ils découvrent vraiment, mais ils peuvent essayer façon Monte Carlo tous les outils mathématiques en visant un objectif étroit, trouver ce qui marche, puis empiler ou combiner des améliorations
À la lecture de l’article, c’est exactement ainsi que cette découverte semble avoir eu lieu, le LLM allant au-delà du résultat attendu grâce à des « connexions surprenantes »
Mais sans l’objectif fixé par les humains, sans la compréhension humaine pour reconnaître la valeur des nouveaux chemins empruntés par l’IA, et sans le langage mathématique créé par les humains qui permet d’explorer les concepts, le résultat n’a pas de sens
- Dire que « sans intention et compréhension humaines, cela n’a pas de sens », n’est-ce pas de l’anthropocentrisme ?
  Pourquoi la compréhension ne vaudrait-elle que lorsqu’elle est humaine ?
  Pourquoi le savoir serait-il réservé aux humains ?
  Si une autre espèce résolvait la contradiction entre gravité et mécanique quantique, cela n’aurait-il aucun sens tant qu’elle ne nous l’aurait pas expliqué et tant que nous ne l’aurions pas comprise ?
- Il existe un essai récent, long et intéressant, écrit par un mathématicien sur ce sujet : https://davidbessis.substack.com/p/the-fall-of-the-theorem-e...
- Non seulement ce n’est pas surprenant, mais c’était attendu depuis longtemps. Il n’y a aucune différence entre programmes et démonstrations : ce sont la même chose
Ce qui est intéressant, c’est que cette démonstration — plus précisément cette réfutation — a trouvé un contre-exemple à la conjecture originale d’Erdős
Comme le dit la réaction d’un mathématicien dans le PDF lié, c’est un peu moins intéressant que de démontrer que la conjecture était vraie
Prouver qu’elle est vraie aurait exigé une construction théorique plus importante
Il aurait fallu expliquer, à partir d’une théorie plus large, pourquoi cette conjecture était correcte, alors qu’avec un contre-exemple, il suffit que le modèle trouve la bonne construction par une forme de recherche plus sophistiquée
Bien sûr, cette recherche n’a rien de simple et reste impressionnante, et il a fallu de nombreuses étapes pour démontrer le lien avec le contre-exemple
Mais cela ressemble davantage à une mise en relation d’idées existantes qu’au développement de mathématiques nouvelles et profondes
Je ne cherche pas à minimiser cet accomplissement remarquable ; j’ai vraiment l’impression qu’on avance quelque part
C’est purement intuitif, mais j’ai le sentiment que les modèles ne sont plus très loin de pouvoir construire assez de théorie pour démontrer des conjectures plus complexes, de celles qui nécessitent de nouvelles mathématiques ; c’est peut-être surtout une question de pouvoir travailler sur des horizons temporels plus longs
- La recherche de démonstrations et la recherche de réfutations ne sont parfois pas si différentes
  Dans la plupart des cas, on grignote peu à peu les bords pour simplifier le problème
  Par exemple, pour démontrer qu’une chose est impossible, on commence par montrer qu’il n’existe que 5 familles de cas possibles, puis on peut prouver que 4 de ces familles sont impossibles
  Cela signifie que 80 % du problème est résolu, et dans le cas d’une recherche de contre-exemple, cela réduit aussi l’espace de recherche de 80 %
  Avec un contre-exemple, on peut se permettre des intuitions et des sauts, tant qu’ils tombent juste ; avec une démonstration, on ne peut pas
  En revanche, une fois qu’on a trouvé le contre-exemple, les impasses écartées restent généralement invisibles
- Donner plus de temps à un LLM ne le fera pas pratiquer des mathématiques humaines en inventant à partir de rien les nombres complexes, ou même les nombres tout court
  Le laisser combiner plus longtemps ce qui est dans les données d’entraînement ne changera rien à cela
Comme je l’ai déjà dit, l’IA obtiendra une médaille Fields avant de savoir gérer un McDonald’s
La partie difficile, c’était de construire l’échiquier des mathématiques, c’est-à-dire un environnement comme Lean ; maintenant, c’est surtout une affaire de reconnaissance de motifs et de calcul
Les LLM ne sont qu’un début, et on verra bientôt apparaître des IA mathématiques plus spécialisées, davantage dans l’esprit de Stockfish
- Sauf qu’ici, rien n’a été vérifié avec Lean
  Tout s’est fait en entrée et sortie en langage naturel, et à bien des égards c’est même une démonstration intéressante du point inverse
  La vérification intervient quand on veut confier aussi à l’ordinateur le contrôle de la démonstration
  Ici, la preuve a été vérifiée à la main par un groupe de mathématiciens du domaine
- Cette remarque sur le fait de gérer un McDonald’s a quelque chose de dystopique, qui me fait penser au système fictif de gestion « Manna » utilisé dans une franchise de hamburgers [0]
  Il y avait là beaucoup d’automatisation de type « anti-centaure »
  Manna disposait à chaque instant d’une liste de tâches à accomplir, et lorsqu’une commande arrivait à la caisse, il ordonnait aux employés de préparer le repas
  Il suivait des centaines de tâches comme nettoyer les toilettes, laver le sol, essuyer les tables, balayer le trottoir, décongeler les pains, faire tourner les stocks, nettoyer les vitres, et les attribuait une par une aux employés
  À la fin du service, Manna disait toujours « Nous avons terminé pour aujourd’hui. Merci de votre aide », puis on retirait le casque pour le poser sur son chargeur
  Après 6 à 8 heures passées à entendre une voix dans sa tête dire en détail quoi faire, les premières minutes sans le casque étaient toujours désorientantes, et il fallait comme rallumer son cerveau pour quitter le restaurant
  [0] https://en.wikipedia.org/wiki/Manna_(novel)
- Je ne suis pas d’accord. L’IA sera peut-être capable de faire un travail de niveau médaille Fields avant de gérer un McDonald’s, mais je pense qu’elle gérera bien un McDonald’s avant l’un comme avant l’autre
  La médaille Fields viendra longtemps après les deux
- La démonstration n’a pas été écrite en Lean, mais en anglais
  Il faut une validation par des experts humains pour vérifier que ce n’est pas du non-sens
- L’« échiquier » des mathématiques existe déjà depuis plus de 40 ans
  Lean n’a rien de spécial ici, c’est presque un effet de foule
  Et on ne sait même pas dans quelle mesure l’entraînement sur Lean a aidé ce modèle précis
Cette démonstration applique à une question de géométrie élémentaire des idées inattendues et sophistiquées relevant de la théorie algébrique des nombres
Plus je lis ce genre de résultats, plus j’ai l’impression qu’une grande partie de la puissance du modèle vient du fait qu’il possède des connaissances préalables sur à peu près tous les domaines possibles, et qu’il n’a aucun mal à les transférer vers un nouveau domaine
La beauté potentielle de ces outils, c’est peut-être d’aider à franchir les barrières d’hyperspécialisation excessives que les humains rencontrent aujourd’hui en science
Cette hyperspécialisation est importante d’un côté, mais de l’autre elle limite les outils et les inspirations accessibles à une personne
- C’est une remarque juste, et très bien formulée
  Plus nous devenons hyperspécialisés, plus les LLM deviennent précieux pour relier des horizons différents
- L’ensemble du savoir humain ressemble à une forme d’intelligence collective
  Autrefois, le coût d’accès à cette intelligence était élevé, mais ce n’est plus vraiment le cas aujourd’hui
  Ce qui est formidable, c’est que quand quelqu’un apporte quelque chose à cette intelligence collective, cela peut immédiatement être appliqué à n’importe quel problème sur lequel d’autres travaillent
- J’ai toujours été sceptique quant au rôle des LLM en mathématiques, mais c’est la première fois que je vois cet argument, et je le trouve assez convaincant
  Peut-être que les LLM peuvent aider à développer une compréhension plus horizontale d’un domaine
- Exactement. Les gens se concentrent probablement davantage sur la profondeur que sur l’étendue, peut-être parce que leur champ de vision est limité
  Comme il s’agit d’un modèle généraliste, il possède aussi des connaissances de niveau doctorat, voire au-delà, en physique, en biologie, en histoire, etc.
  Je pense que nous n’avons pas encore bien compris tout ce qu’un seul « esprit » ayant internalisé le savoir de tant de domaines peut accomplir
Quand OpenAI disait que ses modèles allaient acquérir une « intelligence de niveau doctorat », tout le monde riait, et il est intéressant de voir que le critère s’est maintenant déplacé vers la capacité à créer de nouvelles mathématiques
On ne leur demande déjà plus le niveau doctorat, mais le niveau Leibniz, Euler ou Galois
- Et pourtant, pour le code, ça bosse encore comme un développeur junior qui aurait mémorisé tout Stack Overflow
Le résumé du raisonnement de ce travail, lié dans l’article de blog, fait 125 pages
C’est une échelle d’inférence absurde, assez proche de ce qu’Anthropic laissait entendre avec Mythos
- Pour ceux que ça intéresse, le lien est ici : https://cdn.openai.com/pdf/1625eff6-5ac1-40d8-b1db-5d5cf925d...
- Aujourd’hui, j’ai généré l’équivalent de deux tomes du Seigneur des anneaux juste pour corriger 3 lignes manquantes dans un modèle SQL et ouvrir une PR, donc +1
Je me demande pourquoi on n’entend parler que de problèmes d’Erdős résolus
Il doit bien y avoir d’innombrables problèmes ouverts en mathématiques, et pourtant, sur r/singularity et r/accelerate, toutes les « percées mathématiques » de ChatGPT concernent des problèmes d’Erdős
- Les problèmes d’Erdős représentent une part importante des problèmes mathématiques explicitement posés mais non résolus
  Ils sont suffisamment célèbres pour attirer l’attention, tout en n’étant pas assez intéressants pour que beaucoup de gens y consacrent énormément d’efforts
  Résoudre un problème déjà posé par quelqu’un d’autre est une activité de niche dans la recherche mathématique
  Le plus souvent, on étudie un objet intéressant, on le formule d’une manière qu’on peut traiter avec les outils disponibles, puis on cherche une solution
  Dans le cas idéal, la formulation du problème et sa solution deviennent toutes deux intéressantes en elles-mêmes
- Les problèmes d’Erdős sont faciles à énoncer, ce qui en fait un excellent benchmark pour la première année de l’IA en mathématiques
- À ma connaissance, c’est aussi parce qu’il existe autour d’eux une communauté et une base de données
- Il n’y a pas que des problèmes d’Erdős : https://news.ycombinator.com/item?id=48213189
- C’est parce qu’Erdős était un immense mathématicien, d’où leur notoriété
  Un peu comme les problèmes de Hilbert il y a un siècle
C’est clairement impressionnant
Mais tant qu’on ne sait pas sur quoi ce modèle a été entraîné, il est très difficile d’évaluer jusqu’à quel point il y est arrivé « par lui-même »
L’ensemble du secteur de l’IA paie très cher des experts de nombreux domaines pour produire de grandes quantités de nouvelles données d’entraînement
Des données inédites, introuvables ailleurs, que les entreprises gardent pour elles, et qui peuvent très bien contenir de vraies idées originales
Il est peu probable que quelqu’un ait simplement résolu ce problème puis l’ait mis dans les données d’entraînement, mais honnêtement, avec OpenAI, je ne peux pas non plus affirmer avec certitude qu’ils ne l’ont pas fait
Le plus intéressant, c’est la possibilité qu’ils aient déjà produit des données d’entraînement touchant à la plupart, voire à la totalité, des propositions centrales qui paraissent « originales » dans cette démonstration
Bien sûr, on ne peut pas le savoir
Mais tant que ce genre de choses ne sera pas produit de manière non opaque, cette question restera toujours là
- Cela ressemble à une lecture assez complotiste

Un modèle d’OpenAI a réfuté une conjecture centrale en géométrie discrète

Une percée sur le problème des distances unitaires

La méthode trouvée par l’IA

Le contenu mathématique du problème des distances unitaires

Pourquoi le résultat est surprenant

De nouvelles techniques venues de la théorie algébrique des nombres

Ce que cela signifie pour les mathématiques

Pourquoi c’est important

À lire aussi

1 commentaires

Réactions sur Hacker News