- Le problème des distances unitaires est un problème posé par Erdős en 1946, qui demande le nombre maximal de paires de points séparées par une distance égale à 1 parmi n points du plan, et une conjecture centrale de longue date a été réfutée
- Le modèle de raisonnement généraliste d’OpenAI a brisé l’idée selon laquelle la famille des réseaux carrés était essentiellement optimale, en produisant une famille infinie d’exemples et une amélioration de niveau polynomial
- La nouvelle construction produit plus de
n^{1+δ}paires de points à distance unitaire pour une infinité de valeurs de n, et une amélioration due à Will Sawin montre queδ = 0.014est possible - La preuve applique à un problème géométrique des outils de théorie algébrique des nombres, au-delà des entiers de Gauss, notamment une tour de corps de classes infinie et la théorie de Golod–Shafarevich
- Le résultat montre que l’IA peut contribuer à des découvertes mathématiques originales sur des problèmes ouverts anciens, tandis que l’expertise humaine devient encore plus importante pour le choix des problèmes et leur interprétation
Une percée sur le problème des distances unitaires
- Le problème des distances unitaires est un problème de géométrie combinatoire qui demande combien de paires de points exactement à distance 1 on peut obtenir au maximum parmi n points placés dans le plan
- Il a été posé par Paul Erdős en 1946, et le livre de 2005 de Brass, Moser et Pach, Research Problems in Discrete Geometry, le décrit comme « probablement le problème le plus connu et le plus facile à expliquer en géométrie combinatoire »
- Le combinatoricien de Princeton Noga Alon l’a présenté comme l’un des problèmes qu’Erdős préférait particulièrement, et Erdős avait assorti sa résolution d’une récompense
- Pendant longtemps, on a cru que la famille de constructions sur le réseau carré produisait essentiellement le nombre maximal de paires de points à distance unitaire
- Un modèle interne d’OpenAI a construit une famille infinie d’exemples qui réfute cette ancienne conjecture et fournit une amélioration de niveau polynomial
- La preuve a été examinée par un groupe externe de mathématiciens, qui ont également rédigé un article d’accompagnement traitant de l’argument, du contexte et de la portée du résultat
- Le texte original de la preuve est disponible dans unit-distance-proof.pdf, l’article d’accompagnement dans unit-distance-remarks.pdf, et une version abrégée de la chaîne de raisonnement du modèle dans unit-distance-cot.pdf
La méthode trouvée par l’IA
- La preuve ne provient ni d’un système entraîné spécialement pour les mathématiques, ni d’un scaffolding dédié à la recherche de stratégies de démonstration, ni d’un système conçu spécifiquement pour le problème des distances unitaires, mais d’un modèle de raisonnement généraliste
- L’évaluation s’inscrivait dans un effort plus large visant à déterminer si des modèles avancés pouvaient contribuer à la recherche de pointe, en s’appuyant sur un ensemble de problèmes d’Erdős, et dans ce cas une preuve résolvant un problème ouvert a été générée
- Les mathématiques constituent un domaine particulièrement clair pour tester les capacités de raisonnement, car les problèmes y sont précis, les preuves candidates peuvent être vérifiées, et les longues démonstrations doivent rester cohérentes du début à la fin
- La preuve applique à un problème géométrique d’apparence élémentaire des idées de théorie algébrique des nombres à la fois inattendues et sophistiquées
- Dans l’article d’accompagnement, Tim Gowers qualifie ce résultat de « jalon pour les mathématiques de l’IA »
- Le théoricien des nombres Arul Shankar estime qu’il montre que les modèles d’IA actuels peuvent aller au-delà d’un rôle d’assistant pour les mathématiciens humains, en produisant des idées originales et sophistiquées et en les menant à terme
Le contenu mathématique du problème des distances unitaires
- u(n) est défini comme le nombre maximal de paires de points à distance unitaire possibles parmi n points du plan
- Une construction simple consiste à placer n points sur une droite pour obtenir n−1 paires, tandis que le réseau carré produit environ 2n paires
- La meilleure construction connue jusqu’ici venait d’un réseau carré remis à l’échelle, et produisait
n^{1 + C / log log(n)}paires de points à distance unitaire pour une certaine constante C - Comme
log log(n)croît lorsque n augmente, le terme supplémentaire dans l’exposant tend vers 0, de sorte que la croissance de cette construction restait à peine supérieure à la linéarité - Pendant des décennies, on a largement considéré que ce taux était essentiellement optimal, et Erdős conjecturait techniquement une borne supérieure de la forme
n^{1+o(1)} - Le nouveau résultat réfute cette conjecture en construisant, pour une infinité de valeurs de n, une configuration de n points possédant au moins
n^{1+δ}paires de points à distance unitaire, pour un exposant fixeδ > 0 - La preuve initiale fournie par l’IA ne donnait pas de valeur explicite pour δ, mais une amélioration ultérieure du professeur de mathématiques de Princeton Will Sawin a montré qu’on peut prendre
δ = 0.014
Pourquoi le résultat est surprenant
- Depuis la construction originale d’Erdős en 1946, la meilleure borne inférieure connue était restée essentiellement inchangée
- La meilleure borne supérieure connue,
O(n^{4/3}), provenait du travail de Spencer, Szemerédi et Trotter en 1984, et elle est restée essentiellement stable malgré des améliorations et l’étude de structures connexes par Székely, Katz et Silier, Pach, Raz, Solymosi et d’autres - Matoušek ainsi qu’Alon-Bucić-Sauermann ont étudié ce problème pour des distances non euclidiennes dans le plan, et ont obtenu des résultats montrant que « la plupart » de ces distances non euclidiennes vérifient, dans un certain sens, la conjecture d’Erdős, ce qui la renforçait encore
- Il est particulièrement surprenant que l’ingrédient central de cette nouvelle construction provienne de la théorie algébrique des nombres, un domaine qui semble éloigné de la géométrie et des distances
- La théorie algébrique des nombres est le domaine qui traite de notions comme la factorisation dans les extensions des entiers appelées corps de nombres algébriques
De nouvelles techniques venues de la théorie algébrique des nombres
- La nouvelle preuve part d’idées géométriques familières, puis s’étend dans une direction inattendue
- La borne inférieure originale d’Erdős peut être comprise à travers les entiers de Gauss de la forme
a + bi - Ici, a et b sont des entiers et i est une racine carrée de −1
- Les entiers de Gauss étendent les entiers ordinaires et possèdent, comme eux, des propriétés telles que la factorisation unique en nombres premiers
- Ce type d’extension des entiers ou des rationnels est appelé corps de nombres algébrique
- Le nouvel argument remplace les entiers de Gauss par une généralisation plus complexe issue de la théorie algébrique des nombres, où des symétries plus riches permettent de produire davantage de différences de longueur unitaire
- L’argument précis utilise des outils comme une tour de corps de classes infinie et la théorie de Golod–Shafarevich pour montrer que les corps de nombres requis existent réellement
- Ces idées étaient bien connues des spécialistes de théorie algébrique des nombres, mais le fait qu’elles puissent avoir un impact sur un problème géométrique dans le plan euclidien a été accueilli comme une grande surprise
Ce que cela signifie pour les mathématiques
- Le fait qu’un système d’IA ait résolu de manière autonome un ancien problème ouvert situé au cœur d’un domaine actif constitue un moment important dans l’interaction entre l’IA et les mathématiques
- Le travail d’accompagnement des mathématiciens externes offre une image plus riche que celle qui ressort de la seule solution initiale
- Dans l’article d’accompagnement, Thomas Bloom écrit que pour évaluer l’importance d’une preuve générée par l’IA, il faut se demander si cette preuve nous a appris quelque chose de nouveau sur le problème et si elle nous a permis de mieux comprendre la géométrie discrète
- Bloom estime que ce résultat montre que les constructions issues de la théorie des nombres peuvent en dire bien davantage qu’on ne l’attendait sur ce type de questions, et que la théorie des nombres nécessaire peut être très profonde
- Bloom pense que, dans les mois à venir, de nombreux spécialistes de théorie algébrique des nombres examineront de près d’autres problèmes ouverts de géométrie discrète
- Le lien inattendu entre théorie algébrique des nombres et géométrie discrète ne se contente pas de résoudre une conjecture particulière, il devient aussi un pont permettant d’explorer davantage de problèmes connexes
- Ce résultat montre que l’IA peut contribuer non seulement à des réponses, mais aussi à des découvertes mathématiques dont le sens devient plus clair et plus riche grâce à la compréhension humaine qui suit
Pourquoi c’est important
- Un meilleur raisonnement mathématique peut faire de l’IA un partenaire de recherche plus puissant
- Elle peut maintenir de manière cohérente de longues chaînes de pensée difficiles, relier des idées entre domaines de connaissance éloignés, et révéler des pistes prometteuses que les experts n’auraient peut-être pas placées en priorité
- Elle peut aider les chercheurs à progresser sur des problèmes trop complexes ou trop chronophages pour être abordés facilement
- Ces capacités sont utiles au-delà des mathématiques, notamment en biologie, en physique, en science des matériaux, en ingénierie et en médecine
- Si elle peut maintenir des raisonnements complexes de manière cohérente, relier des domaines de connaissance éloignés et produire des résultats qui passent l’examen d’experts, cela fait partie de la trajectoire de long terme vers des systèmes de recherche davantage automatisés
- Il est avancé que l’IA va commencer à jouer un rôle très sérieux dans la partie créative de la recherche, en particulier dans la recherche sur l’IA elle-même
- De tels progrès renforcent l’urgence de comprendre le problème de l’alignement de systèmes très intelligents, les prochaines étapes du développement de l’IA et l’avenir de la collaboration entre humains et IA
- Cet avenir dépend toujours du jugement humain
- L’expertise ne perd pas en importance, elle devient au contraire plus précieuse
- L’IA peut aider à explorer, proposer et vérifier, mais ce sont les humains qui choisissent les problèmes importants, interprètent les résultats et décident quelles questions poursuivre ensuite
1 commentaires
Réactions sur Hacker News
Ce fil HN m’a rendu morose, et je me demande encore pourquoi
Si on retire les éloges façon communiqué de presse d’OpenAI, il reste beaucoup de questions intéressantes et nuancées sur le rôle des LLM dans la recherche mathématique
Je recommande vraiment de lire les commentaires des mathématiciens publiés avec le résultat, en particulier ceux de Tim Gowers
Mais les commentaires sont devenus un champ de bataille fait de débats sur les LLM, de réfutations et de contre-réfutations furieuses qui tournent en boucle depuis 2023
C’est triste de voir le même combat se rejouer autour de lignes de front tracées il y a 3 ans, et je me demande si ce sera encore le cas dans 2 ans
On vit mieux en gardant à l’esprit cette phrase célèbre de Nietzsche : « Je ne veux pas faire la guerre à la laideur. Je ne veux pas accuser, je ne veux même pas accuser les accusateurs. Détourner le regard, voilà ce qui doit être ma seule négation »
Plus l’IA démontre ses capacités, plus cela penche dans une direction inconfortable pour tous ceux qui n’ont pas une sécurité de l’emploi très solide
Il faudra du temps avant que les gens reconnaissent que l’IA possède un ensemble de capacités très différent de l’intelligence humaine, et qu’elle la complète assez bien
Il est peu probable qu’elle dépasse massivement l’intelligence humaine à grande échelle, et les entreprises qui misent là-dessus finiront à la traîne
J’aimerais avoir une vraie discussion sur ce sujet, mais comme tout le monde croit que seule sa propre réalité est vraie et que la réalité opposée est fausse, ça ne fait que s’envenimer
Il m’arrive de faire de longues pauses après avoir réalisé que je viens sur HN seulement pour me mettre en colère
Je ne sais pas pourquoi on s’inflige ça, alors qu’au fond je pense qu’on veut souvent la même chose
À ceux qui disent que « les LLM ne font qu’interpoler les données d’entraînement » : Ayer et le premier Wittgenstein, chacun à sa manière, estimaient que les vérités mathématiques ne rapportent pas de nouveaux faits sur le monde
L’idée qu’une démonstration ne fait que déployer ce qui est déjà implicitement contenu dans les axiomes, les définitions, les symboles et les règles est profondément intéressante, sans que cela empêche d’attribuer le mérite de la découverte aux mathématiciens
Donc soit la recombinaison de matériaux existants n’est pas disqualifiante, soit une bonne partie des médailles Fields devrait être rendue
Les humains non plus ne produisent pas chaque année, dans tous les domaines, des innovations qui changent de dimension
On peut dire que les LLM « ne font que » recombiner, mais je doute toujours qu’un LLM nourri de toute la littérature d’algèbre, de géométrie et de trigonométrie d’avant Newton/Leibniz puisse inventer le calcul infinitésimal
Cela dit, ce type d’innovation est précisément un domaine où les LLM excellent, et cela ne veut pas dire que les humains n’ont plus besoin d’être bons dans l’innovation recombinatoire
Il semble qu’en matière de synthèse d’idées nouvelles, il y ait encore beaucoup de choses que les humains peuvent faire et que les LLM ne savent pas faire
Si l’on trace la grande enveloppe convexe autour de tous ces points, les LLM, ayant appris à l’intérieur, peuvent interpoler entre les points existants et atteindre de nouveaux points qui restent à l’intérieur de cette enveloppe
La question de savoir si les LLM peuvent atteindre des points situés hors de l’enveloppe reste débattue
Mais atteindre de nouveaux points à l’intérieur de l’enveloppe est déjà extrêmement utile
Beaucoup de nouvelles découvertes et démonstrations, peut-être même la plupart des découvertes et démonstrations utiles, sont de tels points accessibles à partir de ce que nous avons déjà
Beaucoup n’ont simplement jamais été découvertes parce que personne n’y a encore consacré le temps et l’effort nécessaires, et les LLM peuvent grandement accélérer cela
À l’inverse, il existe aussi des points hors de l’enveloppe, inaccessibles par extrapolation ou interpolation à partir des points existants, qui exigent un véritable saut conceptuel
Le passage de la physique newtonienne à la relativité générale serait un bon exemple possible
Demis Hassabis a déjà proposé, comme test d’AGI, de fournir à une IA uniquement les connaissances en physique disponibles avant 1915, de lui montrer l’orbite de Mercure, et de voir si elle parvient indépendamment à la relativité générale
Je doute que les LLM actuels puissent faire un tel saut, et la plupart des humains non plus
Si l’on qualifie Einstein de génie, c’est parce qu’il a accompli seul ce saut vers la relativité générale ; chez les humains, on a donc une preuve d’existence que cela arrive parfois, mais pour l’IA, il faut encore voir
Des gens comme Descartes, Newton, Leibniz, Gauss, Euler, Ramanujan ou Galois traitaient les mathématiques davantage comme un art que comme une science
Par exemple, beaucoup pensent que résoudre l’hypothèse de Riemann nécessitera probablement un nouveau type de mathématiques, et il me semble peu probable qu’un LLM l’invente soudainement
C’est vide de sens et peu pertinent
Quand Deep Blue a battu Kasparov, tout n’a pas changé d’un coup ; animaux et machines ont toujours été « meilleurs » que les humains sur certaines dimensions
Il n’y a pas de règle unique au départ, et même s’il y en avait une, elle ne serait ni unidimensionnelle ni linéaire ; chacun change de règle et de bornes avec le temps
Cela ne revient pas non plus à concéder la victoire aux suprémacistes de l’IA
Les LLM sont des outils extrêmement utiles et ils vont continuer à s’améliorer de façon spectaculaire, mais ils ne dépasseront pas les humains sur toutes les dimensions que certains humains jugent essentielles
Il n’y aura pas de moment où l’IA sera universellement reconnue comme supérieure aux humains simplement parce qu’elle aura franchi un seuil sur une liste d’indicateurs quantifiés
Parce que ce qui est « important » est lui-même subjectif
Pour que l’affirmation « c’était déjà implicitement contenu » soit vraie, il faudrait que les mathématiques forment un système fermé, et il est déjà démontré que ce n’est pas le cas
On peut sortir des mathématiques par les mathématiques elles-mêmes, d’où la nécessité de divers points d’ancrage axiomatiques, dont Zermelo-Fraenkel
En réalité, nous ne comprenons pas très bien l’immensité de ce que nous pourrions appeler objectivement « les mathématiques », et il est possible que les mathématiques telles que nous les percevons ne soient qu’une partie de mathématiques plus vastes, ou qu’elles soient gravement erronées
On ignore si ces mathématiques plus vastes possèdent les mêmes propriétés systémiques de clôture
Pour ceux qui utilisent beaucoup les LLM pour coder, ce n’est pas si surprenant, c’était une question de temps
Les mathématiciens font de nouvelles découvertes en construisant et en appliquant des outils mathématiques de façons inédites
Cela implique énormément de travail itératif : suivre des intuitions et explorer des connexions
Les LLM n’ont pas d’intuition de ce que signifie une « découverte », donc il est difficile de dire qu’ils découvrent vraiment, mais ils peuvent essayer façon Monte Carlo tous les outils mathématiques en visant un objectif étroit, trouver ce qui marche, puis empiler ou combiner des améliorations
À la lecture de l’article, c’est exactement ainsi que cette découverte semble avoir eu lieu, le LLM allant au-delà du résultat attendu grâce à des « connexions surprenantes »
Mais sans l’objectif fixé par les humains, sans la compréhension humaine pour reconnaître la valeur des nouveaux chemins empruntés par l’IA, et sans le langage mathématique créé par les humains qui permet d’explorer les concepts, le résultat n’a pas de sens
Pourquoi la compréhension ne vaudrait-elle que lorsqu’elle est humaine ?
Pourquoi le savoir serait-il réservé aux humains ?
Si une autre espèce résolvait la contradiction entre gravité et mécanique quantique, cela n’aurait-il aucun sens tant qu’elle ne nous l’aurait pas expliqué et tant que nous ne l’aurions pas comprise ?
Ce qui est intéressant, c’est que cette démonstration — plus précisément cette réfutation — a trouvé un contre-exemple à la conjecture originale d’Erdős
Comme le dit la réaction d’un mathématicien dans le PDF lié, c’est un peu moins intéressant que de démontrer que la conjecture était vraie
Prouver qu’elle est vraie aurait exigé une construction théorique plus importante
Il aurait fallu expliquer, à partir d’une théorie plus large, pourquoi cette conjecture était correcte, alors qu’avec un contre-exemple, il suffit que le modèle trouve la bonne construction par une forme de recherche plus sophistiquée
Bien sûr, cette recherche n’a rien de simple et reste impressionnante, et il a fallu de nombreuses étapes pour démontrer le lien avec le contre-exemple
Mais cela ressemble davantage à une mise en relation d’idées existantes qu’au développement de mathématiques nouvelles et profondes
Je ne cherche pas à minimiser cet accomplissement remarquable ; j’ai vraiment l’impression qu’on avance quelque part
C’est purement intuitif, mais j’ai le sentiment que les modèles ne sont plus très loin de pouvoir construire assez de théorie pour démontrer des conjectures plus complexes, de celles qui nécessitent de nouvelles mathématiques ; c’est peut-être surtout une question de pouvoir travailler sur des horizons temporels plus longs
Dans la plupart des cas, on grignote peu à peu les bords pour simplifier le problème
Par exemple, pour démontrer qu’une chose est impossible, on commence par montrer qu’il n’existe que 5 familles de cas possibles, puis on peut prouver que 4 de ces familles sont impossibles
Cela signifie que 80 % du problème est résolu, et dans le cas d’une recherche de contre-exemple, cela réduit aussi l’espace de recherche de 80 %
Avec un contre-exemple, on peut se permettre des intuitions et des sauts, tant qu’ils tombent juste ; avec une démonstration, on ne peut pas
En revanche, une fois qu’on a trouvé le contre-exemple, les impasses écartées restent généralement invisibles
Le laisser combiner plus longtemps ce qui est dans les données d’entraînement ne changera rien à cela
Comme je l’ai déjà dit, l’IA obtiendra une médaille Fields avant de savoir gérer un McDonald’s
La partie difficile, c’était de construire l’échiquier des mathématiques, c’est-à-dire un environnement comme Lean ; maintenant, c’est surtout une affaire de reconnaissance de motifs et de calcul
Les LLM ne sont qu’un début, et on verra bientôt apparaître des IA mathématiques plus spécialisées, davantage dans l’esprit de Stockfish
Tout s’est fait en entrée et sortie en langage naturel, et à bien des égards c’est même une démonstration intéressante du point inverse
La vérification intervient quand on veut confier aussi à l’ordinateur le contrôle de la démonstration
Ici, la preuve a été vérifiée à la main par un groupe de mathématiciens du domaine
Il y avait là beaucoup d’automatisation de type « anti-centaure »
Manna disposait à chaque instant d’une liste de tâches à accomplir, et lorsqu’une commande arrivait à la caisse, il ordonnait aux employés de préparer le repas
Il suivait des centaines de tâches comme nettoyer les toilettes, laver le sol, essuyer les tables, balayer le trottoir, décongeler les pains, faire tourner les stocks, nettoyer les vitres, et les attribuait une par une aux employés
À la fin du service, Manna disait toujours « Nous avons terminé pour aujourd’hui. Merci de votre aide », puis on retirait le casque pour le poser sur son chargeur
Après 6 à 8 heures passées à entendre une voix dans sa tête dire en détail quoi faire, les premières minutes sans le casque étaient toujours désorientantes, et il fallait comme rallumer son cerveau pour quitter le restaurant
[0] https://en.wikipedia.org/wiki/Manna_(novel)
La médaille Fields viendra longtemps après les deux
Il faut une validation par des experts humains pour vérifier que ce n’est pas du non-sens
Lean n’a rien de spécial ici, c’est presque un effet de foule
Et on ne sait même pas dans quelle mesure l’entraînement sur Lean a aidé ce modèle précis
Cette démonstration applique à une question de géométrie élémentaire des idées inattendues et sophistiquées relevant de la théorie algébrique des nombres
Plus je lis ce genre de résultats, plus j’ai l’impression qu’une grande partie de la puissance du modèle vient du fait qu’il possède des connaissances préalables sur à peu près tous les domaines possibles, et qu’il n’a aucun mal à les transférer vers un nouveau domaine
La beauté potentielle de ces outils, c’est peut-être d’aider à franchir les barrières d’hyperspécialisation excessives que les humains rencontrent aujourd’hui en science
Cette hyperspécialisation est importante d’un côté, mais de l’autre elle limite les outils et les inspirations accessibles à une personne
Plus nous devenons hyperspécialisés, plus les LLM deviennent précieux pour relier des horizons différents
Autrefois, le coût d’accès à cette intelligence était élevé, mais ce n’est plus vraiment le cas aujourd’hui
Ce qui est formidable, c’est que quand quelqu’un apporte quelque chose à cette intelligence collective, cela peut immédiatement être appliqué à n’importe quel problème sur lequel d’autres travaillent
Peut-être que les LLM peuvent aider à développer une compréhension plus horizontale d’un domaine
Comme il s’agit d’un modèle généraliste, il possède aussi des connaissances de niveau doctorat, voire au-delà, en physique, en biologie, en histoire, etc.
Je pense que nous n’avons pas encore bien compris tout ce qu’un seul « esprit » ayant internalisé le savoir de tant de domaines peut accomplir
Quand OpenAI disait que ses modèles allaient acquérir une « intelligence de niveau doctorat », tout le monde riait, et il est intéressant de voir que le critère s’est maintenant déplacé vers la capacité à créer de nouvelles mathématiques
On ne leur demande déjà plus le niveau doctorat, mais le niveau Leibniz, Euler ou Galois
Le résumé du raisonnement de ce travail, lié dans l’article de blog, fait 125 pages
C’est une échelle d’inférence absurde, assez proche de ce qu’Anthropic laissait entendre avec Mythos
Je me demande pourquoi on n’entend parler que de problèmes d’Erdős résolus
Il doit bien y avoir d’innombrables problèmes ouverts en mathématiques, et pourtant, sur r/singularity et r/accelerate, toutes les « percées mathématiques » de ChatGPT concernent des problèmes d’Erdős
Ils sont suffisamment célèbres pour attirer l’attention, tout en n’étant pas assez intéressants pour que beaucoup de gens y consacrent énormément d’efforts
Résoudre un problème déjà posé par quelqu’un d’autre est une activité de niche dans la recherche mathématique
Le plus souvent, on étudie un objet intéressant, on le formule d’une manière qu’on peut traiter avec les outils disponibles, puis on cherche une solution
Dans le cas idéal, la formulation du problème et sa solution deviennent toutes deux intéressantes en elles-mêmes
Un peu comme les problèmes de Hilbert il y a un siècle
C’est clairement impressionnant
Mais tant qu’on ne sait pas sur quoi ce modèle a été entraîné, il est très difficile d’évaluer jusqu’à quel point il y est arrivé « par lui-même »
L’ensemble du secteur de l’IA paie très cher des experts de nombreux domaines pour produire de grandes quantités de nouvelles données d’entraînement
Des données inédites, introuvables ailleurs, que les entreprises gardent pour elles, et qui peuvent très bien contenir de vraies idées originales
Il est peu probable que quelqu’un ait simplement résolu ce problème puis l’ait mis dans les données d’entraînement, mais honnêtement, avec OpenAI, je ne peux pas non plus affirmer avec certitude qu’ils ne l’ont pas fait
Le plus intéressant, c’est la possibilité qu’ils aient déjà produit des données d’entraînement touchant à la plupart, voire à la totalité, des propositions centrales qui paraissent « originales » dans cette démonstration
Bien sûr, on ne peut pas le savoir
Mais tant que ce genre de choses ne sera pas produit de manière non opaque, cette question restera toujours là