Présentation de mathstodon.xyz
- mathstodon.xyz fait partie du réseau social décentralisé basé sur Mastodon et constitue une instance destinée aux utilisateurs liés aux mathématiques.
- Prend en charge le rendu LaTeX dans l’interface web.
- Administrateur : Christian Lawson-Perfect (@christianp)
- Statistiques du serveur : 3K utilisateurs actifs
Expériences de Terence Tao avec GPT-o1
- GPT-o1 : nouvelle version de GPT d’OpenAI, qui effectue une phase initiale de raisonnement avant l’exécution du LLM.
- Expérience 1 : face à une question mathématique ambiguë, il a correctement identifié le théorème de Cramer et fourni une réponse satisfaisante.
- Dans la version précédente, le concept connexe était mentionné, mais les détails étaient erronés.
- Expérience 2 : sur un problème complexe d’analyse, il a abouti à la bonne solution grâce à de nombreux indices et guidages, mais n’a pas su générer seul l’idée conceptuelle principale et a commis quelques erreurs.
- Il s’agit d’un progrès par rapport au modèle précédent, mais cela reste insuffisant.
- Avec quelques améliorations supplémentaires, il pourrait devenir utile pour des travaux de niveau recherche.
- Expérience 3 : pour formaliser un résultat dans Lean, il a bien compris le problème et correctement effectué la décomposition initiale, mais le manque d’informations récentes sur Lean a entraîné plusieurs erreurs dans le code.
- Il pourrait être très utile dans un IDE intégrant un modèle spécialisé pour Lean et Mathlib.
Discussion complémentaire
- Progrès des outils d’IA : attente de l’émergence d’un écosystème d’outils d’IA capable de traiter divers travaux de recherche.
- Aujourd’hui, les grands LLM généralistes attirent l’attention, mais on s’attend aussi à ce que des modèles open source légers, adaptés à des applications spécifiques, jouent un rôle important.
- Comparaison entre l’IA et les doctorants : discussion sur la capacité des outils d’IA à apporter une contribution de niveau doctorant.
- Pour l’instant, ils demandent plus d’efforts qu’un doctorant, mais il est possible que ce ratio tombe à 1 ou moins dans les prochaines années.
# Résumé de GN⁺
- Terence Tao a testé le nouveau modèle GPT-o1 d’OpenAI pour évaluer ses capacités de résolution de problèmes mathématiques.
- GPT-o1 est meilleur que les versions précédentes, mais présente encore plusieurs limites.
- Avec quelques améliorations supplémentaires, il pourrait devenir utile pour des travaux de niveau recherche.
- Il anticipe l’émergence d’un écosystème où divers outils d’IA pourront soutenir les travaux de recherche.
- Aujourd’hui, les grands LLM généralistes attirent l’attention, mais on s’attend aussi à ce que des modèles open source légers, adaptés à des applications spécifiques, jouent un rôle important.
1 commentaires
Discussion sur Hacker News
On s’attend à ce que GPT devienne plus utile pour les mathématiques de niveau recherche s’il est affiné pour Lean (assistant de preuve) comme il l’a été pour Python
Imaginez revenir en 2019 et lire que l’expérience d’interagir avec Alexa est « comparable au fait de conseiller un étudiant de master moyen, mais pas totalement incompétent »
Le modèle o1 est très impressionnant
Les expériences avec le modèle O1 sont très variables
Ce qui est nouveau, c’est que les LLM ressemblent, sur des sujets variés, à « conseiller un étudiant de master moyen, mais pas totalement incompétent »
Les humains aussi peuvent tirer profit d’un raisonnement de type « chaîne de pensée »
Accord avec l’avis de Terence Tao
Il est enthousiasmant de se remettre à étudier les mathématiques comme loisir indépendant
L’avis de Terence Tao est surprenant
Daniel Litt a été impressionné par o1-preview, mais n’a pas encore eu de chance pour résoudre des problèmes mathématiques intéressants