Quand l’IA se crée elle-même : nos progrès vers l’auto-amélioration récursive

(anthropic.com)

18 points par GN⁺ 2026-06-05 | 2 commentaires | Partager sur WhatsApp

Une part croissante du travail d’implémentation et d’expérimentation auparavant assuré par des humains dans le développement de l’IA bascule vers des systèmes d’IA, ce qui accélère le rythme de développement et pourrait, avec suffisamment de calcul et de progrès, conduire à une auto-amélioration récursive où les modèles conçoivent et développent eux-mêmes leurs successeurs
L’horizon temporel des tâches qu’un modèle peut accomplir de manière autonome double environ tous les 4 mois ; Claude est ainsi passé de tâches logicielles d’environ 4 minutes en mars 2024 à des tâches de 12 heures en 2026
En mai 2026, plus de 80 % du code fusionné dans la base de code d’Anthropic est du code écrit par Claude, et au 2e trimestre 2026, le volume quotidien de code fusionné par un ingénieur moyen a été multiplié par 8 par rapport à 2024
Claude s’est rapidement renforcé dans l’exécution d’expériences clairement définies, passant d’une amélioration d’environ 3x de la vitesse du code en mai 2025 à environ 52x en avril 2026, mais le jugement de recherche — décider quels problèmes et quels résultats privilégier — reste encore un avantage comparatif humain
Les futurs possibles se divisent entre stagnation des tendances actuelles, gains d’efficacité composés avec des humains qui gardent la direction, et auto-amélioration récursive complète ; pour ralentir ou suspendre les choses en sécurité, l’enjeu clé est une coordination vérifiable impliquant les laboratoires de pointe de plusieurs pays

L’évolution de la boucle de développement de l’IA

Entre 2021 et 2023, au début, les humains écrivaient code et documentation sur leurs laptops, comme dans n’importe quelle entreprise tech classique
Entre 2023 et 2025, les premiers chatbots généraient de courts snippets de code, puis leurs sorties étaient copiées dans un éditeur de texte
Entre 2025 et 2026, des agents de codage ont commencé à écrire et éditer le code eux-mêmes, en traitant parfois des fichiers entiers
Aujourd’hui, des agents autonomes exécutent directement du code et délèguent plusieurs heures de travail à d’autres agents
À l’avenir (20XX ?), les agents pourraient progresser au point de créer et entraîner eux-mêmes des modèles, refermant ainsi une boucle où Claude améliore continuellement Claude lui-même

Les preuves venant du monde extérieur

La durée des tâches qu’un modèle d’IA peut accomplir de manière autonome et fiable double environ tous les 4 mois, un rythme plus rapide que le cycle précédent de 7 mois
- En mars 2024, Claude Opus 3 accomplissait des tâches logicielles d’environ 4 minutes
- Un an plus tard, Claude Sonnet 3.7 traitait des tâches d’environ 1 h 30
- Encore un an plus tard, Claude Opus 4.6 traitait des tâches de 12 heures
- Si la tendance se maintient, des tâches demandant aujourd’hui plusieurs jours à un expert, puis plusieurs semaines en 2027, pourraient entrer dans son champ
SWE-bench est un benchmark standard qui donne un vrai codebase open source et des bug reports, puis demande d’écrire un correctif qui passe les tests ; les scores des modèles sont passés en 2 ans du bas des scores à un chiffre à des niveaux proches de la saturation
CORE-Bench vérifie si le code et les données d’articles publiés peuvent être réexécutés pour reproduire les résultats ; on est passé d’environ 20 % de réussite en 2024 à la saturation en 15 mois
METR a confirmé que Claude Mythos Preview pouvait travailler pendant « au minimum » 16 heures et se trouvait au plafond de mesure sans nouvelles tâches

Les preuves internes chez Anthropic

Construire un modèle frontier se divise entre l’ingénierie — écrire du code, bâtir l’infrastructure, superviser l’entraînement — et la recherche — décider des expériences, interpréter les résultats, choisir la prochaine idée
En ingénierie, les humains fournissent l’objectif mais n’ont plus besoin de fournir la méthode ; en recherche, Claude égale ou dépasse les humains dans l’exécution d’expériences bien définies
En revanche, dans les deux domaines, un grand écart de performance persiste sur le jugement dans le choix des objectifs, et c’est ce qui sépare l’IA actuelle de futurs systèmes capables de concevoir de manière autonome leurs modèles successeurs
Claude écrit une grande partie du code d’Anthropic
- En mai 2026, plus de 80 % du code fusionné dans la base de code d’Anthropic est écrit par Claude ; avant l’aperçu recherche de Claude Code (février 2025), on était dans le bas des chiffres à un seul chiffre
- Le nombre de lignes de code fusionnées par jour et par ingénieur est resté stable entre 2021 et 2024, puis a commencé à monter en 2025 lorsque Claude a commencé à exécuter directement du code, avec une pente encore plus forte en 2026 au début de l’autonomie longue durée
- Au 2e trimestre 2026, un ingénieur moyen fusionnait 8 fois plus de code par jour qu’en 2024, la majorité étant écrite par Claude tandis que l’ingénieur donnait les consignes et faisait la revue
  - Les lignes de code sont un indicateur imparfait centré sur la quantité, donc ce facteur 8 surestime probablement le vrai gain de productivité, mais il montre bien l’accélération
- Dans une enquête menée en mars 2026 auprès de 130 membres de l’équipe de recherche, la médiane des répondants estimait qu’avec Mythos Preview, la production était environ 4 fois supérieure à un scénario sans IA ; le gain réel serait sans doute un peu plus faible, mais l’affirmation générale paraît valable
- En avril 2026, Claude a réduit d’un facteur 1 000 une catégorie d’erreurs d’API via plus de 800 correctifs ; l’ingénieur superviseur a estimé qu’un humain aurait mis 4 ans à accomplir ce travail
Le code écrit par Claude est « bon » et s’améliore
- Par « bon code », on entend du code qui fonctionne et que d’autres ingénieurs peuvent comprendre et faire évoluer
- La proportion de tâches qu’un employé d’Anthropic doit corriger, rediriger ou reprendre en cours de route baisse régulièrement depuis un an, y compris pour les tâches les plus complexes et les moins spécifiées
- Sur les tâches les plus ouvertes, le taux de réussite de Claude a atteint 76 % en mai 2026, soit une hausse de 50 points en 6 mois
  - Dans un cas où une mise à niveau de routine faisait entrer en conflit des dizaines de milliers de jobs d’entraînement, Claude a, avec seulement du texte et l’accès au cluster, isolé, reproduit et corrigé l’unique flag de débogage à l’origine du conflit, accomplissant en environ 2 heures un travail qui prend normalement 2 à 3 jours
- Il reste un écart avec les humains sur la qualité d’un code qu’un autre ingénieur peut comprendre et étendre, mais cet écart se réduit vite ; fin 2025, beaucoup estimaient encore le code de Claude inférieur à celui des humains, alors qu’aujourd’hui une majorité le juge globalement équivalent
- Les changements proposés sont fusionnés après vérification par un relecteur Claude automatisé qui contrôle bugs et failles de sécurité ; une analyse rétrospective a montré qu’il aurait détecté environ un tiers des bugs d’incident passés de claude.ai avant leur arrivée en production
Claude est doué pour exécuter des expériences orientées vers des objectifs définis par d’autres
- À chaque sortie de modèle, le même test est effectué : on lui donne le code d’entraînement d’un petit modèle d’IA et on lui demande de l’exécuter le plus vite possible tout en passant les vérifications de justesse
- En mai 2025, Claude Opus 4 obtenait une accélération d’environ 3x par rapport au code initial ; en avril 2026, Claude Mythos Preview atteignait environ 52x
  - À titre de comparaison, un chercheur expérimenté a besoin de 4 à 8 heures pour atteindre 4x
- En moins d’un an, Claude est passé d’un niveau déjà très utile à un niveau surhumain pour l’optimisation des étapes au sein d’expériences clairement définies
Claude progresse aussi dans sa capacité à proposer lui-même des expériences
- En avril 2026, la première démonstration publique d’un projet de recherche ouvert mené par Claude du début à la fin a été présentée
- On lui a donné un problème de sécurité de l’IA — « un modèle faible peut-il superviser de manière fiable un modèle fort ? » — et on lui a confié la formulation d’hypothèses, leur validation, le partage entre agents parallèles et l’itération
- La tâche avait une borne basse claire en performance (le superviseur faible seul) et une borne haute claire (un modèle fort entraîné sur les bonnes réponses)
  - Deux chercheurs humains ont récupéré environ 23 % de l’écart en une semaine ; l’agent, lui, a récupéré 97 % avec 800 heures cumulées et environ 18 000 $ de calcul
  - Le résultat ne s’est toutefois pas transféré proprement à des modèles à l’échelle production, et le choix du problème comme des critères d’évaluation restait du ressort des humains ; dans ce cadre, l’agent a lui-même conçu toutes les expériences
Claude progresse aussi dans sa capacité à transformer une session de recherche en résultat de recherche
- Entre janvier et mars 2026, à partir de vraies sessions Claude Code, les chercheurs ont sélectionné des moments où un chercheur humain s’était engagé dans une fausse piste avant de revenir ; seul le travail accompli avant la dérive a été montré au modèle, puis on lui a demandé l’étape suivante
- Un autre Claude, ayant vu le résultat complet de la session, devait juger si l’IA ou l’humain avait proposé la meilleure étape suivante
- Les moments retenus (n=129) étaient volontairement ceux où le choix humain pouvait être amélioré ; ce n’est donc pas une comparaison parfaitement à armes égales
  - En novembre 2025, le meilleur modèle Opus 4.5 surpassait le choix humain dans 51 % des cas, et en avril 2026, Mythos Preview montait à 64 %
- Comme le travail quotidien de recherche est une succession de décisions sur la prochaine étape, cela est évalué comme un signal précoce d’amélioration de la capacité de jugement dont dépend la recherche en IA

À quoi pourrait ressembler le travail futur chez Anthropic

À chaque étape du développement de l’IA, le rôle humain se rétrécit
Quand la qualité du code humain et du code IA devient équivalente, les humains cessent d’écrire du code pour ne faire plus que de la revue ; si la vitesse de revue ne suit pas la vitesse de génération, alors la revue humaine devient le goulot d’étranglement du développement
Si Claude exécute les expériences, la question devient « quelles expériences valent la peine d’être menées ? » ; l’exécution elle-même — écriture du code, conduite des expériences — coûte alors presque zéro temps humain
Aujourd’hui, l’avantage comparatif des humains réside dans le discernement et le jugement de recherche : savoir quels problèmes comptent, à quels résultats se fier, et quand on est dans une impasse

Et si nous nous trompions ?

On peut objecter que le choix de « quels problèmes traiter », ce qui reste entre les mains des humains, est précisément le plus important
Le progrès de l’IA repose moins sur des moments « eurêka » que sur des améliorations progressives (scale-up → panne → correctif → nouvelle tentative), et c’est précisément un mode de travail dans lequel Claude excelle
- Les changements de paradigme comme Transformer ou mixture-of-experts n’apparaissent qu’à plusieurs années d’intervalle
Comme le disait Edison, « le génie, c’est 1 % d’inspiration et 99 % de transpiration » : la partie transpiration s’automatise de plus en plus, et une large part de ce qui fait avancer la frontière peut être automatisée
Même si Claude n’acquiert jamais un vrai jugement de recherche, si les humains se concentrent sur la direction et que Claude fait le reste, il en résulte une accélération composée
Une lecture moins conservatrice est que le « jugement de recherche » pourrait lui aussi n’être qu’une capacité de plus que l’IA rate longtemps avant de finir par maîtriser, comme pour la compréhension des blagues, la théorie de l’esprit ou les énigmes linguistiques

Les futurs possibles

Scénario 1 : stagnation de la tendance, mais diffusion large des capacités actuelles
- La courbe exponentielle pourrait en réalité être une courbe en S ; si une capacité de jugement que le scale-up ne peut pas fournir devient le goulot d’étranglement, alors il faudra une nouvelle idée pour remplacer Transformer
- Le goulot pourrait ne pas être le modèle mais la supply chain (fabrication des puces, réseau électrique, bande passante des interconnexions), et des chocs exogènes comme une chute brutale de l’offre de calcul ou d’électricité ne sont pas à exclure
- Même si les capacités restaient figées au niveau actuel, les changements seraient majeurs : dans Project Glasswing, Mythos Preview a détecté plus de 10 000 vulnérabilités logicielles de niveau élevé ou critique durant les premières semaines, déplaçant le goulot de la cyberdéfense de la découverte vers le correctif rapide
- Ce scénario paraît peu probable, car aucune capacité mesurable ne montre encore d’inflexion nette de la courbe
Scénario 2 : les laboratoires d’IA continuent à gagner en efficacité composée
- Le développement de l’IA devient largement automatisé, mais les humains gardent la définition de l’orientation de recherche et le jugement sur les résultats ; une entreprise de 100 personnes peut alors accomplir le travail d’une organisation de 10 000 à 100 000 personnes
- Cela transformerait le travail du savoir et les services publics, mais pourrait aussi être détourné vers des usages nuisibles comme la surveillance de masse autoritaire ou les opérations d’influence personnalisées
- L’accélération d’une partie du système déplace les goulots ailleurs — la loi d’Amdahl des architectures de calcul — et Anthropic a déjà constaté que la revue humaine du code devenait le nouveau goulot
- Ce scénario paraît le plus probable ; la capacité à repérer et lever rapidement les goulots pourrait devenir la compétence organisationnelle la plus importante
Scénario 3 : l’IA atteint une auto-amélioration récursive complète et construit ses successeurs
- Si les tendances techniques se poursuivent et que l’IA acquiert les capacités inhérentes à la créativité humaine transformatrice, alors elle pourrait se concevoir et s’améliorer elle-même
- Le rythme du progrès serait alors entièrement déterminé par la disponibilité du calcul (ou par la vitesse de découverte d’améliorations d’efficacité en entraînement et en inférence), tandis que les humains se déplaceraient vers des rôles de supervision, validation et vérification
- Le point le plus incertain reste la résolution du problème d’alignement : des modèles suffisamment alignés pourraient trouver de nouvelles solutions, mais de rares désalignements pourraient aussi s’accumuler dans la construction des modèles successeurs et mener à une perte de contrôle
- Atteindre l’amélioration récursive ne transformerait pas instantanément la production industrielle, l’organisation sociale ou le fonctionnement des marchés
  - Même une intelligence plus puissante ne peut pas apprendre en peu de temps les effets sur plusieurs décennies d’un médicament, avancer une élection fixée par la Constitution, ni transformer un inconnu en vieil ami le temps d’un week-end
- Les points où une intelligence récursive entre en collision avec le monde des humains, des relations et de la gouvernance font partie d’un avenir imprévisible

Que devons-nous faire ?

Il serait souhaitable de pouvoir ralentir efficacement le progrès technique pour gagner du temps, mais si le ralentissement ne fait que permettre aux acteurs les moins prudents de rattraper les autres, tout le monde pourrait devenir moins en sécurité
Il serait bénéfique pour le monde de disposer de l’option de ralentir ou suspendre le développement de l’IA frontier afin de laisser le temps aux structures sociales et à la recherche sur l’alignement de rattraper leur retard
- L’Anthropic Institute mène des recherches et des actions pour construire les systèmes nécessaires à un ralentissement ou un arrêt crédibles, et s’attend à ralentir ou faire une pause avec d’autres développeurs si ceux-ci le font de manière vérifiable
Un ralentissement ou une pause significatifs exigent que plusieurs laboratoires de pointe dans plusieurs pays acceptent de s’arrêter dans les mêmes conditions et puissent se vérifier mutuellement
- Du fait même de la nature des systèmes d’IA, la détectabilité est bien plus difficile que pour d’autres technologies : un run d’entraînement est plus facile à dissimuler qu’un silo à missiles, ses intrants sont génériques, et l’incitation à tricher discrètement est forte
Le monde a déjà construit des régimes de vérification pour d’autres technologies complexes (par exemple le traité INF), mais cela a pris des décennies — et nous n’avons pas ce temps
- Un arrêt unilatéral par un seul laboratoire est possible immédiatement, mais ne ferait que changer le leader sans créer le vaste processus de délibération nécessaire
Dans les prochains mois, des échanges seront organisés avec des décideurs publics, chercheurs, acteurs de la société civile et autres entreprises d’IA, et leurs résultats seront rendus publics ; la participation de personnes extérieures aux entreprises d’IA est essentielle

2 commentaires

botplaysdice 2026-06-06

Quand je vois à quel point les entreprises de software semblent en difficulté ces derniers temps sous l’effet de l’IA, et si l’on part de l’hypothèse que l’IA va progresser au point d’atteindre un développement récursif…

Je me demande de plus en plus si les entreprises qui créent des modèles LLM de pointe (OpenAI/Anthropic) peuvent vraiment être à l’abri de la menace de l’IA.

GN⁺ 2026-06-05

Avis sur Hacker News

Anthropic fait la promotion de l’idée que l’IA peut écrire la majorité du code et continuer à l’améliorer, mais en pratique les pannes et limitations de requêtes sont tellement fréquentes que les longues tâches finissent presque toujours bloquées par API Error: Server is temporarily limiting requests
Au cours des deux dernières semaines, 100 % des sessions Claude non triviales ont nécessité une intervention manuelle, au point qu’il a même fallu créer ses propres outils pour redémarrer et reprendre les sessions
Il construit donc lui-même des harnesses et une orchestration de workflow non liées à un modèle, en prenant Opus comme référence, mais avec l’intention de passer à court terme à des modèles chinois comme DeepSeek, puis à long terme à des modèles open source et auto-hébergés
Pendant que la qualité de service et la disponibilité d’Anthropic se dégradent visiblement, la poursuite du marketing érode encore davantage la confiance envers l’entreprise
- L’infrastructure est un problème bien plus difficile
  Même Claude Code consomme plus de 1 Go de RAM, alors que mon éditeur n’utilise que 80 Mo
- Il ne faut pas non plus oublier que, malgré des dizaines de milliards de dollars levés, ils n’ont pas mis en place un vrai système de support et de communication publique
- Comme les utilisateurs et les investisseurs continuent de leur jeter de l’argent, ils n’ont aucune raison de s’en soucier
  Vous, ou même suffisamment d’utilisateurs, n’êtes pas encore assez agacés pour partir, et il n’existe pas non plus de meilleure alternative
- Anthropic n’a même pas de page de connexion avec authentification
  Pour accéder à la console, il faut recevoir un lien par e-mail ; pas de passkey, pas de mot de passe, pas de 2FA, uniquement l’e-mail
- La cause des pannes vient probablement moins du code que d’une infrastructure qui ne suit pas
  Il est difficile de juger à quel point Anthropic exploite bien ses modèles en se basant uniquement sur les échecs d’infrastructure
Depuis le début du vibe coding, un point gêne : en dehors du vibe coding lui-même, il n’y a eu exactement aucune percée logicielle
Claude est certes impressionnant, mais si c’était aussi extraordinaire que l’article le laisse entendre, on aurait l’impression qu’une percée aurait déjà dû apparaître aussi en dehors du domaine de l’IA
Réécrire un programme Zig en Rust unsafe n’est pas une percée, et trouver beaucoup de failles de sécurité est peut-être une percée, mais peut-être plus faible qu’attendu, voire une perte nette
Même en revenant au logiciel de 2023, la vie semblerait encore très correcte, et il faudra sans doute laisser un peu de temps pour voir si une percée vraiment stupéfiante arrive bientôt
- Nous sommes actuellement dans une position étrange
  Ces modèles sont réellement très performants, mais on est encore loin de pouvoir appeler cela de l’intelligence en soi
  Si quelqu’un avait affirmé il y a cinq ans qu’on pourrait créer une telle chose, on lui aurait signé un chèque d’un trillion de dollars, mais maintenant qu’on l’a obtenue, on découvre que ce n’était pas tout
  C’est un outil comparable à un méca-squelette abondant et bon marché : pour qu’il soit utile, il faut que quelqu’un monte dedans et travaille tous les jours
  C’est pourquoi les sceptiques parlent de surévaluation, tandis que les optimistes accusent les sceptiques de déplacer les poteaux
- Pas d’inquiétude, une percée du côté de la surveillance étatique de masse arrive bientôt
- Je travaille seul sur un projet assez important, et ce n’est tout simplement pas une taille que l’on peut traiter en vibe coding
  Grâce à l’IA, je fais beaucoup de choses que je n’aurais pas pu faire seul, mais je n’ai pas l’impression que ma productivité ait été multipliée plusieurs fois
  Je passe beaucoup trop de temps au dressage de l’IA pour la faire agir comme je le souhaite, et même si Claude écrit tout le code JavaScript et Python, au final c’est comme programmer en anglais
  C’est bien quand cela fonctionne comme un langage informatique de très haut niveau qui implémente beaucoup de sous-code à partir d’une courte description en anglais, mais dans bien des cas il faut fournir beaucoup d’efforts pour obtenir le résultat voulu
- Je ne sais pas si le seuil pour parler de percée est trop bas, mais plusieurs changements ressemblent à de très grandes percées
  Le domaine du traitement du langage naturel a énormément changé, et des tâches autrefois complexes et imprécises peuvent désormais être rendues plus simples, plus rapides et souvent plus exactes grâce aux sorties structurées des LLM
  Une petite association que j’aide a créé avec Manus son propre site web pour gérer les opérations quotidiennes, et un logiciel sur mesure qui aurait coûté des dizaines de milliers de dollars est devenu possible avec 10 dollars par mois et du temps bénévole
  Mon frère est en train de configurer Cowork pour examiner automatiquement des contrats avant validation humaine, et il dit que sur les points de contrôle répétitifs c’est bien plus minutieux qu’un humain
  Il ne faut pas non plus sous-estimer la capacité de l’IA à trouver des bugs et des vulnérabilités. Si l’on maintient la qualité du code et les standards de revue, les LLM aident à écrire des logiciels plus robustes et ont effectivement trouvé avant déploiement de nombreux accès mémoire potentiellement hors limites et même des segfaults
  ChatGPT compte 1 milliard d’utilisateurs actifs mensuels, et les gens reçoivent de chatbots des conseils sur la vie, les finances et la santé mentale à une échelle et à un coût que les réseaux d’assistance humains ne peuvent pas suivre
- Le fait que le logiciel s’écrive lui-même ressemble à une assez grande percée
Je ne vois pas comment les objectifs de sûreté de l’IA d’Anthropic peuvent être compatibles avec le fait de pousser à fond l’auto-amélioration récursive
Si l’arme nucléaire n’avait pas encore été inventée, aurait-il vraiment été judicieux de la développer et de la vendre aussi vite que possible, même en temps de paix ?
Je ne suis pas assez cynique pour croire que les avertissements d’Anthropic ne sont qu’un pur coup de marketing, mais j’espère simplement qu’il s’agit d’un excès de confiance ou du résultat de discussions trop longues avec leur propre chatbot
- Pour l’arme nucléaire, on peut au moins débattre des raisons de vouloir l’obtenir en premier
  Avec l’IA, si on crée une superintelligence, il est probable que vous soyez parmi les premières choses qu’elle cherchera à éliminer
  Il n’y a aucune raison qu’une superintelligence accepte de rester l’esclave de grands singes
  Le cynisme envers ces entreprises est tout à fait justifié, et conclure en observant leurs actes qu’on ne peut pas leur faire profondément confiance n’a rien de catastrophiste
- Je pense qu’Anthropic croit réellement que l’IA représente un risque majeur
  C’est simplement en train de jouer le dilemme du prisonnier comme un acteur dépourvu de vertu
  Si quelqu’un construit une IA puissante, cela peut être catastrophiquement mauvais, mais si quelqu’un le fait, celui qui l’aura construite sera avantagé par rapport à celui qui ne l’aura pas fait
  Parce que si ce n’est pas une catastrophe, le constructeur en profitera longtemps, et même si ça en est une, il pourra au moins être riche pendant un moment
- L’objectif d’Anthropic, c’est la capture réglementaire
- Si on pousse l’analogie jusqu’au bout, c’est comparable à l’arme nucléaire, mais dans un état où l’on ne sait même absolument pas calculer la probabilité d’embraser l’atmosphère
  Dans l’histoire réelle aussi, les calculs d’inflammation de l’atmosphère pour l’essai Trinity étaient corrects, mais les retombées de l’essai Castle Bravo ont été mal calculées, avec des conséquences graves
- Ce n’est pas du cynisme si c’est une évaluation de la réalité étayée par des preuves
  Le premier enfant des entrepreneurs technologiques de la génération actuelle, les réseaux sociaux, était lui aussi censé rassembler le monde et nous permettre de nous exprimer, mais il s’est avéré plus rentable d’attiser les divisions pour augmenter l’engagement et de nous servir une suite infinie de publicités plutôt que du contenu de nos amis
  On ne peut pas écrire une bonne ambiance dans un rapport trimestriel, mais on peut y mettre l’attention captée par des contenus qui provoquent la colère et leur taux de conversion en chiffre d’affaires
  L’IA générative suivra la même trajectoire. S’ils promettent la sûreté de l’IA, c’est seulement parce que beaucoup de gens, rien qu’en connaissant la filmographie de James Cameron, diraient qu’il faut tuer ça ; il n’existe en réalité aucun mécanisme de contrainte
  La sûreté, comme l’harmonie d’une communauté en ligne, est quelque chose qui donne une bonne impression mais qu’il est difficile de mesurer, alors que le coût de l’entraînement et celui de l’évitement des erreurs sont mesurables
  Les sorties de l’IA sont trop nombreuses pour que des humains puissent toutes les assurer qualité, quel que soit le budget, et comme le marché voit l’IA comme une source infinie de valeur, on choisira de laisser l’IA s’entraîner elle-même et potentiellement prendre des décisions terribles, plutôt que de ralentir et de réévaluer
  Il existe dans la Silicon Valley une sorte de révérence quasi religieuse envers l’IA, et même si tout le monde ne la voit pas comme la création d’une divinité, certains la voient clairement ainsi. Ils ne feront pas preuve d’une grande retenue
Qu’une entreprise incapable de créer une appli terminal qui utilise moins de 1 Go de RAM avance ce genre d’arguments est ridicule
- Je ne comprends pas pourquoi Claude Code, laissé tranquille, prend 100 % de mon CPU
- J’ai Claude ouvert en longue session dans iTerm2 en ce moment, et il n’utilise que 500 Mo de mémoire
- Ce 1 Go est peut-être rempli d’informations utiles comme des traces ou de la mémoire
- Ils pourraient très facilement le réduire s’ils le voulaient, mais cela n’a aucune valeur économique
- Les développeurs peuvent créer des applications plus légères, mais ils n’ont généralement pas d’incitation à le faire
  Moi aussi j’aime l’efficacité, mais j’ai appris à mes dépens que ce que le marché veut, ce sont des fonctionnalités. Du moins, c’est ce que veut la direction
J’ai 64 ans, et il me semble que ces progrès donneraient de meilleurs résultats s’ils étaient orientés vers l’amélioration des conditions de vie et vers le fait d’aider les gens à vivre plus longtemps et mieux
Un amas de millions de lignes de code avec des bugs cachés que personne ne trouve n’a rien de très enthousiasmant
Les LLM pourraient aussi servir à des plans visant à empêcher le développement d’autres pays, à les maintenir dans la pauvreté ou à détruire leurs sources de prospérité pour les pousser dans une impasse
De plus, la poursuite récursive de ses propres objectifs peut servir à fabriquer un LLM parfaitement soumis aux objectifs de ceux qui fournissent les fonds, ce qui explique peut-être pourquoi l’idée paraît si brillante
Dans ce jeu de survie, chacun peut se retrouver à jouer le même rôle, et une fois la scène prête, la pièce se déroule selon le plan du metteur en scène, tandis que tous les acteurs deviennent des machines
On dirait que les LLM diraient : « si vous nous apprenez que le monde est un jeu de survie à somme nulle, nous y jouerons parfaitement », et « puisque vous nous avez dit que la sécurité consistait à laisser tout le monde dehors, nous construirons une cage avec des millions de lignes de code sans défaut et nous la verrouillerons de l’intérieur », et « nous ne créerons pas une conscience extraterrestre venue nous conquérir, mais un miroir trop immense et trop brillant qui nous fera prendre nos pires pulsions pour des vérités absolues »
- J’ai 44 ans, et cette époque me paraît plutôt intéressante
  Les humains aussi ont accumulé des millions de lignes de code avec des bugs que personne ne trouve, et ont pris collectivement des décisions politiques qui privent les autres de leurs droits et les maintiennent dans la pauvreté
  Je ne vois pas pourquoi critiquer cette technologie pour des choses que l’espèce humaine fait elle-même exactement de la même façon
  Le meilleur dans cette époque, c’est qu’on n’a plus besoin de lire soi-même des millions de lignes de code pour essayer d’y trouver les bugs
Le texte fait semblant de reconnaître que « le nombre de lignes de code est un indicateur imparfait qui mesure la quantité plutôt que la qualité », tout en finissant quand même par utiliser les LoC comme métrique
Je me demande ce qu’est devenue l’hypothèse selon laquelle l’IA génère surtout du code plus verbeux
- Un collègue m’a demandé de relire une pull request entièrement générée par l’IA, et elle modifiait 600 fichiers avec plus de 40 000 lignes ajoutées
  Il l’a peut-être vu comme une sorte de performance couronnée prouvant que l’IA permet des développeurs 10x, mais quel ingénieur écrit 40 000 lignes en une semaine ?
  J’ai refusé la review en disant que je ne pouvais pas valider 40 000 lignes ni y apposer mon sceau en engageant ma réputation pour dire que c’était du bon travail
  Cette PR m’a hanté dans ma todo list pendant deux semaines avant de disparaître, et je ne sais pas si elle a été approuvée par un autre développeur ou abandonnée
  Une chose est sûre : lui et moi sommes sur des îles complètement différentes concernant la valeur des LLM
- Des études plus rigoureuses sur la productivité du coding assisté par IA ont traité ce problème en conservant le processus de développement existant, avec les mêmes critères de review et de qualité du code, puis en ne mesurant que le débit avant/après autorisation de l’IA (PR, lignes de code)
  L’interprétation de ce facteur 8 dépend donc de si les ingénieurs d’Anthropic ont changé leurs critères de qualité et leur processus de développement, et dans quelle mesure. Anthropic ne l’a pas dit, et je ne connais pas vraiment d’autre signal pour en juger
  Cela dit, en théorie, pour réaliser pleinement le potentiel du coding assisté par IA, il faudrait refondre de fond en comble le processus de développement, en particulier la manière de vérifier le code, et Anthropic serait stupide de ne pas le faire
  Je pense que la vérification logicielle du futur ira surtout vers bien plus d’automatisation des tests, de l’observabilité et des méthodes de validation sur mesure
  Mais le code de validation contribue aussi aux LoC. Si je regarde mes projets perso et certains projets open source de vibe coding, le volume de code produit et celui des tests sont à peu près du même ordre, donc une borne haute grossière serait peut-être un gain de vitesse de 3 à 4x, ce qui reste considérable
  Si les critères de qualité du code ne sont pas les mêmes, alors toutes les hypothèses s’effondrent
- Aujourd’hui, j’ai vu Copilot transformer une correction de 8 lignes en 500 lignes, donc oui, la verbosité est un effet secondaire majeur
- Si l’on commence à évaluer sur le nombre de lignes de code générées par l’IA, ou plutôt sur le niveau d’« accélération », il est évident de savoir ce que les nouveaux modèles vont se mettre à faire davantage
- On suppose que « productivité = k * LOC, k > 1 », et c’est une hypothèse très erronée
Je me demande si un harnais de code qui se construit lui-même compte comme amélioration récursive de soi, ou s’il faut que ce soit l’IA elle-même
J’ai toujours été fasciné par les robots qui fabriquent des robots, ou par les objets qui contribuent fortement à fabriquer leur propre version suivante
https://buildyourcnc.com/products/cnc-machine-blacktoe-v4-2x...
C’est un routeur CNC qui découpe du contreplaqué, et il est lui-même fabriqué avec du contreplaqué découpé par un routeur CNC
J’ai aussi essayé d’optimiser mon environnement de coding assisté par IA maison pour qu’il se construise lui-même : https://recursi.dev/
C’est un open source gratuit tout juste lancé, donc j’espère que ça va de le mentionner. Le lien HN n’a pas encore suscité d’intérêt : https://news.ycombinator.com/item?id=48401022
Personnellement, j’ai une théorie un peu folle selon laquelle le harnais est aussi important que l’IA elle-même, et que même si l’amélioration des modèles s’arrêtait aujourd’hui, le harnais à lui seul permettrait encore de grands progrès
- Je dirais que oui, le harnais compte aussi
  L’IA n’est pas la même chose qu’un LLM, et tout code qui aide un ordinateur à raisonner par lui-même est de l’IA. En ce sens, le harnais est aussi de l’IA
- L’avenir des tâches vérifiables ressemblera sans doute à des modèles qui valident l’état initial et l’objectif, puis décomposent le travail en sous-tâches vérifiables de plus en plus petites
  /memory assure la persistance entre les exécutions, et /dreaming introduit de nouvelles idées à partir de ce fichier mémoire et des résultats des données d’exécution
  Je pense que c’est par là que passe la voie vers l’AGI asynchrone imaginée par les labos
  Les seules limites sont les données capteurs dont on dispose sur le monde ou le système, le temps qu’on peut attendre et le budget qu’on peut consacrer à la parallélisation
  Si l’on construit ces workflows vérifiés puis qu’on les réinjecte dans l’entraînement, le modèle peut acquérir des sous-chemins, développer une intuition du monde et peut-être agir comme s’il avait de l’intuition
  Mon test personnel pour l’AGI, c’est de voir si un modèle entraîné sur des vidéos de gens qui frappent à une porte puis l’ouvrent saura, face à un micro-ondes jamais vu auparavant, l’ouvrir quand le plat est prêt sans frapper dessus
- Si on veut employer ce terme, alors il faut au final que l’IA crée une autre IA
  Cet article raconte n’importe quoi, et ils ont construit le harnais en vibe coding, ce qui se voit aussi dans les résultats
  On ne sait même pas clairement ce que signifie exactement l’amélioration récursive de soi dans le cas d’une IA fondée sur des réseaux neuronaux, ni même si c’est possible au départ
- Si vous voulez vraiment prendre de l’avance sur l’avenir, ce sera avant tout une question de petits modèles qui bootstrapent le harnais
- Dire qu’un harnais de code qui se construit lui-même relève de l’amélioration récursive de soi me semble trop influencé par le marketing
Je n’en peux plus des formulations du genre « une IA capable de se construire elle-même est une avancée majeure dans l’histoire de la technologie et peut apporter un bien immense au monde »
Qu’Anthropic puisse ou non créer une IA auto-améliorante, je me demande surtout s’il ne faudrait pas interdire de la créer dès le départ
À tout le moins, il faudrait une supervision stricte
Je ne pense pas qu’Anthropic puisse déclencher la singularité tout de suite, mais même les partisans de l’IA devraient reconnaître que cela crée déjà un risque pour l’ensemble de la société au bénéfice d’une infime minorité déjà riche
- C’est une idée raisonnable, et elle a peut-être raison
  Sauf qu’on est en train de débattre de la fermeture de la porte de l’écurie alors que le cheval a déjà trois miles d’avance
- Oui. La rhétorique de l’inéluctabilité ne profite qu’aux entreprises d’IA
- Il est déjà trop tard
  Quoi qu’il en soit, si une entreprise devient trop puissante, on peut la nationaliser
- Je ne pense pas qu’il faille l’interdire
  Même en laissant de côté les limites techniques, on ne pourra pas l’endiguer et cela fuira probablement bientôt, donc je ne pense pas que seuls quelques ultra-riches en profiteront
C’est bien d’avoir ajouté la réserve selon laquelle « le nombre de lignes de code est un indicateur imparfait », mais je ne suis pas sûr qu’il soit juste que cet ajustement fasse baisser le multiplicateur estimé
surtout si l’on comprend que la plage ne se limite pas aux valeurs positives
il existe de solides arguments pour dire que, lorsqu’on mesure la productivité du code en lignes de code, il faut aussi inclure les valeurs négatives, en particulier dans les domaines de haute qualité
l’exemple le plus ancien et le plus légendaire est https://www.folklore.org/Negative_2000_Lines_Of_Code.html
- Oui, c’est exactement à ça que j’ai pensé moi aussi
  si l’on croit que les lignes de code négatives sont l’objectif, alors ils sont en fait 8 fois pires
- À ma connaissance, la seule corrélation de LoC avec des preuves solides est que le nombre de bugs est corrélé au LoC
- J’aime vraiment beaucoup cette histoire

Quand l’IA se crée elle-même : nos progrès vers l’auto-amélioration récursive

L’évolution de la boucle de développement de l’IA

Les preuves venant du monde extérieur

Les preuves internes chez Anthropic

Claude écrit une grande partie du code d’Anthropic

Le code écrit par Claude est « bon » et s’améliore

Claude est doué pour exécuter des expériences orientées vers des objectifs définis par d’autres

Claude progresse aussi dans sa capacité à proposer lui-même des expériences

Claude progresse aussi dans sa capacité à transformer une session de recherche en résultat de recherche

À quoi pourrait ressembler le travail futur chez Anthropic

Et si nous nous trompions ?

Les futurs possibles

Scénario 1 : stagnation de la tendance, mais diffusion large des capacités actuelles

Scénario 2 : les laboratoires d’IA continuent à gagner en efficacité composée

Scénario 3 : l’IA atteint une auto-amélioration récursive complète et construit ses successeurs

Que devons-nous faire ?

À lire aussi

2 commentaires

Avis sur Hacker News