Aspirer à l’AGI avec Claude Code

(kadekillary.work)

3 points par GN⁺ 2025-06-17 | 1 commentaires | Partager sur WhatsApp

Présentation d’un point de vue sur la possibilité d’accéder à l’intelligence artificielle générale (AGI) via Claude Code
Partage des impressions de l’auteur à partir de véritables sessions de code avec Claude
Mise en avant du niveau atteint par Claude en programmation, en connaissances étendues et en créativité
Mention du fait que la compréhension du contexte et l’interprétation du code de Claude le distinguent des outils existants
Anticipation des répercussions techniques sur l’évolution des façons de développer et d’utiliser l’intelligence artificielle

Introduction

Cet article rassemble les réflexions de l’auteur sur l’approche d’une intelligence artificielle générale de niveau humain (AGI) après avoir expérimenté la programmation avec Claude Code
Parmi les outils d’IA conversationnelle récents, l’auteur a ressenti un fort choc et une vive excitation face aux résultats montrés par Claude

Expérience de session de programmation avec Claude

Claude est capable de résoudre rapidement et de manière créative des demandes de programmation complexes
Au-delà des calculs simples ou des tâches répétitives, il peut saisir la nature profonde d’un problème et proposer de nouvelles approches
L’auteur a confié à Claude des tâches difficiles comme l’optimisation, l’amélioration de structure et le refactoring de code, et a été profondément impressionné par la qualité du travail fourni
Claude a montré une compréhension du contexte supérieure à celle des LLM existants, allant jusqu’à saisir l’intention du code

Ce qui distingue Claude Code

Contrairement aux IA conversationnelles généralistes, Claude peut non seulement écrire du code, mais aussi assumer des rôles de développeur humain comme la compréhension de la structure globale d’un projet, la revue de code et l’explication d’intentions à long terme
Il est capable de fournir des explications détaillées, d’écrire des tests, et de s’adapter à divers langages et paradigmes de programmation
Il fait preuve de capacités proactives, comme repérer des erreurs logiques dans le code ou proposer des pistes d’amélioration

Perception d’un seuil vers l’AGI

Après son expérience avec Claude Code, l’auteur dit avoir acquis une nouvelle conviction quant à la possibilité d’atteindre une AGI désormais plus proche du réel
Il estime qu’en passant d’un mode où les humains créent directement les logiciels à un environnement de développement piloté par l’IA, un changement concret est imminent

Conclusion et perspectives

Claude Code n’est pas simplement un outil d’intelligence artificielle de plus, mais montre le potentiel de transformer le paradigme même de l’usage de l’IA
À l’avenir, humains et IA pourraient concevoir et implémenter ensemble des programmes, ouvrant la voie à une culture du développement logiciel encore plus innovante

1 commentaires

GN⁺ 2025-06-17

Avis de Hacker News

Je suis biaisé [0], mais je pense qu’il faut scripter autour d’agents open source non dépendants d’un LLM
Cette technologie est en train de changer les fondations du développement logiciel, donc nous devons pouvoir continuer à contrôler notre façon de travailler.

[0] https://github.com/all-hands-ai/openhands
- Ça a l’air d’être une bonne ressource. Il existe des modèles assez puissants qu’on peut faire tourner sur une Nvidia 4090 24 Go, et il y a aussi Devstral et Qwen 3.
  Avec Ollama, on peut les exécuter facilement sur son propre matériel, mais le coût du GPU est un gros investissement. Cela dit, si vous payez 250 dollars par mois pour des outils propriétaires, vous pouvez rentabiliser assez vite.
- Et si les modèles fermés étaient tout simplement meilleurs ?
L’article part un peu dans tous les sens. D’abord, un jeu de slides n’est pas très utile pour expliquer une base de code.
Ce n’est pas pour rien que les gens utilisent rarement des jeux de slides en dehors d’un support de présentation orale. La plupart de ce qui est décrit dans l’article n’est pas une nouvelle capacité, et l’automatisation de workflows a clairement de la valeur et est chouette, mais je ne vois pas ce que l’AGI vient faire là-dedans.
- En plus, ça n’inspire pas confiance. Je crois que l’article en parle un peu aussi, je n’ai fait que le survoler.
  On ne devrait pas avoir besoin d’un LLM pour comprendre une base de code. Il suffit de la rendre plus compréhensible. Bien sûr, le capital aime les raccourcis et les hacks pour sortir la prochaine fonctionnalité au T3.
- Là où les LLM m’ont été les plus utiles, c’est pour créer des diagrammes mermaidjs du code.
  Je sais que ce n’est pas toujours parfait, mais plusieurs fois c’était « suffisamment correct », et ici je n’ai jamais vu d’hallucinations, seulement des omissions. Quand on voit qu’il manque quelque chose, il est aussi très facile de lui demander de corriger.
- Au ton de l’article, on dirait qu’il emploie AGI sur le mode de la blague et ne se prend pas trop au sérieux, ce qui est rafraîchissant.
  Bien sûr, ça ne serait pas rafraîchissant si l’article ne contenait rien d’utile, mais je pense qu’un jeu de slides peut effectivement aider à comprendre une base de code. C’est un « nice to have » auquel on n’a pas envie de faire consacrer du temps à un junior, mais si pour environ 5 dollars on obtient quelque chose d’un peu utile, c’est plutôt pas mal.
  Une partie du changement de perspective lié à l’usage des LLM consiste à réexaminer des choses qu’on détestait autrefois parce que l’effort était trop élevé par rapport à la valeur. Si je n’ai pas à le faire moi-même ni à brûler le temps et le mental d’un membre de l’équipe, je peux me dire : « OK, parcours la base de code et écris toutes les fonctionnalités et exigences dans un document Markdown sous forme de tableau. Ça marchera peut-être mieux que prévu, sinon on fera autre chose. »
Bon article. J’utilise des observations et techniques similaires, et Claude Code est exceptionnellement bon.
Ces jours-ci, grâce à git worktree, je mène plusieurs tâches en parallèle la plupart du temps, et chacune avance tellement plus vite qu’avant que c’en est vraiment étrange.
Sur la partie « sous-agent », je dois reconnaître que la configuration où Claude Code appelle o3 via sigoden/aichat m’a sauvé un nombre incalculable de fois.
Il y a des problèmes où o3 est particulièrement bon : les conditions de concurrence, la recherche de bugs, tout ce qui demande beaucoup de contexte et une capacité de raisonnement très élevée.
Cela dit, je l’utilise moins depuis la sortie d’Opus 4, et bien sûr ce n’est pas du tout la même chose qu’un sous-agent.
J’inclus ce prompt dans mon CLAUDE.md principal avec @include : https://github.com/pgflow-dev/pgflow/blob/main/.claude/advan...

sigoden/aichat : https://github.com/sigoden/aichat
- Attends, quoi ? Comment tu fais plusieurs choses en parallèle avec git worktree ?
Le terminal semble être une interface presque parfaite pour les LLM. Je me demande si cette approche sera préférée aux intégrations IDE sur mesure.
- Oui. Il peut accéder littéralement à tout, y compris aux serveurs MCP. C’est vraiment pratique que Claude Code puisse consulter une base de données avec un utilisateur en lecture seule, ou ouvrir un navigateur Puppeteer pour vérifier si un changement CSS a l’air bizarre.
  C’est une interface parfaite, et Anthropic l’a bien conçue.
  Il peut aussi déboguer mon cluster k8s avec des commandes kubectl et consulter Prometheus via l’API ; c’est quand même génial.
- Dans une certaine mesure, oui, mais je pense que l’avenir des LLM consistera à lancer en parallèle 5 tentatives distinctes pour produire un correctif, parce que le temps LLM est moins cher que le temps humain.
  Quand cet élément entrera dans le workflow, on voudra lancer plusieurs conteneurs, et l’avantage du terminal s’affaiblira.
- À mesure que les modèles s’amélioreront, l’IDE ressemblera à un outil de bas niveau.
- Pardon ? Le terminal est littéralement la pire interface.
  Vous ne voulez pas modifier le code vous-même après sa génération ?
Demander d’expliquer le borrow checker de Rust est l’un des pires exemples possibles pour démontrer une capacité à lire du code. Il y en a des montagnes dans les données d’entraînement.
- D’accord. Si on lui demande d’expliquer comment les exceptions sont gérées dans les tâches asyncio de Python, même en lui donnant tout le code, il part dans tous les sens comme le pire stagiaire du monde.
  En plus, il n’y a pas de moyen de « l’enseigner », et même s’il y en avait un, cela ne persisterait pas au-delà du contexte courant.
  Pour des tâches importantes mais relativement simples, c’est une perte de temps totale.
- La plainte « il y en a des montagnes dans les données d’entraînement » est étrange.
  Si quelqu’un m’explique le borrow checker de Rust, dois-je refuser de lui accorder du crédit parce qu’il a déjà lu des explications du borrow checker et me plaindre que « c’était dans les données d’entraînement » ? Pensez-vous vraiment comprendre le borrow checker sans l’avoir appris d’une manière ou d’une autre ?
  Je comprends à peu près le propos. Il n’y a pas beaucoup de preuves que ce genre d’outil puisse produire des idées nouvelles, et comme il possède une masse énorme de connaissances, il est difficile de détecter ce phénomène. Mais, en pratique, même dans le cadre des hallucinations, c’est utile et ça aide, donc je ne m’en soucie pas vraiment.
Si l’attention aux détails est l’un des meilleurs signes qu’on se soucie du travail artisanal, le fait que les conditions juridiques d’Anthropic soient logiquement impossibles à satisfaire n’est-il pas un mauvais signe pour leur faire confiance comme gestionnaires prudents de l’ASI ?
Si on ne peut pas l’utiliser au travail sans violer l’interdiction d’usage concurrentiel, il est difficile de dire que c’est « sûr au niveau des trois lois de la robotique ».
- Je ne sais pas pour le service juridique, mais le produit, Claude Code, montre des signes d’une attention généreuse aux détails.
  Ils vont jusqu’à lancer Haiku dans le contexte pour créer des verbes mignons et appropriés pour l’indicateur « working… ».
claude --dangerously-skip-permissions # science mode

Ça m’a fait rire
Je suis d’accord. Claude Code me semble plus puissant que Cursor, et l’une des raisons paraît être sa scriptabilité
Au fond, Cursor est un éditeur, tandis que Claude Code est un couteau suisse sous stéroïdes
J’utilise beaucoup Claude Code en dehors des bases de code traditionnelles. Je le lance pour toutes sortes de tâches dans mon coffre Obsidian, je lui fais écrire des scripts pour des raccourcis clavier locaux personnalisés qui téléversent des captures d’écran sur mon CDN et renvoient un lien Markdown, ou encore des programmes qui communiquent avec Ollama pour résumer mes commandes de terminal de la journée écoulée
Avant, je devais me demander si ça valait la peine d’écrire un script pour modifier un format de fichier, ou si je devais le faire à la main ; maintenant, je lance simplement Claude dans le répertoire concerné et je le laisse s’en charger. C’est vraiment utile pour plein de choses
- Le problème, c’est que Claude Code ne fonctionne qu’avec un abonnement
  On ne peut pas l’utiliser via l’API, donc je me demande vraiment si 100 dollars par mois suffisent. Je l’utilise désormais toute la journée, tous les jours, et j’ai l’impression de consommer bien plus que les 100 dollars que je paie
- Je suis vraiment curieux de savoir à quoi tu l’utilises dans ton coffre Obsidian
- Comment fais-tu du scripting avec Claude Code ? Je l’ai utilisé en CLI, mais je n’avais pas pensé à appeler Claude Code depuis un script ; ça a l’air assez intéressant
- Il y a quelques jours, j’ai demandé à un LLM d’organiser une énorme quantité de mes notes en dossiers de catégories. Mon Dieu, ça m’a vraiment aidé
Au passage, le contraste entre le fond et le texte ici rend la lecture vraiment pénible
- Dans mon cas, c’est à cause du curseur clignotant tout en haut. Difficile de se concentrer sur le texte
- On peut simplement passer son chemin, on ne rate pas grand-chose
Ici comme ailleurs, toujours aucune mention d’Opus
Après avoir essayé un peu de tout, j’ai fini par prendre l’abonnement “Max” à 100 dollars par mois d’Anthropic pour utiliser Claude Code. Puis j’ai découvert que Claude Opus 4 était, dans ma situation actuelle — code mathématique et recherche — le meilleur modèle, mais aussi le plus cher
J’ai atteint la limite de session de 5 heures, je suis donc passé à l’API, et j’ai brûlé 20 dollars en une heure. Je suis donc monté à l’offre “Max” à 200 dollars par mois, et je n’ai pas encore atteint la limite
Le modèle compte. Toutes ces histoires reviennent à dire : “j’ai rencontré quelqu’un de pas très intelligent”. Évidemment
- Tout cela avait été fait avec Opus

Aspirer à l’AGI avec Claude Code

Introduction

Expérience de session de programmation avec Claude

Ce qui distingue Claude Code

Perception d’un seuil vers l’AGI

Conclusion et perspectives

À lire aussi

1 commentaires

Avis de Hacker News