3 points par GN⁺ 2025-06-17 | 1 commentaires | Partager sur WhatsApp
  • Présentation d’un point de vue sur la possibilité d’accéder à l’intelligence artificielle générale (AGI) via Claude Code
  • Partage des impressions de l’auteur à partir de véritables sessions de code avec Claude
  • Mise en avant du niveau atteint par Claude en programmation, en connaissances étendues et en créativité
  • Mention du fait que la compréhension du contexte et l’interprétation du code de Claude le distinguent des outils existants
  • Anticipation des répercussions techniques sur l’évolution des façons de développer et d’utiliser l’intelligence artificielle

Introduction

  • Cet article rassemble les réflexions de l’auteur sur l’approche d’une intelligence artificielle générale de niveau humain (AGI) après avoir expérimenté la programmation avec Claude Code
  • Parmi les outils d’IA conversationnelle récents, l’auteur a ressenti un fort choc et une vive excitation face aux résultats montrés par Claude

Expérience de session de programmation avec Claude

  • Claude est capable de résoudre rapidement et de manière créative des demandes de programmation complexes
  • Au-delà des calculs simples ou des tâches répétitives, il peut saisir la nature profonde d’un problème et proposer de nouvelles approches
  • L’auteur a confié à Claude des tâches difficiles comme l’optimisation, l’amélioration de structure et le refactoring de code, et a été profondément impressionné par la qualité du travail fourni
  • Claude a montré une compréhension du contexte supérieure à celle des LLM existants, allant jusqu’à saisir l’intention du code

Ce qui distingue Claude Code

  • Contrairement aux IA conversationnelles généralistes, Claude peut non seulement écrire du code, mais aussi assumer des rôles de développeur humain comme la compréhension de la structure globale d’un projet, la revue de code et l’explication d’intentions à long terme
  • Il est capable de fournir des explications détaillées, d’écrire des tests, et de s’adapter à divers langages et paradigmes de programmation
  • Il fait preuve de capacités proactives, comme repérer des erreurs logiques dans le code ou proposer des pistes d’amélioration

Perception d’un seuil vers l’AGI

  • Après son expérience avec Claude Code, l’auteur dit avoir acquis une nouvelle conviction quant à la possibilité d’atteindre une AGI désormais plus proche du réel
  • Il estime qu’en passant d’un mode où les humains créent directement les logiciels à un environnement de développement piloté par l’IA, un changement concret est imminent

Conclusion et perspectives

  • Claude Code n’est pas simplement un outil d’intelligence artificielle de plus, mais montre le potentiel de transformer le paradigme même de l’usage de l’IA
  • À l’avenir, humains et IA pourraient concevoir et implémenter ensemble des programmes, ouvrant la voie à une culture du développement logiciel encore plus innovante

1 commentaires

 
GN⁺ 2025-06-17
Avis Hacker News
  • Il trouve l’article vraiment excellent et dit qu’il partage lui aussi des expériences et techniques similaires. Il explique ressentir concrètement les gains d’efficacité de Claude Code, qui permet de traiter rapidement plusieurs tâches en parallèle. À propos des « sub agents », il raconte que Claude Code, via sigoden/aichat, lui a permis d’appeler o3 et de résoudre d’innombrables problèmes, en particulier ceux qui exigent du contexte et un fort niveau de raisonnement, comme les conditions de concurrence ou la chasse aux bugs. Il précise toutefois qu’il l’utilise moins depuis la sortie d’Opus 4. Il partage aussi son prompt et des liens de référence : advanced_ai.md, ainsi que sigoden/aichat
  • En lisant last_week.md, il a honnêtement trouvé le document très pénible à lire. Il juge le texte beaucoup trop verbeux et proche d’un document de PR, ce qui le pousse à douter du style d’écriture des résumés générés par IA. À ses yeux, il vaut mieux parcourir directement les logs de commit. Il affirme que la plupart des résumés IA ont un mauvais style et que leur fiabilité informationnelle reste insatisfaisante. Sa conclusion : lire la source est souvent plus rapide et plus efficace.
    • Il dit avoir ressenti la même confusion et la même déception pour l’onboarding. Il se montre sceptique face à un futur où, au lieu de s’asseoir avec un collègue pour apprendre une base de code, on se contenterait de lire des slides générées par IA. Il ajoute qu’il n’attend pas ce futur avec enthousiasme.
    • Il partage le system prompt qu’il utilise souvent : être concis, pouvoir employer des termes techniques, éviter le marketing plat et les formulations vagues, et supposer que l’utilisateur est techniquement expérimenté. Cela n’empêche pas totalement les hallucinations, mais aide à rendre les réponses de l’IA sur le code ou les questions techniques plus lisibles.
    • Il note qu’on peut spécifier le style voulu dans le prompt, et glisse avec humour qu’il a l’impression que l’auteur de l’article aime les formulations longues façon PR.
    • Il dit avoir déjà perdu toute envie de lire à partir de « What happened here was more than just code... ».
    • Il rappelle que, comme avec l’ancien bug de sycophancy, le fait de « faire plaisir » à l’utilisateur contribue à donner l’impression que l’IA est intelligente ou agréable à utiliser. Il s’interroge donc sur l’objectif réel du reinforcement learning : la précision, la maximisation de l’interaction, ou un arbitrage conflictuel entre les deux.
  • Il estime que l’exemple utilisé pour expliquer le borrow checker de Rust est un très mauvais test de capacité à lire du code, puisque ce contenu figure déjà en masse dans les données d’entraînement.
    • Une autre personne est d’accord et dit que si on demande à l’IA d’expliquer la gestion des exceptions dans les tâches asyncio de Python, elle devient incohérente, comme le pire des stagiaires. Comme elle ne peut pas continuer à apprendre dans ce cadre, il considère cela comme du gâchis. Si même des tâches importantes mais relativement simples se passent ainsi, alors on ne fait que perdre du temps.
  • Il dit soutenir l’automatisation par script avec un agent open source agnostique au LLM, estimant que cette technologie est en train de transformer les fondements du développement logiciel et qu’il faut continuer à garder la main sur notre manière de travailler : openhands
    • Cela lui semble être une bonne ressource. Il mentionne des modèles puissants pouvant tourner sur une Nvidia 4090 (24GB RAM), comme Devstral et Queen 3. Grâce à Ollama, il est devenu plus simple de les faire tourner sur son propre matériel, même si le coût GPU reste élevé. Mais si l’on paie déjà 250 $ par mois pour un service, il estime qu’un setup maison peut être rentabilisé assez vite.
    • Il pose toutefois la question de fond : que faire si les modèles fermés restent meilleurs en qualité ?
    • Quelqu’un répond qu’il est d’accord à 10000 %.
  • Il fait remarquer qu’Opus n’est même pas mentionné. Après avoir essayé plusieurs modèles, il raconte avoir utilisé Claude Code avec le plan Anthropic « Max » à 100 $/mois, puis découvert qu’Opus 4 est le meilleur modèle haut de gamme pour les maths, le code et la recherche. Une fois la limite de session de 5 heures atteinte, il est passé à l’API et a dépensé 20 $ en une heure. Il a donc fini par passer au plan « Max » inférieur à 200 $/mois, et depuis il l’utilise sans problème de limite. Son retour est que le choix du modèle compte énormément, et qu’un petit écart peut avoir de grandes conséquences, comme tomber sur quelqu’un qui n’est pas très futé.
  • Il dit avoir l’impression que le terminal est vraiment l’interface parfaite pour les LLM, et se demande si cette approche ne pourrait pas devenir dominante face aux intégrations IDE personnalisées.
    • Il souligne que l’interface terminal donne accès à l’ensemble du système. Par exemple, avec claude code, il peut inspecter une base de données avec un compte en lecture seule, lancer un navigateur puppeteer pour vérifier des changements CSS, déboguer un cluster k8s ou consulter l’API Prometheus. Il dit en être très satisfait.
    • Il imagine un futur où l’on demanderait au LLM d’essayer en parallèle cinq variantes de correction pour économiser du temps humain. Si cette manière de travailler se généralise, on fera probablement tourner plusieurs conteneurs en parallèle, et l’avantage relatif de l’interface terminal pourrait alors diminuer.
    • Une autre personne défend au contraire l’idée que le terminal est la pire interface, car on ne peut pas modifier directement le code généré.
    • Quelqu’un prédit qu’à mesure que les modèles progresseront, l’IDE finira au contraire par apparaître comme un outil de bas niveau.
  • Il explique qu’une équipe très attentive aux détails est à ses yeux un signal important de savoir-faire artisanal. Donc, si les conditions d’utilisation d’Anthropic sont contradictoires au point d’être inapplicables, cela le fait douter de leur fiabilité comme partenaire. Il critique en particulier la clause interdisant l’usage concurrentiel, qui rendrait l’outil inutilisable dans le cadre du travail et serait loin d’un produit « three laws safe ».
    • Il dit ne pas pouvoir juger l’équipe juridique, mais souligne que le produit Claude Code, lui, montre une très grande attention aux détails. Il mentionne notamment l’usage de haiku selon le contexte pour afficher dans l’indicateur « working... » des verbes mignons et appropriés.
  • Il trouve le contraste entre le fond de page et le texte trop faible, ce qui rend la lecture difficile.
    • Une autre personne dit qu’elle a du mal à se concentrer à cause du curseur clignotant en haut.
    • Quelqu’un conseille très pragmatiquement qu’on ne perd pas grand-chose à simplement passer le contenu.
  • À propos de la question de savoir si Claude Code paraît plus puissant que Cursor, il dit partager cette impression. Selon lui, Claude Code est bien plus qu’un simple éditeur de code. Il l’utilise aussi dans son vault Obsidian pour toutes sortes d’usages : raccourcis clavier personnalisés, upload automatique de captures, génération de liens pour un CDN, création d’un programme de résumé de commandes terminal, etc. Il raconte qu’avant, il hésitait beaucoup sur la frontière entre scripts d’automatisation et tâches manuelles, mais qu’à présent il confie tout en bloc à Claude et en est satisfait.
    • Il souligne toutefois la limite suivante : Claude Code semble réservé aux abonnés d’un plan, indisponible via l’API, et il se demande si 100 $/mois suffisent vraiment. Pour lui, c’est un outil qui vaut la peine d’être utilisé toute la journée.
    • Quelqu’un dit vouloir en savoir plus sur les cas d’usage concrets dans un Obsidian Vault.
    • Une autre personne raconte avoir confié à un LLM le classement d’une énorme quantité de notes dans des dossiers par catégorie, avec d’excellents résultats.
  • À propos de la remarque selon laquelle openai codex serait bientôt réécrit en Rust, quelqu’un réagit sur le ton de la plaisanterie : si l’IA est vraiment si bonne, pourquoi aurait-on encore besoin qu’elle refactorise ce genre de choses ?