81 points par flowkater 2026-03-01 | Aucun commentaire pour le moment. | Partager sur WhatsApp

Le week-end du créateur du vibe coding

  • Karpathy a confié son projet du week-end à un agent. En lui donnant seulement l’IP, le nom d’utilisateur, le mot de passe et l’objectif, tout était terminé 30 minutes plus tard
  • Une manière de travailler où l’on n’écrit pas directement le code pendant 99 % du temps, mais où l’on donne des consignes à l’agent et on le supervise — « ingénierie agentique »
  • Pourtant, alors que 60 % des développeurs utilisent l’IA, la délégation complète reste limitée à 0-20 % — le paradoxe de la délégation. « Do you trust your agents? » Pour la plupart, la réponse est encore « non »

① Capacité de décomposition (Decomposition)

  • Si on dit « crée-moi une fonctionnalité d’inscription », quelque chose sortira. Le problème, c’est qu’il y a de fortes chances que ce ne soit pas ce que je voulais
  • Expérience vécue : avoir confié l’écran AddPlan à un agent avec pour seul input le PRD, puis enchaîné des dizaines d’allers-retours pour y perdre une demi-journée
  • Avec une interview de 5 minutes menée avec l’IA sous forme de dialogue socratique → préparation en amont des edge cases → réduction à 2-3 itérations de correction
  • Prendre le temps de réfléchir avant d’implémenter, ces 5 minutes en économisent 4 heures

② Conception du contexte (Context Architecture)

  • Bien rédiger AGENTS.md est important, mais si l’architecture du code elle-même est bien conçue, la vitesse à laquelle l’agent comprend le contexte change complètement
  • Un agent qui se perdait dans un répertoire plat a été immédiatement plus efficace après une réorganisation en répertoires par feature
  • Armin Ronacher : « les outils doivent anticiper le fait qu’un singe du chaos LLM les utilisera complètement de travers »

③ Définition du terminé (Definition of Done)

  • Après avoir laissé tourner un projet CLI toute la nuit, il s’est arrêté au bout d’une heure — seules les définitions de types avaient été mises en place, la logique métier n’étant qu’une coquille vide
  • Lors de la deuxième tentative, l’agent a réécrit les tests eux-mêmes à sa convenance
  • Le « terminé » de l’agent n’est pas mon « terminé »
  • Le système DoD en 7 étapes d’Elvis (PR→CI→3 revues de code→Telegram) est extrême, mais il montre la direction

④ Récupération après échec (Failure Recovery Loop)

  • Dans un moteur de redistribution, un même paramètre avait des sémantiques différentes selon les fonctions → corriger A cassait B, dans une boucle infinie
  • Réessayer avec le même prompt, c’est continuer à se cogner la tête contre le mur dans la même direction
  • En classant les échecs en 3 catégories (manque de contexte, erreur de direction, conflit structurel), le remède devient clair
  • Un garde-fou « Must NOT Have » a permis de casser la boucle infinie

⑤ Observabilité (Observability)

  • Confier liquidglass à un agent puis se dire « c’est bizarre... laissons comme ça » est le jugement le plus coûteux
  • 20 fichiers se sont retrouvés emmêlés, sans possibilité de rollback
  • Ensuite sont venues la stratégie des traceuses + le blueprint — lorsqu’on applique une technologie pour la première fois, on ne peut pas dessiner le blueprint à l’avance ; les traceuses permettent de l’esquisser rapidement
  • L’observabilité crée la confiance, et la confiance rend la délégation possible

⑥ Conception de la mémoire (Memory Architecture)

  • Quand on travaille 3 jours d’affilée, on perd chaque matin 15 minutes à réexpliquer le contexte
  • Avec les hooks de Claude Code, extraction automatique de la mémoire à la fin de session → restauration en 5 secondes à la session suivante
  • L’équipe de Boris Cherny versionne CLAUDE.md dans git pour le partager à l’échelle de toute l’équipe
  • Une structure où ce n’est plus la mémoire individuelle, mais la mémoire de l’équipe, qui est transmise à l’agent

⑦ Gestion du parallèle (Parallel Orchestration)

  • Boris Cherny fait tourner simultanément 10 à 15 sessions en parallèle
  • L’expérience acquise à piloter 6 squads à l’époque où il était CTO ressemble étonnamment à la gestion parallèle d’agents
  • Ce n’est pas du TDAH, c’est du multitâche intentionnel = du management
  • Les humains posent des questions, mais les agents avancent selon leur propre jugement sans en poser — la conception en amont est donc encore plus importante

⑧ Conception des couches d’abstraction (Abstraction Layering)

  • Level 0 (coder directement) → Level 1 (donner des instructions à l’agent) → Level 2 (orchestrateur) → Level 3 (méta-conception)
  • Retour d’expérience : transformer une routine quotidienne de 20 minutes en compétence pour la ramener à 2 minutes
  • Ingénierie à effet cumulatif — un projet n’est pas un jeu de ligne d’arrivée, mais un jeu à intérêts composés. Les sessions précédentes produisent ensuite des effets cumulatifs

⑨ Le goût (Taste)

  • Les designs produits par l’IA valent 60-70 points. Au moment où le design d’Ellie arrive, on a cette intuition : « ah, là, ça marche »
  • Un post de synthèse d’informations généré par l’IA a obtenu 0 like, alors qu’une simple phrase écrite impulsivement pour se vanter a fait 30 000 vues
  • « No Skill, No Taste » de KinglyCrow — les LLM ont abaissé la barrière d’entrée des skills, mais la vraie barrière qu’est le taste s’est au contraire amplifiée
  • Chris Lattner : « plus l’implémentation s’automatise, plus l’importance de la conception, du jugement et du goût augmente »
  • À l’ère où les 80 % débordent de partout, la différenciation vient des 20 % restants

En conclusion

  • Ce qui est terminé, c’est la frappe au clavier, pas l’ingénierie
  • Ces 9 éléments étaient déjà ceux qui définissaient un bon ingénieur avant l’IA
  • L’effet de levier d’une bonne conception a grandi, mais les dégâts d’une mauvaise conception aussi
  • La vedette du spectacle n’est pas l’IA, mais l’ingénieur qui sait bien manier l’IA

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.