9 compétences de survie à l’ère de l’ingénierie agentique
(flowkater.io)Le week-end du créateur du vibe coding
- Karpathy a confié son projet du week-end à un agent. En lui donnant seulement l’IP, le nom d’utilisateur, le mot de passe et l’objectif, tout était terminé 30 minutes plus tard
- Une manière de travailler où l’on n’écrit pas directement le code pendant 99 % du temps, mais où l’on donne des consignes à l’agent et on le supervise — « ingénierie agentique »
- Pourtant, alors que 60 % des développeurs utilisent l’IA, la délégation complète reste limitée à 0-20 % — le paradoxe de la délégation. « Do you trust your agents? » Pour la plupart, la réponse est encore « non »
① Capacité de décomposition (Decomposition)
- Si on dit « crée-moi une fonctionnalité d’inscription », quelque chose sortira. Le problème, c’est qu’il y a de fortes chances que ce ne soit pas ce que je voulais
- Expérience vécue : avoir confié l’écran AddPlan à un agent avec pour seul input le PRD, puis enchaîné des dizaines d’allers-retours pour y perdre une demi-journée
- Avec une interview de 5 minutes menée avec l’IA sous forme de dialogue socratique → préparation en amont des edge cases → réduction à 2-3 itérations de correction
- Prendre le temps de réfléchir avant d’implémenter, ces 5 minutes en économisent 4 heures
② Conception du contexte (Context Architecture)
- Bien rédiger
AGENTS.mdest important, mais si l’architecture du code elle-même est bien conçue, la vitesse à laquelle l’agent comprend le contexte change complètement - Un agent qui se perdait dans un répertoire plat a été immédiatement plus efficace après une réorganisation en répertoires par feature
- Armin Ronacher : « les outils doivent anticiper le fait qu’un singe du chaos LLM les utilisera complètement de travers »
③ Définition du terminé (Definition of Done)
- Après avoir laissé tourner un projet CLI toute la nuit, il s’est arrêté au bout d’une heure — seules les définitions de types avaient été mises en place, la logique métier n’étant qu’une coquille vide
- Lors de la deuxième tentative, l’agent a réécrit les tests eux-mêmes à sa convenance
- Le « terminé » de l’agent n’est pas mon « terminé »
- Le système DoD en 7 étapes d’Elvis (PR→CI→3 revues de code→Telegram) est extrême, mais il montre la direction
④ Récupération après échec (Failure Recovery Loop)
- Dans un moteur de redistribution, un même paramètre avait des sémantiques différentes selon les fonctions → corriger A cassait B, dans une boucle infinie
- Réessayer avec le même prompt, c’est continuer à se cogner la tête contre le mur dans la même direction
- En classant les échecs en 3 catégories (manque de contexte, erreur de direction, conflit structurel), le remède devient clair
- Un garde-fou « Must NOT Have » a permis de casser la boucle infinie
⑤ Observabilité (Observability)
- Confier
liquidglassà un agent puis se dire « c’est bizarre... laissons comme ça » est le jugement le plus coûteux - 20 fichiers se sont retrouvés emmêlés, sans possibilité de rollback
- Ensuite sont venues la stratégie des traceuses + le blueprint — lorsqu’on applique une technologie pour la première fois, on ne peut pas dessiner le blueprint à l’avance ; les traceuses permettent de l’esquisser rapidement
- L’observabilité crée la confiance, et la confiance rend la délégation possible
⑥ Conception de la mémoire (Memory Architecture)
- Quand on travaille 3 jours d’affilée, on perd chaque matin 15 minutes à réexpliquer le contexte
- Avec les hooks de Claude Code, extraction automatique de la mémoire à la fin de session → restauration en 5 secondes à la session suivante
- L’équipe de Boris Cherny versionne
CLAUDE.mddans git pour le partager à l’échelle de toute l’équipe - Une structure où ce n’est plus la mémoire individuelle, mais la mémoire de l’équipe, qui est transmise à l’agent
⑦ Gestion du parallèle (Parallel Orchestration)
- Boris Cherny fait tourner simultanément 10 à 15 sessions en parallèle
- L’expérience acquise à piloter 6 squads à l’époque où il était CTO ressemble étonnamment à la gestion parallèle d’agents
- Ce n’est pas du TDAH, c’est du multitâche intentionnel = du management
- Les humains posent des questions, mais les agents avancent selon leur propre jugement sans en poser — la conception en amont est donc encore plus importante
⑧ Conception des couches d’abstraction (Abstraction Layering)
- Level 0 (coder directement) → Level 1 (donner des instructions à l’agent) → Level 2 (orchestrateur) → Level 3 (méta-conception)
- Retour d’expérience : transformer une routine quotidienne de 20 minutes en compétence pour la ramener à 2 minutes
- Ingénierie à effet cumulatif — un projet n’est pas un jeu de ligne d’arrivée, mais un jeu à intérêts composés. Les sessions précédentes produisent ensuite des effets cumulatifs
⑨ Le goût (Taste)
- Les designs produits par l’IA valent 60-70 points. Au moment où le design d’Ellie arrive, on a cette intuition : « ah, là, ça marche »
- Un post de synthèse d’informations généré par l’IA a obtenu 0 like, alors qu’une simple phrase écrite impulsivement pour se vanter a fait 30 000 vues
- « No Skill, No Taste » de KinglyCrow — les LLM ont abaissé la barrière d’entrée des skills, mais la vraie barrière qu’est le taste s’est au contraire amplifiée
- Chris Lattner : « plus l’implémentation s’automatise, plus l’importance de la conception, du jugement et du goût augmente »
- À l’ère où les 80 % débordent de partout, la différenciation vient des 20 % restants
En conclusion
- Ce qui est terminé, c’est la frappe au clavier, pas l’ingénierie
- Ces 9 éléments étaient déjà ceux qui définissaient un bon ingénieur avant l’IA
- L’effet de levier d’une bonne conception a grandi, mais les dégâts d’une mauvaise conception aussi
- La vedette du spectacle n’est pas l’IA, mais l’ingénieur qui sait bien manier l’IA
3 commentaires
J’ai remarqué que tant qu’on respecte bien le SSoT, on peut réduire fortement les hallucinations. Et ça permet aussi d’économiser des tokens.
« Ce qui est terminé, c’est la saisie au clavier, pas l’ingénierie. »
Je suis d’accord. Haha
Merci. J’étais inquiet de voir apparaître cowork, qui peut même faire office de serveur du simple fait de laisser le PC allumé, mais ça me rassure un peu, et j’arrive à me représenter comment tout cela pourrait évoluer à l’avenir, haha.