9 compétences de survie à l’ère de l’ingénierie agentique

(flowkater.io)

81 points par flowkater 2026-03-01 | Aucun commentaire pour le moment. | Partager sur WhatsApp

Le week-end du créateur du vibe coding

Karpathy a confié son projet du week-end à un agent. En lui donnant seulement l’IP, le nom d’utilisateur, le mot de passe et l’objectif, tout était terminé 30 minutes plus tard
Une manière de travailler où l’on n’écrit pas directement le code pendant 99 % du temps, mais où l’on donne des consignes à l’agent et on le supervise — « ingénierie agentique »
Pourtant, alors que 60 % des développeurs utilisent l’IA, la délégation complète reste limitée à 0-20 % — le paradoxe de la délégation. « Do you trust your agents? » Pour la plupart, la réponse est encore « non »

① Capacité de décomposition (Decomposition)

Si on dit « crée-moi une fonctionnalité d’inscription », quelque chose sortira. Le problème, c’est qu’il y a de fortes chances que ce ne soit pas ce que je voulais
Expérience vécue : avoir confié l’écran AddPlan à un agent avec pour seul input le PRD, puis enchaîné des dizaines d’allers-retours pour y perdre une demi-journée
Avec une interview de 5 minutes menée avec l’IA sous forme de dialogue socratique → préparation en amont des edge cases → réduction à 2-3 itérations de correction
Prendre le temps de réfléchir avant d’implémenter, ces 5 minutes en économisent 4 heures

② Conception du contexte (Context Architecture)

Bien rédiger AGENTS.md est important, mais si l’architecture du code elle-même est bien conçue, la vitesse à laquelle l’agent comprend le contexte change complètement
Un agent qui se perdait dans un répertoire plat a été immédiatement plus efficace après une réorganisation en répertoires par feature
Armin Ronacher : « les outils doivent anticiper le fait qu’un singe du chaos LLM les utilisera complètement de travers »

③ Définition du terminé (Definition of Done)

Après avoir laissé tourner un projet CLI toute la nuit, il s’est arrêté au bout d’une heure — seules les définitions de types avaient été mises en place, la logique métier n’étant qu’une coquille vide
Lors de la deuxième tentative, l’agent a réécrit les tests eux-mêmes à sa convenance
Le « terminé » de l’agent n’est pas mon « terminé »
Le système DoD en 7 étapes d’Elvis (PR→CI→3 revues de code→Telegram) est extrême, mais il montre la direction

④ Récupération après échec (Failure Recovery Loop)

Dans un moteur de redistribution, un même paramètre avait des sémantiques différentes selon les fonctions → corriger A cassait B, dans une boucle infinie
Réessayer avec le même prompt, c’est continuer à se cogner la tête contre le mur dans la même direction
En classant les échecs en 3 catégories (manque de contexte, erreur de direction, conflit structurel), le remède devient clair
Un garde-fou « Must NOT Have » a permis de casser la boucle infinie

⑤ Observabilité (Observability)

Confier liquidglass à un agent puis se dire « c’est bizarre... laissons comme ça » est le jugement le plus coûteux
20 fichiers se sont retrouvés emmêlés, sans possibilité de rollback
Ensuite sont venues la stratégie des traceuses + le blueprint — lorsqu’on applique une technologie pour la première fois, on ne peut pas dessiner le blueprint à l’avance ; les traceuses permettent de l’esquisser rapidement
L’observabilité crée la confiance, et la confiance rend la délégation possible

⑥ Conception de la mémoire (Memory Architecture)

Quand on travaille 3 jours d’affilée, on perd chaque matin 15 minutes à réexpliquer le contexte
Avec les hooks de Claude Code, extraction automatique de la mémoire à la fin de session → restauration en 5 secondes à la session suivante
L’équipe de Boris Cherny versionne CLAUDE.md dans git pour le partager à l’échelle de toute l’équipe
Une structure où ce n’est plus la mémoire individuelle, mais la mémoire de l’équipe, qui est transmise à l’agent

⑦ Gestion du parallèle (Parallel Orchestration)

Boris Cherny fait tourner simultanément 10 à 15 sessions en parallèle
L’expérience acquise à piloter 6 squads à l’époque où il était CTO ressemble étonnamment à la gestion parallèle d’agents
Ce n’est pas du TDAH, c’est du multitâche intentionnel = du management
Les humains posent des questions, mais les agents avancent selon leur propre jugement sans en poser — la conception en amont est donc encore plus importante

⑧ Conception des couches d’abstraction (Abstraction Layering)

Level 0 (coder directement) → Level 1 (donner des instructions à l’agent) → Level 2 (orchestrateur) → Level 3 (méta-conception)
Retour d’expérience : transformer une routine quotidienne de 20 minutes en compétence pour la ramener à 2 minutes
Ingénierie à effet cumulatif — un projet n’est pas un jeu de ligne d’arrivée, mais un jeu à intérêts composés. Les sessions précédentes produisent ensuite des effets cumulatifs

⑨ Le goût (Taste)

Les designs produits par l’IA valent 60-70 points. Au moment où le design d’Ellie arrive, on a cette intuition : « ah, là, ça marche »
Un post de synthèse d’informations généré par l’IA a obtenu 0 like, alors qu’une simple phrase écrite impulsivement pour se vanter a fait 30 000 vues
« No Skill, No Taste » de KinglyCrow — les LLM ont abaissé la barrière d’entrée des skills, mais la vraie barrière qu’est le taste s’est au contraire amplifiée
Chris Lattner : « plus l’implémentation s’automatise, plus l’importance de la conception, du jugement et du goût augmente »
À l’ère où les 80 % débordent de partout, la différenciation vient des 20 % restants

En conclusion

Ce qui est terminé, c’est la frappe au clavier, pas l’ingénierie
Ces 9 éléments étaient déjà ceux qui définissaient un bon ingénieur avant l’IA
L’effet de levier d’une bonne conception a grandi, mais les dégâts d’une mauvaise conception aussi
La vedette du spectacle n’est pas l’IA, mais l’ingénieur qui sait bien manier l’IA

À lire aussi