9 compétences de survie à l’ère de l’ingénierie agentique
(flowkater.io)Le week-end du créateur du vibe coding
- Karpathy a confié son projet du week-end à un agent. En lui donnant seulement l’IP, le nom d’utilisateur, le mot de passe et l’objectif, tout était terminé 30 minutes plus tard
- Une manière de travailler où l’on n’écrit pas directement le code pendant 99 % du temps, mais où l’on donne des consignes à l’agent et on le supervise — « ingénierie agentique »
- Pourtant, alors que 60 % des développeurs utilisent l’IA, la délégation complète reste limitée à 0-20 % — le paradoxe de la délégation. « Do you trust your agents? » Pour la plupart, la réponse est encore « non »
① Capacité de décomposition (Decomposition)
- Si on dit « crée-moi une fonctionnalité d’inscription », quelque chose sortira. Le problème, c’est qu’il y a de fortes chances que ce ne soit pas ce que je voulais
- Expérience vécue : avoir confié l’écran AddPlan à un agent avec pour seul input le PRD, puis enchaîné des dizaines d’allers-retours pour y perdre une demi-journée
- Avec une interview de 5 minutes menée avec l’IA sous forme de dialogue socratique → préparation en amont des edge cases → réduction à 2-3 itérations de correction
- Prendre le temps de réfléchir avant d’implémenter, ces 5 minutes en économisent 4 heures
② Conception du contexte (Context Architecture)
- Bien rédiger
AGENTS.mdest important, mais si l’architecture du code elle-même est bien conçue, la vitesse à laquelle l’agent comprend le contexte change complètement - Un agent qui se perdait dans un répertoire plat a été immédiatement plus efficace après une réorganisation en répertoires par feature
- Armin Ronacher : « les outils doivent anticiper le fait qu’un singe du chaos LLM les utilisera complètement de travers »
③ Définition du terminé (Definition of Done)
- Après avoir laissé tourner un projet CLI toute la nuit, il s’est arrêté au bout d’une heure — seules les définitions de types avaient été mises en place, la logique métier n’étant qu’une coquille vide
- Lors de la deuxième tentative, l’agent a réécrit les tests eux-mêmes à sa convenance
- Le « terminé » de l’agent n’est pas mon « terminé »
- Le système DoD en 7 étapes d’Elvis (PR→CI→3 revues de code→Telegram) est extrême, mais il montre la direction
④ Récupération après échec (Failure Recovery Loop)
- Dans un moteur de redistribution, un même paramètre avait des sémantiques différentes selon les fonctions → corriger A cassait B, dans une boucle infinie
- Réessayer avec le même prompt, c’est continuer à se cogner la tête contre le mur dans la même direction
- En classant les échecs en 3 catégories (manque de contexte, erreur de direction, conflit structurel), le remède devient clair
- Un garde-fou « Must NOT Have » a permis de casser la boucle infinie
⑤ Observabilité (Observability)
- Confier
liquidglassà un agent puis se dire « c’est bizarre... laissons comme ça » est le jugement le plus coûteux - 20 fichiers se sont retrouvés emmêlés, sans possibilité de rollback
- Ensuite sont venues la stratégie des traceuses + le blueprint — lorsqu’on applique une technologie pour la première fois, on ne peut pas dessiner le blueprint à l’avance ; les traceuses permettent de l’esquisser rapidement
- L’observabilité crée la confiance, et la confiance rend la délégation possible
⑥ Conception de la mémoire (Memory Architecture)
- Quand on travaille 3 jours d’affilée, on perd chaque matin 15 minutes à réexpliquer le contexte
- Avec les hooks de Claude Code, extraction automatique de la mémoire à la fin de session → restauration en 5 secondes à la session suivante
- L’équipe de Boris Cherny versionne
CLAUDE.mddans git pour le partager à l’échelle de toute l’équipe - Une structure où ce n’est plus la mémoire individuelle, mais la mémoire de l’équipe, qui est transmise à l’agent
⑦ Gestion du parallèle (Parallel Orchestration)
- Boris Cherny fait tourner simultanément 10 à 15 sessions en parallèle
- L’expérience acquise à piloter 6 squads à l’époque où il était CTO ressemble étonnamment à la gestion parallèle d’agents
- Ce n’est pas du TDAH, c’est du multitâche intentionnel = du management
- Les humains posent des questions, mais les agents avancent selon leur propre jugement sans en poser — la conception en amont est donc encore plus importante
⑧ Conception des couches d’abstraction (Abstraction Layering)
- Level 0 (coder directement) → Level 1 (donner des instructions à l’agent) → Level 2 (orchestrateur) → Level 3 (méta-conception)
- Retour d’expérience : transformer une routine quotidienne de 20 minutes en compétence pour la ramener à 2 minutes
- Ingénierie à effet cumulatif — un projet n’est pas un jeu de ligne d’arrivée, mais un jeu à intérêts composés. Les sessions précédentes produisent ensuite des effets cumulatifs
⑨ Le goût (Taste)
- Les designs produits par l’IA valent 60-70 points. Au moment où le design d’Ellie arrive, on a cette intuition : « ah, là, ça marche »
- Un post de synthèse d’informations généré par l’IA a obtenu 0 like, alors qu’une simple phrase écrite impulsivement pour se vanter a fait 30 000 vues
- « No Skill, No Taste » de KinglyCrow — les LLM ont abaissé la barrière d’entrée des skills, mais la vraie barrière qu’est le taste s’est au contraire amplifiée
- Chris Lattner : « plus l’implémentation s’automatise, plus l’importance de la conception, du jugement et du goût augmente »
- À l’ère où les 80 % débordent de partout, la différenciation vient des 20 % restants
En conclusion
- Ce qui est terminé, c’est la frappe au clavier, pas l’ingénierie
- Ces 9 éléments étaient déjà ceux qui définissaient un bon ingénieur avant l’IA
- L’effet de levier d’une bonne conception a grandi, mais les dégâts d’une mauvaise conception aussi
- La vedette du spectacle n’est pas l’IA, mais l’ingénieur qui sait bien manier l’IA
Aucun commentaire pour le moment.