- L’outil de codage agentique Claude Code transforme davantage la création de produits et la reconfiguration des workflows que la simple écriture de code
- Une enquête de Microsoft auprès d’utilisateurs de l’IA au travail montre à la fois une pression pour adopter rapidement l’IA, la création de nouveaux livrables et une hausse du temps consacré à des tâches à plus forte valeur, mais les récompenses pour l’expérimentation avec l’IA restent faibles
- Quand une organisation prend pour objectif le simple volume d’usage, cela crée des classements de tokens et du gonflement artificiel d’usage ; des indicateurs reliés à la manière dont l’IA crée de la valeur sont plus importants
- Boris Cherny estime que le titre d’ingénieur pourrait évoluer vers un rôle plus proche de builder ; même des non-ingénieurs produiraient du code, tandis que les ingénieurs se concentreraient moins sur la saisie directe que sur le jugement, la planification et la compréhension des utilisateurs
- Les gains de productivité liés à l’IA ne se traduisent pas forcément uniquement par une baisse du temps de travail ou de l’emploi ; les entreprises réorganisent leurs workflows autour de l’IA et les individus gagnent en choix et en levier
Les données sur l’IA au travail et le piège des indicateurs organisationnels
- Microsoft a étudié 20 000 utilisateurs qui emploient l’IA dans leur travail réel, et a observé ce qu’il appelle un « paradoxe de la transformation »
- 65 % craignent de prendre du retard s’ils n’adoptent pas rapidement l’IA
- 58 % produisent grâce à l’IA des livrables qu’ils n’auraient pas pu créer un an plus tôt
- 66 % répondent que l’IA leur permet de consacrer du temps à un travail à plus forte valeur
- En revanche, seuls 13 % disent être récompensés au travail pour l’expérimentation avec l’IA, ce qui révèle un écart entre la volonté d’usage et l’organisation
- Dans une autre étude Microsoft, lorsque les managers montrent eux-mêmes concrètement comment ils utilisent l’IA, l’usage augmente de 17 % et le niveau de confiance envers les agents grimpe de 30 %
- Plus que des slogans du type « l’IA, c’est l’avenir », ce sont les managers qui montrent leurs usages concrets au quotidien qui obtiennent des résultats
- Si les salariés pensent pouvoir partager les bénéfices de productivité générés par l’IA, leur motivation à l’utiliser peut changer, mais presque aucune entreprise ne les récompense financièrement de cette façon
- Certains lieux de travail subventionnent le coût des tokens, mais ce soutien ne débouche pas toujours sur de bons résultats
Token maxing — les effets pervers des métriques d’usage
- Dans de grandes entreprises tech, on observe du token maxing, c’est-à-dire une consommation excessive de tokens pour gonfler l’usage
- D’après des salariés d’Amazon cités par le Financial Times, Amazon a introduit mesh claw, un outil interne inspiré d’OpenClaw, et en a encouragé l’usage
- L’équipe dispose d’un classement interne d’utilisation des tokens, ce qui pousse certains employés à faire tourner sans raison des agents peu productifs pour faire monter leurs chiffres
- Chez Meta, l’usage maximal atteignait des centaines de milliards de tokens, soit l’équivalent de millions de dollars en coûts largement gaspillés
- La position officielle d’Amazon est que l’usage de tokens n’est pas un critère d’évaluation managériale, mais les employés pensent que les managers le regardent et cherchent donc à augmenter le volume brut
- Chez Amazon, il existe un objectif imposé d’en haut visant à ce que 80 % des développeurs utilisent l’IA chaque semaine
- Sans récompense concrète, on finit par respecter le mot d’ordre « utilisez l’IA » tout en perdant de vue l’objectif initial : « faites mieux votre travail »
- Les développeurs ont besoin d’indicateurs clairs de productivité liée à la création de valeur, plutôt que de modes de suivi ambigus
La naissance de Claude Code et sa diffusion rapide
- Claude Code est l’outil de codage agentique lancé par Anthropic en mai de l’année précédente, un outil qui produit du code à partir de mots saisis
- En 8 mois après son lancement, il aurait représenté environ 4 % de l’ensemble du code publié sur GitHub
- En février de la même année, il a atteint un run rate de chiffre d’affaires annuel de 2,5 milliards de dollars, plus rapidement que tout autre produit d’entreprise
- Son créateur Boris Cherny, sans diplôme de computer science, a étudié l’économie, quitté l’université à 18 ans, lancé une startup, travaillé dans un hedge fund puis passé 5 ans chez Meta comme principal engineer avant de rejoindre Anthropic fin 2024
- Aujourd’hui, Cherny n’écrit plus une seule ligne de code lui-même et fait tourner en parallèle 5 agents dans 5 onglets de terminal pour traiter 20 à 30 pull requests par jour
- À l’origine, il ne cherchait pas à créer un outil de codage, mais à se familiariser avec l’API à travers un side project
- Au début, il avait simplement relié Claude à AppleScript pour afficher la musique qu’il écoutait
- En deux mois, une version de Claude Code était née, et 20 % de l’équipe d’ingénierie d’Anthropic l’utilisait dès le premier jour
- Il a rejoint Anthropic en septembre 2024 dans une toute petite équipe labs
- Cette équipe a créé Claude Code, MCP, skills et l’application desktop, avec beaucoup d’idées expérimentales dont le succès n’était pas garanti
- Anthropic se concentrait sur l’entreprise, le codage et la sécurité ; s’il fallait construire un produit, un produit de codage paraissait logique, car il pouvait aider à la fois à améliorer les modèles de code et la recherche en sécurité
- À l’époque, la plupart des produits de codage étaient des extensions IDE et, au niveau de Sonnet 3.5, ressemblaient surtout à de l’autocomplétion avancée
- Ils percevaient un model overhang : le modèle savait faire davantage, mais aucun produit n’en tirait pleinement parti ; et ce sentiment reste le même aujourd’hui
- Ils l’ont construit en quelques jours sous la forme la moins coûteuse possible, fonctionnant dans le terminal sans UI ni application dédiée
- L’usage s’est diffusé de proche en proche ; en quelques semaines, une grande partie de l’entreprise l’utilisait chaque jour, et la moitié de l’équipe d’ingénierie l’utilisait en moins de 5 jours après le lancement
- Même des ingénieurs réticents au terminal s’y sont mis, et Cherny explique qu’au lieu d’analyser si « le software engineering avait changé pour toujours », il s’est concentré sur le lancement
Les ingénieurs vont-ils disparaître ? — l’hybridation des rôles
- Le premier choc a été le moment où Claude lui a indiqué la musique qu’il écoutait
- En réponse à une question, Claude a écrit un script AppleScript pour ouvrir le lecteur musical ; Cherny ne connaissait pas ce langage et n’aurait même pas imaginé cette approche
- Le modèle a résolu le problème d’une manière qu’un ingénieur n’aurait pas forcément choisie
- Les modèles progressent très vite, si bien qu’en construisant des produits sur eux, il faut se réajuster tous les mois
- Avec Co-work, il a réservé 8 vols et 5 hôtels ; la seule erreur fut un hôtel à environ 5 000 dollars la nuit, hors budget, qu’il a simplement fallu re-réserver
- La tendance suit une courbe exponentielle, donc personne ne sait exactement ce qui va se passer, mais deux choses surviennent en même temps
- Des entreprises ont besoin de moins d’ingénieurs pour faire le même travail, grâce à la hausse de productivité
- D’autres ont besoin de plus d’ingénieurs, car la productivité par personne permet de lancer davantage de produits et d’activités (l’équipe de Cherny reste freinée par le manque de bons ingénieurs et recrute aussi vite que possible)
- Les rôles sont en train de se mélanger de manière intéressante
- Sa manager Fiona n’avait pas codé depuis 15 ans mais s’y est remise après avoir rejoint l’équipe ; la product manager Cat, la designer Megan et toute l’équipe codent aussi
- Les non-ingénieurs écrivent un peu plus de code, tandis que des ingénieurs comme Cherny n’en écrivent plus directement depuis plus de 6 mois tout en construisant des choses toute la journée
- On ne sait pas encore s’il faut appeler cela builder, ingénieur ou product manager, mais le rôle lui-même change clairement
L’analogie du tracteur — le temps de diffusion d’une technologie
- Le tracteur a été inventé dans l’Iowa dans les années 1890 par John Frick, mais il a fallu attendre les années 1960 pour qu’il dépasse le cheval aux États-Unis, soit environ 70 ans
- Le tracteur a fortement accru les rendements et la productivité, mais son usage exigeait de la formation, et au départ il coûtait plus cher que les chevaux
- Ses performances restaient limitées : il pouvait par exemple marcher pour le blé mais pas pour le maïs, et il a fallu longtemps pour l’adapter à différents types de culture
- La transition actuelle vers l’IA voit les mêmes problèmes se produire en version ultra-accélérée
- Cela rejoint l’idée d’une IA comme technologie normale : même si des modèles très capables apparaissent, les changements humains et organisationnels restent lents
- Cela dit, au vu de la trajectoire de chiffre d’affaires d’Anthropic, certains rétorquent que cette fois la vitesse est bien plus élevée, et nous en sommes encore à mesurer la vitesse réelle du changement
- Les ordinateurs augmentent la productivité, mais cela ne signifie pas forcément une baisse du temps de travail : on fait simplement plus de choses dans le même temps
Le codage est-il « résolu » ?
- Quand il dit que « coding is solved », il parle du type de codage qu’il pratique lui-même
- Les produits sur lesquels Cherny travaille — cloud CLI, application desktop, application mobile — reposent sur des codebases relativement récentes et simples
- En revanche, dans les grandes codebases complexes de clients comme la NASA, ce n’est pas encore résolu, et les modèles restent imparfaits et font des erreurs
- Les objections des ingénieurs — le codage n’est pas de la simple frappe mais du jugement, de l’intuition et de la pensée critique, domaines où les agents restent faibles — sont valables
- Même auparavant, sa journée n’était composée qu’à environ 50 % de frappe de code réelle, le reste étant consacré aux échanges avec les utilisateurs, au brainstorming, au debugging, à la conception et à la planification
- Si les modèles prennent en charge le codage, les ingénieurs sont libérés pour des tâches plus agréables, comme parler aux utilisateurs et imaginer la suite
- Claude Code est développé à 100 % avec Claude Code depuis plus de 6 mois, et c’est aussi le cas d’autres produits comme Co-work
- Lors d’un récent échange avec la dernière promotion de Y Combinator, quand on a demandé qui écrivait 100 % de son code avec Claude Code, environ la moitié de plusieurs centaines de personnes ont levé la main ; à la question « qui n’utilise pas du tout les modèles pour écrire du code ? », une seule personne, les autres se situant entre 50 et 100 %
- Il voit dans l’évolution de l’ingénierie un indicateur avancé de tous les autres secteurs
-
Risque d’atrophie des compétences et évolution de la programmation
- Une inquiétude revient : sans écrire directement le code, la compréhension de son propre métier pourrait s’atrophier
- Lena, une ingénieure de l’équipe, écrit du C++ à la main le week-end pour le plaisir, et cette possibilité existera toujours
- Cherny n’y voit pas une atrophie mais une nouvelle étape dans l’évolution permanente de la programmation
- À l’époque soviétique, les cartes perforées, et à l’époque du programme Apollo, les calculs manuels sur papier, relevaient déjà de ce qu’on appelait alors « programmer »
- Puis on est passé du langage machine à l’assembleur, puis à JavaScript et Python ; on passerait maintenant à une programmation par dialogue avec des agents, puis bientôt à des agents qui parlent à d’autres agents pour coder
- C’est un peu comme utiliser une calculatrice même si certaines capacités de calcul mental diminuent ; la différence est qu’ici l’outil pourrait devenir superintelligent et affaiblir subrepticement l’utilisateur, ce qui est un autre problème
- Une inquiétude revient : sans écrire directement le code, la compréhension de son propre métier pourrait s’atrophier
-
La polémique sur la régression des modèles
- Après chaque nouveau modèle, on voit régulièrement apparaître des critiques affirmant que « les performances ont fortement régressé »
- Il y a effectivement eu 2 cas dus à de vrais bugs, et Anthropic a publié sur son blog les causes et les correctifs
- Pour le reste, il peut souvent s’agir d’un phénomène de fin de lune de miel, où l’on s’habitue au modèle et où l’émerveillement initial s’atténue
- Contrairement à il y a un an, le code produit aujourd’hui par les modèles est meilleur que celui que Cherny écrirait lui-même
- Autrefois, il fallait relire chaque ligne trois fois ; aujourd’hui, il laisse Claude faire, lui demande ensuite de revérifier et de tester le résultat, tout en faisant tourner 15 Claude en parallèle
- Après chaque nouveau modèle, on voit régulièrement apparaître des critiques affirmant que « les performances ont fortement régressé »
Le paradoxe de la productivité et l’élargissement des choix
- Même si la productivité augmente, le temps de travail ne diminue pas forcément ; cela dépend largement des choix individuels et de la situation des entreprises
- Il l’explique avec l’exemple du lave-linge
- Avant le lave-linge, une lessive demandait 5 à 6 heures et environ 3 000 pieds de marche, avec du feu à allumer, de l’eau à faire bouillir, du linge à frotter sur une planche et à essorer, le tout répété chaque jour selon la taille de la famille
- Le lave-linge a réduit le temps nécessaire d’environ 3 heures par lessive
- Ce fut l’un des facteurs ayant permis l’entrée massive des femmes sur le marché du travail
- Le temps économisé a ouvert des choix individuels : passer plus de temps avec les enfants, marcher, lire, voir des amis, ou entrer à l’usine ou dans les emplois de bureau ; l’IA élargit de la même manière l’éventail des possibilités
- Son conseil à une personne de 22 ans qui vient de terminer un diplôme en computer science : les postes juniors existent encore, mais avec la moindre envie entrepreneuriale, il recommande de créer une startup
- Nous vivons selon lui un âge d’or pour entreprendre : « vous et vos agents » pouvez bâtir une immense entreprise
- En pratique, des équipes de 1 à 3 personnes créent déjà des sociétés valant un milliard de dollars et d’excellentes startups, avec un levier individuel immense
- Dans 3 ans, on n’appellera peut-être plus cela « ingénieur », mais le nombre de personnes écrivant du code ou le faisant écrire par des agents pourrait être 100 fois supérieur à aujourd’hui
Claude Co-work — l’extension aux non-ingénieurs
- Co-work est né en observant que des gens installaient Claude Code dans le terminal pour faire leur déclaration fiscale, donc pour des usages non liés au codage
- Il sert à la comptabilité, la finance, le juridique, la réservation de vols, l’achat de billets de concert, voire l’achat d’un permis de pêche aux coquillages dans l’État de Washington
- Les produits de codage avaient été construits par des ingénieurs pour eux-mêmes avant de devenir utiles aux autres ; Co-work est un nouveau défi, conçu pour l’ensemble des non-ingénieurs
- La capacité d’exécution longue est l’orientation centrale
- Il y a environ un an et demi, à cause des limites du modèle, Claude Code sortait de sa trajectoire après seulement 30 secondes et nécessitait une intervention
- Aujourd’hui, chaque nuit, des centaines à des milliers d’agents tournent pendant 5, 10 ou 20 heures, et c’est devenu la manière actuelle de faire de l’ingénierie
- Co-work ira dans la même direction, mais on ne sait pas encore clairement quelles tâches non techniques nécessitent des exécutions aussi longues
- Avec une meilleure mémoire et une meilleure compréhension de l’utilisateur, l’évolution ira vers l’anticipation des besoins
- Exemple : identifier les épisodes de podcast restants et les invités pas encore contactés, proposer des idées, puis placer des e-mails de premier contact dans les brouillons
- La définition du travail pourrait se diviser entre une approche horizontale, du type « concevoir l’ensemble du design », et une approche verticale, où l’on exécute un objectif précis jusqu’au bout
- Exemple vertical : Claude crée une fonctionnalité, la teste, la fusionne et la déploie
- À partir de Opus 4.7, Claude devient plus proactif
- Après le lancement d’une fonctionnalité, il programme lui-même un rappel pour vérifier les retours utilisateurs 12 heures plus tard et cherche à corriger d’éventuels bugs ; cela a beaucoup plu, car il anticipe des tâches que les humains oublient facilement
- Claude Mythos n’a pour l’instant pas été largement rendu public ; les informations diffusées portent surtout sur ses performances en codage et en cybersécurité — un saut plus important qu’à l’accoutumée, particulièrement fort sur ces deux aspects
À qui incombe la responsabilité du remplacement des emplois ?
- Cette transition produira à la fois des effets positifs et négatifs, et il est impossible d’en prévoir précisément le moment ou l’ampleur
- Anthropic occupe une position singulière, car ses produits peuvent contribuer au chômage de professions comme les ingénieurs logiciel
- En tant qu’ingénieurs, l’équipe discute souvent d’un fort devoir d’alerter sur les changements à venir et de former les gens à utiliser les outils pour les embarquer avec eux
- Ce n’est pas un problème qu’une seule entreprise peut résoudre, et il ne serait pas souhaitable qu’elle le fasse seule non plus, car cela pourrait conduire à de mauvaises réponses
- C’est un sujet qui doit être discuté et débattu à l’échelle de la société, et Anthropic contribue via des rapports économiques, des discussions de politique publique et la publication de ses observations
- L’une des raisons pour lesquelles Anthropic, en plus d’être un laboratoire de sécurité, construit aussi des produits, est de permettre aux gens d’expérimenter eux-mêmes la technologie, de la comprendre et de participer à la réponse sociale ; si elle restait verrouillée, personne ne pourrait réellement se forger un point de vue
Power users et fracture de l’IA
- Il existe une crainte que la fracture numérique devienne une fracture de l’IA, et jusqu’ici les données montrent que les personnes qui tirent le mieux parti de l’IA sont souvent déjà parmi les plus hauts revenus
- Anthropic a bien quelques programmes destinés à élargir l’accès, mais sans détails précis ici sur leurs noms ou leurs modalités
- Les utilisateurs qui créent le plus de valeur sont souvent très différents de ce qu’on attendait
- Les vainqueurs du hackathon de lancement d’Opus 4.7 n’étaient généralement pas des ingénieurs professionnels, mais par exemple un électricien, un médecin ou un charpentier ayant créé des applications ; on observait déjà la même tendance lors du hackathon 4.6
- Les modèles sont devenus assez sophistiqués pour que des non-spécialistes puissent très bien les utiliser
- Pour les grandes entreprises, la clé de l’adoption est de changer les processus de travail et placer Claude au centre
- Une méthode qui fonctionne consiste à donner des tokens à tout le monde et à leur permettre d’expérimenter en sécurité, afin que des idées émergent de personnes inattendues
- Les meilleures idées peuvent ne pas venir d’un senior engineer mais d’un comptable dans un coin ou d’une personne du go-to-market qui construit un dashboard interne
- Rien ne garantit que les meilleurs utilisateurs d’aujourd’hui le resteront demain ; il est donc crucial que tout le monde apprenne à utiliser ces outils
Perspectives pour l’année à venir
- L’an prochain apportera beaucoup de confusion, mais les grands acteurs vont tenter de s’adapter et beaucoup y parviendront
- Certains moats business traditionnels vont s’affaiblir, tandis que d’autres resteront solides
- Les effets de réseau resteront, indépendamment de l’IA
- Les économies d’échelle non plus ne disparaîtront pas, puisqu’il s’agit d’avantages structurels naturels
- En revanche, les coûts de changement s’affaiblissent : si Claude peut vous migrer du fournisseur A vers le fournisseur B, ce n’est plus vraiment un moat
- Les entreprises qui dépendaient de moats appelés à disparaître auront plus de mal, et beaucoup chercheront de nouveaux avantages défendables
- Il s’attend à une innovation bien plus grande qu’anticipé
- Les nouvelles idées viendront non pas des grands groupes mais de petites startups de 1, 2 ou 10 personnes, dont le nombre va exploser
- Exemple d’une startup de découverte de matériaux : après l’âge de pierre, l’âge du fer puis l’âge du silicium, elle considère que trouver de nouveaux matériaux peut ouvrir une nouvelle ère, et explore avec Claude des molécules et des designs possibles
- Des choses qui autrefois peinaient à être financées peuvent désormais devenir, entre les mains de petites équipes, des percées impossibles il y a 20 ans
- Une personne qui maîtrise bien son domaine et dispose d’une « armée de Claude » peut accomplir bien plus qu’avec une armée d’humains
- Cherny a automatisé ses réponses aux utilisateurs sur X et Threads, mais préfère le faire lui-même
- Il a transformé la boucle de Claude Code en routine exécutée toutes les 30 minutes pour collecter les retours via l’API Threads et l’API X
- L’interaction directe avec les utilisateurs est ce qu’il préfère, et même les messages « ça ne marche pas » sont une source d’amélioration produit
- Claude Code reste plein de défauts et encore loin du produit idéal, mais écouter les retours et l’améliorer un peu chaque jour reste selon lui la seule manière de construire un bon produit
Aucun commentaire pour le moment.