Microsoft commence à retirer des licences Claude Code
(theverge.com)- Microsoft a ouvert l’accès à Claude Code à plusieurs milliers de développeurs en interne à partir de décembre, mais revient sur cette extension après seulement six mois
- Claude Code a gagné en popularité en servant aussi aux expérimentations de codage de chefs de projet, designers et autres employés, mais il s’est retrouvé en concurrence avec GitHub Copilot CLI
- Microsoft veut supprimer la plupart des licences Claude Code et faire migrer de nombreux développeurs vers Copilot CLI afin de converger vers un principal outil de ligne de commande orienté agent
- L’équipe Experiences + Devices réduit son usage d’ici fin juin, avec notamment des ingénieurs de Windows, Microsoft 365, Outlook, Teams et Surface
- Cette décision coïncide avec la fin de l’exercice fiscal le 30 juin, et la résiliation des licences facilite la réduction des coûts d’exploitation au début du nouvel exercice en juillet
Réduction des licences Claude Code
- Microsoft a ouvert à partir de décembre l’accès à Claude Code à plusieurs milliers de développeurs en interne afin qu’ils utilisent au quotidien l’outil de codage IA d’Anthropic
- Cela faisait partie d’un effort visant à permettre à des chefs de projet, designers et autres employés d’expérimenter le codage pour la première fois
- Claude Code a gagné en popularité chez Microsoft au cours des six derniers mois, mais l’entreprise se prépare à faire machine arrière sur cette expansion
Transition vers Copilot CLI
- Microsoft veut supprimer la plupart des licences Claude Code et faire migrer de nombreux développeurs vers GitHub Copilot CLI
- La popularité de Claude Code est entrée en conflit avec GitHub Copilot CLI, la version en ligne de commande de GitHub Copilot qui s’exécute en dehors des applications de développement comme Visual Studio Code
- L’équipe Experiences + Devices réduit l’usage de Claude Code d’ici fin juin
- Cela inclut des ingénieurs en charge de Windows, Microsoft 365, Outlook, Microsoft Teams et Surface
- Il est recommandé aux ingénieurs de transférer leurs workflows vers GitHub Copilot CLI dans les semaines à venir avant l’arrêt
Contexte de la décision et calendrier
- Microsoft veut faire converger Copilot CLI comme principal outil d’interface en ligne de commande orienté agent dans l’ensemble d’Experiences + Devices
- Des raisons financières entrent aussi en jeu
- Le 30 juin est le dernier jour de l’exercice fiscal en cours de Microsoft
- Résilier les licences Claude Code facilite la réduction des coûts d’exploitation au démarrage du nouvel exercice en juillet
- Dans une note interne, Rajesh Jha, vice-président du groupe Microsoft Experiences and Devices, a indiqué que l’objectif de proposer à la fois Copilot CLI et Claude Code était d’apprendre et de benchmarker rapidement les outils dans de vrais workflows d’ingénierie, afin de comprendre ce qui convenait le mieux aux équipes
1 commentaires
Réactions sur Hacker News
Plus de détails dans l’article de Fortune Microsoft reports are exposing AI's real cost problem: Using the tech is more expensive than paying human employees - https://fortune.com/2026/05/22/microsoft-ai-cost-problem-tok...
Le conseil consistant à utiliser de façon sélective des modèles moins chers ne correspond pas à la réalité du secteur. La pression reste constante : si vous ne produisez pas du code assez vite, vous pouvez être licencié, donc il est difficile de risquer son gagne-pain en utilisant un modèle moins efficace.
Économiser sur les coûts de tokens est difficilement récompensé dans l’évaluation des performances, et il est aussi compliqué de quantifier combien cela a permis d’économiser par rapport à l’usage d’un modèle plus cher.
Le problème de produire vite du code utile ne se résout pas en consommant plus de tokens par heure. Même des dirigeants non techniques peuvent comprendre cela, et il est probable qu’ils s’intéressent davantage à la structure de théorie des jeux stratégique dans laquelle des attentes implicites de consommation de tokens forcent la concurrence entre développeurs.
Si seul le package de rémunération compte et qu’on veut tenir le plus longtemps possible, il faut au moins s’adapter vaguement à ce nouveau jeu. Entre les extrêmes déjà installés, mieux vaut garder une consommation de tokens modérée afin de se situer au centre statistique dans tous les rapports IA que la direction pourrait produire.
Au final, les entreprises paieront le coût d’un gros retour au réel, car ni la créativité ni la qualité ne peuvent être forcées par l’IA. L’intelligence réelle est encore chez nous aujourd’hui, et le restera dans un avenir prévisible.
Mais quand tout cassera, les dirigeants s’en sortiront au mieux avec d’énormes primes de départ et une “liste de contributions” dont nous devrions soi-disant leur être reconnaissants, tandis que nous subirons la douleur de la prochaine vague de licenciements.
En coût par ligne de code, j’ai toujours constaté que c’était une erreur, sauf si le temps humain coûte moins cher que la machine, ce qui n’arrive pratiquement jamais à moins de considérer que son propre temps vaut 0.
Ce qui a le plus nui à la productivité, c’était quand Claude Code ou Claude Cowork prenait un problème complexe, écrivait de mauvaises consignes pour des agents basés sur des modèles idiots, puis combinait leurs mauvaises réponses en une orchestration de mauvais résultats.
La meilleure manière d’améliorer le résultat par rapport au coût total, c’est de faire lire et réfléchir sur l’ensemble du contenu, et de faire réfléchir le modèle le plus intelligent, pas un agent.
Les agents doivent faire du travail répétitif. Un agent ne doit pas réfléchir, ni décider à quoi réfléchir, car cela constitue déjà de la réflexion.
Si un agent doit “réfléchir”, il doit le faire comme une fourmi, une abeille ou un castor. La pensée de type humain, surtout ce qui ressemble à de l’intuition, doit être laissée au meilleur modèle possible.
Personne ne devrait simplement “cracher” du code. Dans la hiérarchie entre le codeur qui traduit des spécifications détaillées dans un langage informatique, le développeur qui écrit des logiciels livrés selon le calendrier du projet, et l’ingénieur qui atteint des objectifs business, l’ingénieur doit concevoir la structure motrice au service des résultats métier.
Vu sous cet angle, la machine devient un levier pour réduire plusieurs coûts. Mais comme la plupart des données d’entraînement ne comprennent pas cela, la machine non plus, et l’humain doit donc encore donner une forme à ce travail répétitif.
C’était possible pour quelques centimes par dollar, et Microsoft aurait pu réduire les coûts avec des GPU peu utilisés, ou accumuler l’usage de GPU excédentaires. D’ailleurs, le serverless est lui aussi né quelque part de ressources inutilisées sur des serveurs web.
Quand on pense qu’un ancien datacenter de xAI aurait suffi à redonner à Anthropic de l’avance, Microsoft aurait probablement pu auto-héberger cela sur des GPU de génération précédente qui ne font que prendre de la place dans les salles serveurs.
En lisant l’article, on voit que Microsoft fournissait aux développeurs Claude Code et Copilot.
L’idée était qu’ils essaient les deux et donnent un retour sur celui qui était le meilleur.
Les développeurs ont voté avec leurs pieds et n’ont pas utilisé Copilot.
Ce n’est sans doute pas du tout ce que Microsoft espérait.
Contrairement au “vrai” Claude Code ou à Cowork, cela n’accède qu’aux fichiers d’un dossier OneDrive précis dans un conteneur SharePoint personnel, donc c’est bien plus compatible avec des exigences de conformité comme NIS2.
Techniquement, nous utilisons Copilot et nous le payons via une licence Microsoft, mais en interne nous utilisons Opus 4.7. Avant cela aussi, la plupart des agents personnalisés dans m365 copilot reposaient sur l’un des modèles GPT.
Ou alors ils veulent vraiment pousser les développeurs à utiliser les modèles Copilot.
Le choix du modèle sous-jacent reste toutefois sans restriction. Opus 4.6 est de loin le plus populaire, et d’importants coûts continuent d’aller vers Anthropic.
Franchement, je trouve GitHub Copilot CLI et la nouvelle app GitHub Copilot plutôt bons. J’utilise surtout Opus 4.7, et plus rarement GPT-5.5. L’extension VSCode est correcte, mais je pense que la CLI ou l’app offrent une meilleure expérience.
Bien sûr, il faut connaître les autres options du marché et utiliser l’outil adapté au travail, mais s’il existe un produit concurrent direct, l’entreprise préférera que la télémétrie et les suggestions internes servent à améliorer son propre logiciel plutôt que celui d’un concurrent.
Il existe clairement une manière d’utiliser Claude Code en faisant attention aux tokens.
J’ai testé un workflow d’usine logicielle de type agent sans supervision : ça brûlait énormément de tokens pour très peu de résultats.
À l’inverse, un processus supervisé avec intervention humaine au milieu est bien plus productif tout en consommant beaucoup moins. C’est peut-être pour ça que tout le monde pousse autant l’approche par agents.
J’ai donc résolu ça en créant carrément une skill de revue de code parallèle en mode agent. C’est en gros un générateur infini de TODO. Maintenant, je suis sûr d’utiliser 100 % de ce que je paie.
Ça brûle énormément de tokens, mais ça détecte aussi beaucoup de problèmes. Je répète ce processus de revue/correction chaque semaine, et cela a fortement réduit la quantité de choses auxquelles un humain doit faire attention pendant la revue.
En comparaison, l’abonnement Mistral coûte environ 20 euros par mois et, sur des tâches similaires, les tests étaient satisfaisants tout en consommant à peu près 10 % de la limite mensuelle par jour. Même le plan Anthropic Max 5x offre bien plus de tokens utilisables à volonté.
L’optimum semble être l’abonnement mensuel, quel que soit le fournisseur. Il est visiblement fortement subventionné. Mais si je devais payer au token, je commencerais maintenant par voir quelles tâches peuvent passer sur DeepSeek. Malheureusement, ce ne serait probablement pas adapté à la situation évoquée ici, mais pour une startup ce pourrait être différent.
D’un autre côté, cela paraît un peu hypocrite. Cela faisait partie d’un effort pour permettre à des chefs de projet, des designers et d’autres employés d’expérimenter le code pour la première fois, et l’article expliquait que Claude Code était devenu très populaire chez Microsoft ces six derniers mois.
On dit que l’avenir est entièrement à l’IA, puis, quand la facture arrive, le ton change.
Si on lit bien l’article, Microsoft chercherait à supprimer la plupart des licences Claude Code et à faire migrer beaucoup de développeurs vers Copilot CLI.
Claude Code était populaire, mais affaiblissait aussi le nouvel outil de codage GitHub Copilot CLI de Microsoft, la version en ligne de commande de GitHub Copilot qui s’exécute hors des applications de développement comme Visual Studio Code.
Or ici, beaucoup interprètent surtout cela comme un problème de tokens que Claude brûle trop vite, et suggèrent que Microsoft devrait utiliser SomeOtherLLM©.
Je ne sais plus si on est sur Hacker News ou sur un champ de bataille marketing.
[1] Internet Rule #48
Notre organisation nous oblige à utiliser Copilot sur un cloud gouvernemental, mais c’est tellement inutile qu’en général on finit simplement par coder nous-mêmes.
La syntaxe est sale, il fusionne des lignes au hasard, inverse l’ordre, balance quelques tokens de sortie au milieu d’une ligne, et omet bizarrement sans arrêt la dernière ligne de tous les blocs de code. On dirait qu’en interne ils utilisent un GPT vieux de plusieurs versions.
Cela dit, ça permet de sentir que les modèles de l’année écoulée ont franchi le cap entre “intéressant” et réellement productif.
Entre Copilot, Claude et Gemini, je préfère toujours Gemini en pratique. J’écris aussi beaucoup de textes scientifiques hors du code, et Gemini est le seul modèle auquel je peux faire confiance pour “juste avoir raison”. Cette confiance se répercute aussi sur sa sortie de code.
Globalement, ça sonne juste.
Le même jour, nous avons lancé Claude Code et DeepSeek dans une démo interne : Claude a épuisé son quota mensuel en un peu plus d’une semaine, et plus de la moitié de ce budget est partie en une journée. Avec DeepSeek, les gens n’arrivent tout simplement pas à dépenser autant en un mois, même en essayant.
Du coup, Claude donne l’impression d’un gadget coûteux, tandis que DeepSeek ressemble à une pelle, parce qu’en l’utilisant les développeurs n’ont pas l’impression de grignoter une ressource précieuse.
La différence de capacité entre Claude et DS-pro ne semble pas énorme. L’écart entre DS-pro et flash rappelle celui entre sonnet/opus et haiku, mais flash reste malgré tout très compétent.
Depuis deux semaines, Claude n’a cessé d’empirer, et aujourd’hui c’était la goutte de trop.
Peu importe qu’il y ait une app mobile ou non. Une fois qu’ils considèrent qu’ils vous ont “capturé” parce que vous êtes abonné depuis assez longtemps, le modèle devient de la pure camelote.
Si le modèle va exactement à l’opposé de ce qu’il dit et agit à l’inverse des consignes, on ne peut pas coder depuis un téléphone. Si vous voulez juste dégrader le code, il suffit de commit n’importe quelle merde. Pas besoin d’une app mobile pour ça.
Ça me rappelle quand Steve Ballmer interdisait à ses enfants d’utiliser un iPod et les obligeait à utiliser un Zune.
Je suis plutôt satisfait du plan à 10 dollars de CoPilot. Il donne toujours accès aux modèles Claude, avec une limite de tokens, mais contrairement au plan Claude à 20 dollars il n’y a pas de limite horaire, donc le flux de travail ne s’interrompt pas.
Pour les tâches ordinaires, j’utilise l’un des modèles gratuits, et pour les problèmes particulièrement difficiles, j’active Claude. Pour moi, ça fonctionne très bien.
GitHub Copilot était probablement le meilleur rapport qualité-prix, et à mon avis il a longtemps été sous-estimé. J’étais abonné annuel depuis le premier jour.
Les changements annoncés il y a quelques jours ont complètement détruit cette proposition de valeur, et je me demande si je vais continuer à m’abonner.
Le nouveau modèle tarifaire a changé cela. Je pense quand même le garder pour l’autocomplétion, pour les rares fois où j’ouvre l’éditeur.
Quand des développeurs sont licenciés au motif que l’IA serait meilleure, plus rapide, moins chère, ou qu’elle rendrait les gens 10x plus productifs, je me demande ce qui se passe quand les outils nécessaires finissent par coûter encore plus cher.
Du point de vue d’un investisseur, qu’est-ce qui est pire : le poids du coût des employés, ou une ligne de dépenses qui enfle ?
Si le marché boursier était rationnel, ça ne marcherait pas, mais le marché boursier n’est jamais rationnel.
Les preuves d’une destruction du travail ne se voient que dans le recrutement junior. Ce n’est pas que les gens sont licenciés : c’est que les postes d’entrée se font cannibaliser.
En outre, les grands modèles de langage travaillent 24 h/24, 365 j/an, et peuvent être étendus ou réduits à la demande. En Europe surtout, il est plus rapide d’éteindre un grand modèle de langage que de licencier un salarié.
Donc même si l’IA coûte plus cher qu’un développeur, cela peut malgré tout rester pertinent pour l’entreprise en termes de coût total de possession et de retour sur investissement.
Ce type de technologie finit généralement, au mieux, en oligopole, et à ce moment-là les acteurs disposent de larges douves défensives. De plus, ce que ces modèles produisent sera ajusté de sorte que ni d’autres modèles ni des humains ne puissent raisonnablement retravailler dessus, et ensuite ils pourront augmenter les prix en poussant tout le monde jusqu’au bord de la rentabilité.
En tenant compte des avantages, des congés payés et des autres frais indirects liés à l’emploi, le coût représente environ 1,5 développeur. En d’autres termes, pour le prix de 1,5 personne, on obtient le travail de 2.
À l’échelle d’une grande entreprise avec 500 développeurs, cela représente une économie énorme sur les salaires.
Par rapport au maintien des effectifs ou à l’embauche de remplaçants humains, il faudrait que l’IA coûte plus de 15 000 dollars par développeur et par mois pour commencer à être plus chère. Pour qu’un humain atteigne le point d’équilibre ou devienne moins cher, on parlerait d’environ 4 milliards de tokens par mois.