Microsoft commence à retirer des licences Claude Code

(theverge.com)

1 points par GN⁺ 3 시간 전 | 1 commentaires | Partager sur WhatsApp

Microsoft a ouvert l’accès à Claude Code à plusieurs milliers de développeurs en interne à partir de décembre, mais revient sur cette extension après seulement six mois
Claude Code a gagné en popularité en servant aussi aux expérimentations de codage de chefs de projet, designers et autres employés, mais il s’est retrouvé en concurrence avec GitHub Copilot CLI
Microsoft veut supprimer la plupart des licences Claude Code et faire migrer de nombreux développeurs vers Copilot CLI afin de converger vers un principal outil de ligne de commande orienté agent
L’équipe Experiences + Devices réduit son usage d’ici fin juin, avec notamment des ingénieurs de Windows, Microsoft 365, Outlook, Teams et Surface
Cette décision coïncide avec la fin de l’exercice fiscal le 30 juin, et la résiliation des licences facilite la réduction des coûts d’exploitation au début du nouvel exercice en juillet

Réduction des licences Claude Code

Microsoft a ouvert à partir de décembre l’accès à Claude Code à plusieurs milliers de développeurs en interne afin qu’ils utilisent au quotidien l’outil de codage IA d’Anthropic
Cela faisait partie d’un effort visant à permettre à des chefs de projet, designers et autres employés d’expérimenter le codage pour la première fois
Claude Code a gagné en popularité chez Microsoft au cours des six derniers mois, mais l’entreprise se prépare à faire machine arrière sur cette expansion

Transition vers Copilot CLI

Microsoft veut supprimer la plupart des licences Claude Code et faire migrer de nombreux développeurs vers GitHub Copilot CLI
La popularité de Claude Code est entrée en conflit avec GitHub Copilot CLI, la version en ligne de commande de GitHub Copilot qui s’exécute en dehors des applications de développement comme Visual Studio Code
L’équipe Experiences + Devices réduit l’usage de Claude Code d’ici fin juin
- Cela inclut des ingénieurs en charge de Windows, Microsoft 365, Outlook, Microsoft Teams et Surface
- Il est recommandé aux ingénieurs de transférer leurs workflows vers GitHub Copilot CLI dans les semaines à venir avant l’arrêt

Contexte de la décision et calendrier

Microsoft veut faire converger Copilot CLI comme principal outil d’interface en ligne de commande orienté agent dans l’ensemble d’Experiences + Devices
Des raisons financières entrent aussi en jeu
- Le 30 juin est le dernier jour de l’exercice fiscal en cours de Microsoft
- Résilier les licences Claude Code facilite la réduction des coûts d’exploitation au démarrage du nouvel exercice en juillet
Dans une note interne, Rajesh Jha, vice-président du groupe Microsoft Experiences and Devices, a indiqué que l’objectif de proposer à la fois Copilot CLI et Claude Code était d’apprendre et de benchmarker rapidement les outils dans de vrais workflows d’ingénierie, afin de comprendre ce qui convenait le mieux aux équipes

1 commentaires

GN⁺ 3 시간 전

Réactions sur Hacker News

Plus de détails dans l’article de Fortune Microsoft reports are exposing AI's real cost problem: Using the tech is more expensive than paying human employees - https://fortune.com/2026/05/22/microsoft-ai-cost-problem-tok...
Le conseil consistant à utiliser de façon sélective des modèles moins chers ne correspond pas à la réalité du secteur. La pression reste constante : si vous ne produisez pas du code assez vite, vous pouvez être licencié, donc il est difficile de risquer son gagne-pain en utilisant un modèle moins efficace.
Économiser sur les coûts de tokens est difficilement récompensé dans l’évaluation des performances, et il est aussi compliqué de quantifier combien cela a permis d’économiser par rapport à l’usage d’un modèle plus cher.
- Mesurer l’usage de tokens, c’est un peu comme mesurer la quantité de sciure produite sur un chantier.
  Le problème de produire vite du code utile ne se résout pas en consommant plus de tokens par heure. Même des dirigeants non techniques peuvent comprendre cela, et il est probable qu’ils s’intéressent davantage à la structure de théorie des jeux stratégique dans laquelle des attentes implicites de consommation de tokens forcent la concurrence entre développeurs.
  Si seul le package de rémunération compte et qu’on veut tenir le plus longtemps possible, il faut au moins s’adapter vaguement à ce nouveau jeu. Entre les extrêmes déjà installés, mieux vaut garder une consommation de tokens modérée afin de se situer au centre statistique dans tous les rapports IA que la direction pourrait produire.
- La tragédie de cette pression à produire du code rapidement, c’est qu’elle n’est pas soutenable. Tous ceux qui sont profondément impliqués dans la technique le savent.
  Au final, les entreprises paieront le coût d’un gros retour au réel, car ni la créativité ni la qualité ne peuvent être forcées par l’IA. L’intelligence réelle est encore chez nous aujourd’hui, et le restera dans un avenir prévisible.
  Mais quand tout cassera, les dirigeants s’en sortiront au mieux avec d’énormes primes de départ et une “liste de contributions” dont nous devrions soi-disant leur être reconnaissants, tandis que nous subirons la douleur de la prochaine vague de licenciements.
- Recommander d’“utiliser sélectivement des modèles moins chers”, y compris ANTHROP\C, est une mauvaise affaire, parce que cela revient à consacrer un temps humain de plus en plus coûteux à réparer des machines qui deviennent de moins en moins chères avec le temps.
  En coût par ligne de code, j’ai toujours constaté que c’était une erreur, sauf si le temps humain coûte moins cher que la machine, ce qui n’arrive pratiquement jamais à moins de considérer que son propre temps vaut 0.
  Ce qui a le plus nui à la productivité, c’était quand Claude Code ou Claude Cowork prenait un problème complexe, écrivait de mauvaises consignes pour des agents basés sur des modèles idiots, puis combinait leurs mauvaises réponses en une orchestration de mauvais résultats.
  La meilleure manière d’améliorer le résultat par rapport au coût total, c’est de faire lire et réfléchir sur l’ensemble du contenu, et de faire réfléchir le modèle le plus intelligent, pas un agent.
  Les agents doivent faire du travail répétitif. Un agent ne doit pas réfléchir, ni décider à quoi réfléchir, car cela constitue déjà de la réflexion.
  Si un agent doit “réfléchir”, il doit le faire comme une fourmi, une abeille ou un castor. La pensée de type humain, surtout ce qui ressemble à de l’intuition, doit être laissée au meilleur modèle possible.
  Personne ne devrait simplement “cracher” du code. Dans la hiérarchie entre le codeur qui traduit des spécifications détaillées dans un langage informatique, le développeur qui écrit des logiciels livrés selon le calendrier du projet, et l’ingénieur qui atteint des objectifs business, l’ingénieur doit concevoir la structure motrice au service des résultats métier.
  Vu sous cet angle, la machine devient un levier pour réduire plusieurs coûts. Mais comme la plupart des données d’entraînement ne comprennent pas cela, la machine non plus, et l’humain doit donc encore donner une forme à ce travail répétitif.
- Sur un projet, j’ai moi-même volontiers utilisé Opus 4.6 fast mode pour environ 5 000 dollars. La livraison du projet justifiait ces 5 000 dollars ; si je n’avais dépensé que 500 dollars mais livré avec un mois de retard, cela aurait été bien plus problématique.
- Ce qui m’intrigue vraiment, c’est pourquoi ils n’ont pas utilisé une copie auto-hébergée. Sur Azure, cela veut dire repayer Anthropic ? Ils auraient pu négocier pour obtenir un usage des modèles d’Anthropic bien moins cher, et Anthropic aurait pu faire en sorte que Claude Code s’intègre directement à Azure pour les employés de Microsoft.
  C’était possible pour quelques centimes par dollar, et Microsoft aurait pu réduire les coûts avec des GPU peu utilisés, ou accumuler l’usage de GPU excédentaires. D’ailleurs, le serverless est lui aussi né quelque part de ressources inutilisées sur des serveurs web.
  Quand on pense qu’un ancien datacenter de xAI aurait suffi à redonner à Anthropic de l’avance, Microsoft aurait probablement pu auto-héberger cela sur des GPU de génération précédente qui ne font que prendre de la place dans les salles serveurs.
En lisant l’article, on voit que Microsoft fournissait aux développeurs Claude Code et Copilot.
L’idée était qu’ils essaient les deux et donnent un retour sur celui qui était le meilleur.
Les développeurs ont voté avec leurs pieds et n’ont pas utilisé Copilot.
Ce n’est sans doute pas du tout ce que Microsoft espérait.
- Il est possible que Microsoft déplace Copilot vers des technologies moins dépendantes d’un modèle particulier. Récemment, l’entreprise a ajouté Cowork basé sur Opus 4.7 et s’est mise à utiliser Microsoft 365 Copilot, et c’était meilleur que les alternatives auxquelles nous avons accès.
  Contrairement au “vrai” Claude Code ou à Cowork, cela n’accède qu’aux fichiers d’un dossier OneDrive précis dans un conteneur SharePoint personnel, donc c’est bien plus compatible avec des exigences de conformité comme NIS2.
  Techniquement, nous utilisons Copilot et nous le payons via une licence Microsoft, mais en interne nous utilisons Opus 4.7. Avant cela aussi, la plupart des agents personnalisés dans m365 copilot reposaient sur l’un des modèles GPT.
  Ou alors ils veulent vraiment pousser les développeurs à utiliser les modèles Copilot.
- Pendant quelques mois, les employés pouvaient choisir entre Claude Code et Copilot, mais ce n’est plus le cas.
  Le choix du modèle sous-jacent reste toutefois sans restriction. Opus 4.6 est de loin le plus populaire, et d’importants coûts continuent d’aller vers Anthropic.
- La plupart d’entre nous n’avions pas la possibilité d’utiliser Claude Code aux frais de l’entreprise ; seules certaines organisations internes l’avaient. Cela dit, j’ai personnellement pris un abonnement Claude Code pendant un moment.
  Franchement, je trouve GitHub Copilot CLI et la nouvelle app GitHub Copilot plutôt bons. J’utilise surtout Opus 4.7, et plus rarement GPT-5.5. L’extension VSCode est correcte, mais je pense que la CLI ou l’app offrent une meilleure expérience.
- J’aimerais comprendre l’intérêt d’utiliser Claude Code dans VSCode plutôt que Copilot. J’ai l’impression de passer à côté de quelque chose d’évident.
- Historiquement, Microsoft a eu tendance à dogfooder ses propres produits.
  Bien sûr, il faut connaître les autres options du marché et utiliser l’outil adapté au travail, mais s’il existe un produit concurrent direct, l’entreprise préférera que la télémétrie et les suggestions internes servent à améliorer son propre logiciel plutôt que celui d’un concurrent.
Il existe clairement une manière d’utiliser Claude Code en faisant attention aux tokens.
J’ai testé un workflow d’usine logicielle de type agent sans supervision : ça brûlait énormément de tokens pour très peu de résultats.
À l’inverse, un processus supervisé avec intervention humaine au milieu est bien plus productif tout en consommant beaucoup moins. C’est peut-être pour ça que tout le monde pousse autant l’approche par agents.
- Oui. Claude travaille bien, mais il faut tout de même pas mal de temps pour le relire correctement. À un moment, c’était devenu difficile de consommer tout le quota hebdomadaire.
  J’ai donc résolu ça en créant carrément une skill de revue de code parallèle en mode agent. C’est en gros un générateur infini de TODO. Maintenant, je suis sûr d’utiliser 100 % de ce que je paie.
  Ça brûle énormément de tokens, mais ça détecte aussi beaucoup de problèmes. Je répète ce processus de revue/correction chaque semaine, et cela a fortement réduit la quantité de choses auxquelles un humain doit faire attention pendant la revue.
- L’idée actuelle dans le secteur, c’est que les agents d’automatisation vont faire passer ce marché de dizaines de milliards de dollars à des milliers de milliards. Vous avez bien compris : les agents stimulent la demande pour ce que ces entreprises fabriquent.
- Je trouve ça positif dans la mesure où cela permet à un grand nombre de gens d’expérimenter directement la gestion des ressources. Comparé à l’apprentissage par la gestion d’humains, c’est une manière assez peu coûteuse d’acquérir cette expérience, et tout le monde peut bénéficier de ce transfert de compétences.
- Au niveau entreprise, il sera difficile de vouloir utiliser un service dont le coût est imprévisible et dont la maîtrise suppose de former les employés.
- Un collègue a fait un travail de codage agentique assez banal avec Sonnet 4.6 via AWS Bedrock pour garder les données dans l’UE, et il a dépensé 100 euros en une seule journée.
  En comparaison, l’abonnement Mistral coûte environ 20 euros par mois et, sur des tâches similaires, les tests étaient satisfaisants tout en consommant à peu près 10 % de la limite mensuelle par jour. Même le plan Anthropic Max 5x offre bien plus de tokens utilisables à volonté.
  L’optimum semble être l’abonnement mensuel, quel que soit le fournisseur. Il est visiblement fortement subventionné. Mais si je devais payer au token, je commencerais maintenant par voir quelles tâches peuvent passer sur DeepSeek. Malheureusement, ce ne serait probablement pas adapté à la situation évoquée ici, mais pour une startup ce pourrait être différent.
  D’un autre côté, cela paraît un peu hypocrite. Cela faisait partie d’un effort pour permettre à des chefs de projet, des designers et d’autres employés d’expérimenter le code pour la première fois, et l’article expliquait que Claude Code était devenu très populaire chez Microsoft ces six derniers mois.
  On dit que l’avenir est entièrement à l’IA, puis, quand la facture arrive, le ton change.
Si on lit bien l’article, Microsoft chercherait à supprimer la plupart des licences Claude Code et à faire migrer beaucoup de développeurs vers Copilot CLI.
Claude Code était populaire, mais affaiblissait aussi le nouvel outil de codage GitHub Copilot CLI de Microsoft, la version en ligne de commande de GitHub Copilot qui s’exécute hors des applications de développement comme Visual Studio Code.
Or ici, beaucoup interprètent surtout cela comme un problème de tokens que Claude brûle trop vite, et suggèrent que Microsoft devrait utiliser SomeOtherLLM©.
Je ne sais plus si on est sur Hacker News ou sur un champ de bataille marketing.
- Aucun forum public n’est naturellement immunisé contre la diffusion du marketing de guérilla. [1]
  [1] Internet Rule #48
- Un titre plus juste serait sans doute : “Microsoft a décidé de manger sa propre nourriture pour chiens”.
- On dirait qu’un forum nommé Hacker News a été piraté et discrètement refactoré en Marketing Wars. Après tout, l’objectif principal a toujours été de créer un espace pour attirer des projets marketing et des startups.
- J’ai l’impression que beaucoup de gens n’ont pas lu l’article. Moi non plus, jusqu’à voir ce commentaire. Honnêtement, l’article ressemble à du clickbait.
Notre organisation nous oblige à utiliser Copilot sur un cloud gouvernemental, mais c’est tellement inutile qu’en général on finit simplement par coder nous-mêmes.
La syntaxe est sale, il fusionne des lignes au hasard, inverse l’ordre, balance quelques tokens de sortie au milieu d’une ligne, et omet bizarrement sans arrêt la dernière ligne de tous les blocs de code. On dirait qu’en interne ils utilisent un GPT vieux de plusieurs versions.
Cela dit, ça permet de sentir que les modèles de l’année écoulée ont franchi le cap entre “intéressant” et réellement productif.
Entre Copilot, Claude et Gemini, je préfère toujours Gemini en pratique. J’écris aussi beaucoup de textes scientifiques hors du code, et Gemini est le seul modèle auquel je peux faire confiance pour “juste avoir raison”. Cette confiance se répercute aussi sur sa sortie de code.
- Si vous parlez de Copilot intégré à VS Code, mon expérience récente ne ressemble pas du tout à ça. Depuis la sortie de gpt 5.4, il est devenu très compétent en mode agent.
Globalement, ça sonne juste.
Le même jour, nous avons lancé Claude Code et DeepSeek dans une démo interne : Claude a épuisé son quota mensuel en un peu plus d’une semaine, et plus de la moitié de ce budget est partie en une journée. Avec DeepSeek, les gens n’arrivent tout simplement pas à dépenser autant en un mois, même en essayant.
Du coup, Claude donne l’impression d’un gadget coûteux, tandis que DeepSeek ressemble à une pelle, parce qu’en l’utilisant les développeurs n’ont pas l’impression de grignoter une ressource précieuse.
La différence de capacité entre Claude et DS-pro ne semble pas énorme. L’écart entre DS-pro et flash rappelle celui entre sonnet/opus et haiku, mais flash reste malgré tout très compétent.
- J’ai annulé Claude aujourd’hui, par colère.
  Depuis deux semaines, Claude n’a cessé d’empirer, et aujourd’hui c’était la goutte de trop.
  Peu importe qu’il y ait une app mobile ou non. Une fois qu’ils considèrent qu’ils vous ont “capturé” parce que vous êtes abonné depuis assez longtemps, le modèle devient de la pure camelote.
  Si le modèle va exactement à l’opposé de ce qu’il dit et agit à l’inverse des consignes, on ne peut pas coder depuis un téléphone. Si vous voulez juste dégrader le code, il suffit de commit n’importe quelle merde. Pas besoin d’une app mobile pour ça.
- Vous avez envisagé Gemini aussi ?
Ça me rappelle quand Steve Ballmer interdisait à ses enfants d’utiliser un iPod et les obligeait à utiliser un Zune.
Je suis plutôt satisfait du plan à 10 dollars de CoPilot. Il donne toujours accès aux modèles Claude, avec une limite de tokens, mais contrairement au plan Claude à 20 dollars il n’y a pas de limite horaire, donc le flux de travail ne s’interrompt pas.
Pour les tâches ordinaires, j’utilise l’un des modèles gratuits, et pour les problèmes particulièrement difficiles, j’active Claude. Pour moi, ça fonctionne très bien.
- Je ne sais pas si vous parlez de l’ancien plan ou du nouveau.
  GitHub Copilot était probablement le meilleur rapport qualité-prix, et à mon avis il a longtemps été sous-estimé. J’étais abonné annuel depuis le premier jour.
  Les changements annoncés il y a quelques jours ont complètement détruit cette proposition de valeur, et je me demande si je vais continuer à m’abonner.
- Pendant quelques semaines, Copilot a été la meilleure affaire parmi les outils IA.
  Le nouveau modèle tarifaire a changé cela. Je pense quand même le garder pour l’autocomplétion, pour les rares fois où j’ouvre l’éditeur.
- Vous pouvez aussi acheter davantage de premium tokens pour utiliser plus de Claude, et je l’ai effectivement fait une fois. Mais dans la plupart des cas, les tokens inclus dans le plan suffisent.
Quand des développeurs sont licenciés au motif que l’IA serait meilleure, plus rapide, moins chère, ou qu’elle rendrait les gens 10x plus productifs, je me demande ce qui se passe quand les outils nécessaires finissent par coûter encore plus cher.
Du point de vue d’un investisseur, qu’est-ce qui est pire : le poids du coût des employés, ou une ligne de dépenses qui enfle ?
- On licencie des gens pour bien paraître devant les investisseurs. Ensuite on réembauche des gens et on parle de “croissance” pour à nouveau bien paraître devant les investisseurs.
  Si le marché boursier était rationnel, ça ne marcherait pas, mais le marché boursier n’est jamais rationnel.
- À mon avis, dire que les développeurs sont licenciés parce que l’IA est meilleure, plus rapide et moins chère, c’est du grand n’importe quoi. Si les ingénieurs logiciels sont licenciés, c’est à cause de la sur-embauche post-Covid.
  Les preuves d’une destruction du travail ne se voient que dans le recrutement junior. Ce n’est pas que les gens sont licenciés : c’est que les postes d’entrée se font cannibaliser.
- Savoir si c’est plus cher est difficile à calculer. Si cela permet d’aller plus vite et de lancer plus tôt sur le marché, un coût plus élevé peut parfois se justifier.
  En outre, les grands modèles de langage travaillent 24 h/24, 365 j/an, et peuvent être étendus ou réduits à la demande. En Europe surtout, il est plus rapide d’éteindre un grand modèle de langage que de licencier un salarié.
  Donc même si l’IA coûte plus cher qu’un développeur, cela peut malgré tout rester pertinent pour l’entreprise en termes de coût total de possession et de retour sur investissement.
- Si tout se déroule comme prévu pour eux, les modèles finiront probablement par coûter bien plus cher que les employés qu’ils remplacent.
  Ce type de technologie finit généralement, au mieux, en oligopole, et à ce moment-là les acteurs disposent de larges douves défensives. De plus, ce que ces modèles produisent sera ajusté de sorte que ni d’autres modèles ni des humains ne puissent raisonnablement retravailler dessus, et ensuite ils pourront augmenter les prix en poussant tout le monde jusqu’au bord de la rentabilité.
- Tant que l’IA ne devient pas brutalement plus chère, il sera difficile qu’elle paraisse moins avantageuse qu’un salaire. Si un développeur utilisant Claude Code peut effectivement remplacer deux développeurs, alors, même en supposant un usage très intensif aux prix actuels des API, c’est déjà rentable.
  En tenant compte des avantages, des congés payés et des autres frais indirects liés à l’emploi, le coût représente environ 1,5 développeur. En d’autres termes, pour le prix de 1,5 personne, on obtient le travail de 2.
  À l’échelle d’une grande entreprise avec 500 développeurs, cela représente une économie énorme sur les salaires.
  Par rapport au maintien des effectifs ou à l’embauche de remplaçants humains, il faudrait que l’IA coûte plus de 15 000 dollars par développeur et par mois pour commencer à être plus chère. Pour qu’un humain atteigne le point d’équilibre ou devienne moins cher, on parlerait d’environ 4 milliards de tokens par mois.

Microsoft commence à retirer des licences Claude Code

Réduction des licences Claude Code

Transition vers Copilot CLI

Contexte de la décision et calendrier

À lire aussi

1 commentaires

Réactions sur Hacker News