Un rapport de Microsoft révèle que l’IA coûte plus cher que l’embauche de salariés humains

(fortune.com)

10 points par GN⁺ 2026-05-25 | 2 commentaires | Partager sur WhatsApp

Microsoft réduit le coût de ses outils d’IA internes en annulant la plupart des licences directes de Claude Code et en basculant ses ingénieurs vers GitHub Copilot CLI
Claude Code, fourni à des milliers d’employés pour des expérimentations de codage, a rapidement gagné en popularité, mais l’augmentation des coûts a suivi à mesure que son usage s’est étendu
Uber a déjà épuisé en quatre mois l’intégralité de son budget 2026 pour les outils de codage IA, et encourage l’usage des outils IA par équipe via un classement interne
À mesure que les entreprises augmentent leur consommation de tokens pour améliorer la productivité, la facture totale peut augmenter même si le prix unitaire des tokens baisse
Goldman Sachs estime que l’IA agentique pourrait multiplier par 24 la consommation de tokens d’ici 2030, et Gartner juge lui aussi que la hausse de la consommation pourrait dépasser la baisse des prix unitaires

Extension de l’usage interne de l’IA en entreprise et pression sur les coûts

Microsoft a commencé à annuler la plupart des licences directes de Claude Code après un article de The Verge, et transfère ses ingénieurs vers GitHub Copilot CLI
L’accès à Claude Code avait été ouvert il y a six mois à des milliers d’employés — développeurs, chefs de projet, designers, etc. — pour des expérimentations de codage, et l’outil a rapidement gagné en popularité, mais les problèmes de coût sont devenus plus visibles à mesure que l’usage s’est généralisé
L’annulation des licences Claude Code n’affecte pas le contrat Foundry de Microsoft
- Cet accord comprend un investissement pouvant aller jusqu’à 5 milliards de dollars dans Anthropic, l’accès des clients Foundry aux modèles Claude, et un engagement d’achat de 30 milliards de dollars de capacité de calcul Azure par Anthropic
Praveen Neppalli Naga, CTO d’Uber, a déclaré à The Information qu’Uber avait déjà consommé la totalité de son budget 2026 pour les outils de codage IA en seulement quatre mois
Uber encourage activement l’adoption via un classement interne qui hiérarchise l’usage des outils IA par équipe
Bryan Catanzaro, vice-président de l’apprentissage profond appliqué chez Nvidia, a déclaré dans une interview à Axios : « Dans mon équipe, les coûts de calcul dépassent de loin les coûts salariaux. »
Anthropic n’a pas répondu immédiatement à la demande de commentaire de Fortune, et Microsoft n’a pas non plus fait de commentaire

Quand des tokens moins chers produisent une facture plus élevée

Les entreprises poussent leurs employés à utiliser davantage l’IA pour gagner en productivité, mais avec une facturation fondée sur les tokens, plus l’usage augmente, plus le coût total grimpe
Un employé de Meta a créé un tableau de bord nommé d’après les modèles d’Anthropic, le classement « Claudeonomics », pour suivre l’usage de l’IA par employé
Amazon encourage ses employés au « tokenmaxxing », c’est-à-dire à utiliser un maximum de tokens, l’unité de base du calcul IA
Goldman Sachs prévoit qu’avec l’adoption d’agents IA par les consommateurs et les entreprises, l’IA agentique pourrait multiplier par 24 la consommation de tokens d’ici 2030, pour atteindre 120 duodécillions de tokens par mois
Gartner estime que le coût d’inférence d’un LLM à 1 trillion de paramètres pourrait baisser de près de 90 % d’ici 2030 par rapport à 2025, mais prévoit que des tokens moins chers ne se traduiront pas automatiquement par une réduction des coûts IA pour les entreprises
- Les modèles agentiques nécessitent bien plus de tokens par tâche que les modèles standards
- La hausse de la consommation peut dépasser la baisse des prix unitaires
- Les fournisseurs d’IA pourraient ne pas répercuter intégralement la baisse des coûts sur les clients
Will Sommer, Senior Director Analyst chez Gartner, a averti : « Les CPO ne doivent pas confondre la déflation des tokens généralistes avec la démocratisation de l’inférence de frontière. »
Le CEO de Nvidia, Jensen Huang, a déclaré qu’un jour 100 agents IA travailleront aux côtés de chaque employé, mais si la consommation de tokens augmente plus vite que la baisse des prix unitaires, cet avenir agentique pourrait s’accompagner de coûts bien plus lourds que prévu par les dirigeants

2 commentaires

GN⁺ 2026-05-25

Commentaires sur Hacker News

La discussion animée basée sur l’article original se trouve ici : https://news.ycombinator.com/item?id=48238896
L’article indique que « The Verge a rapporté que Microsoft a commencé à annuler la plupart de ses licences directes de Claude Code »
- Cet article semble avoir été rédigé de manière assez brouillonne
  1. Il n’y a aucune citation où Microsoft dit que l’IA coûte plus cher que les employés
  2. L’équipe deep learning de Nvidia dépense plus en IA qu’en employés, mais comme l’objectif de cette équipe n’est pas le codage agentique mais un usage profond et intensif de l’IA, cela se comprend
    Le passage disant que « dans une facturation basée sur les tokens, plus on l’utilise et plus l’efficacité s’améliore, plus cela coûte cher » est aussi étrange. Je ne vois pas pourquoi une meilleure efficacité ferait augmenter les coûts
Le titre semble trompeur, et en lisant l’article, on comprend encore mieux pourquoi. Dans ces entreprises, il existe des OKR et des objectifs absurdes du type brûlez autant de tokens que possible
Si l’on fait de l’usage des tokens un indicateur, on obtient forcément un résultat extrêmement coûteux
Le coût d’inférence lui-même reste supportable, et il n’est pas nécessaire d’avoir les tout derniers modèles propriétaires pour utiliser cette technologie utilement. Les ingénieurs humains seront encore nécessaires pendant longtemps, mais je ne suis pas d’accord avec l’idée que « quelques humains + un LLM » seraient plus chers que d’embaucher simplement davantage d’humains, ni que cela le resterait durablement
- On aurait aussi pu le dire comme ça : l’entreprise a introduit un OKR imposant au service informatique de dépenser plus de 1 000 dollars par jour et par développeur. L’entreprise s’étonne alors de voir ses coûts IT bien plus élevés qu’avant. Puis elle décide de créer un système pour comprendre pourquoi cela arrive, et porte le montant à 1 500 dollars par jour et par développeur
  En ce moment, le problème me semble être moins le vibe coding que le vibe leadership, et le vibe leadership n’a au fond rien à voir avec l’IA. Ce sont des gens qui s’accrochent à une intuition floue et poussent jusqu’à des conclusions irrationnelles, sans rapport avec les coûts ni les résultats
- À lire l’article, on dirait qu’ils n’ont pas renoncé à « l’IA », mais qu’ils ont simplement remplacé le LLM de Claude Code par GitHub Copilot
- Loi de Goodhart : lorsqu’un indicateur devient un objectif, il cesse d’être un bon indicateur
- J’ai l’impression que les chiffres de revenus qui enthousiasment les investisseurs reposent justement sur ce monde où les tokens servent d’indicateur. On ne peut pas à la fois parler d’une activité en croissance explosive et dire qu’il faut en même temps resserrer fortement les dépenses pour obtenir un retour sur investissement
- On dirait que les médias ont décidé de s’acharner contre l’IA. Le fil d’actualité n’est rempli que d’articles sur les méfaits des datacenters, l’inutilité de l’IA, et le fait que tout le monde déteste l’IA
Le postulat de cet article est faux. Si Microsoft annule l’usage interne de Claude Code, ce n’est pas parce que le coût de l’IA est trop élevé, mais parce que l’entreprise possède le produit concurrent GitHub Copilot et veut que ses employés utilisent son propre produit
C’est la même raison pour laquelle Teams a bénéficié d’autant d’attention pendant les confinements
- Oui. L’article mélange l’action de Microsoft avec une question de coût, alors qu’en réalité ce n’est pas une question de coût. Il y ajoute ensuite une citation sortie de nulle part du « vice-président de l’Applied Deep Learning chez Nvidia », à qui il fait dire que, dans son équipe, les coûts de calcul dépassent les coûts salariaux
  Mais cette équipe n’utilise pas des LLM pour le développement logiciel ; c’est littéralement une équipe de deep learning, qui brûle du calcul selon les méthodes du développement en deep learning
  Un simple calcul suffit à voir que Microsoft ne peut pas dépenser davantage en IA qu’en développeurs. Il y a environ 80 000 employés dans les fonctions de développement produit, et le coût total d’un développeur senior doit probablement tourner autour de 400 000 dollars
  Microsoft aurait-il une facture Claude de 32 milliards de dollars ? J’en doute
- Les deux peuvent être vrais. Claude peut être trop cher, tout en poussant l’entreprise à migrer ses employés vers Copilot. Comme il s’agit de son propre produit, les coûts baissent, et on peut espérer davantage d’usage et de retours
  En revanche, je ne vois pas très bien en quoi l’exemple de Teams pendant les confinements est parallèle à l’argument précédent
Nulle part dans l’article il n’est dit que Microsoft a rapporté que l’IA coûte plus cher que les employés humains
- Waouh… qu’est-il arrivé à Fortune ? Je pensais que c’était un média bien meilleur que ce genre de clickbait
- Il manque peut-être un mot dans le titre du post. Cela devrait plutôt être : « Microsoft reports show AI is more expensive… »
  Même si Microsoft ne l’a pas dit explicitement, le fait que l’IA soit plus chère ressort bien
La mode du tokenmaxxing est à mon avis l’une des idées les plus stupides sorties de cette vague IA. Elle va totalement à l’encontre de la maximisation de l’efficacité et de la productivité, et pourtant elle est largement acceptée
http://archive.today/l3EEo
Si Microsoft a annulé Claude, c’est parce que Copilot n’est pas terrible, donc il faut bien utiliser Copilot soi-même. C’est reconnu en interne et ce n’est pas un secret
À ce stade, comme les tokens Anthropic étaient subventionnés, il est même possible qu’ils soient devenus plus coûteux du point de vue de Microsoft
Pour analyser le coût de l’usage de l’IA, il faut regarder le contexte d’utilisation
Beaucoup de gens utilisent l’IA pour embellir des documents, des conversations Slack ou des e-mails, ou pour générer inutilement de gros documents à partir de prompts courts. Il n’y avait aucune raison qu’on ait besoin d’IA pour envoyer des messages Slack ou des e-mails en interne. C’est du gaspillage de ressources et de temps pour rendre les choses plus présentables sans en changer vraiment le sens
- Pour ce genre d’usage, le coût est d’ailleurs plutôt faible
Brûler des tokens est aussi facile que jeter de l’argent dans un brasero
L’usage des tokens n’est pas un bon indicateur de productivité. Le problème, c’est que personne n’a encore vraiment trouvé comment mesurer un usage productif de l’IA. Il est difficile de distinguer si les développeurs maximisent leur productivité, s’ils brûlent simplement des tokens, ou s’ils résistent au changement
- La nouvelle métrique des lignes de code
L’IA ne coûte pas plus cher que de verser un salaire à des employés humains. L’IA ne peut toujours pas remplacer les employés humains, donc le postulat du titre est faux

kuil09 2026-05-27

La raison est simple. Ce n’est pas parce qu’il y a toujours eu du gaspillage dans le développement.

C’est parce qu’en amont, il y a déjà une accumulation de non-sens, de récits dont le contexte a été omis et que seul l’auteur comprend, ainsi que de livrables à moitié mis en forme.
Les développeurs qui ont mis la main sur l’IA veulent simplement résoudre cette complexité avec l’IA.

Utilisez correctement l’IA dans les métiers en amont des développeurs et sur le terrain.