Un rapport de Microsoft révèle que l’IA coûte plus cher que l’embauche de salariés humains
(fortune.com)- Microsoft réduit le coût de ses outils d’IA internes en annulant la plupart des licences directes de Claude Code et en basculant ses ingénieurs vers GitHub Copilot CLI
- Claude Code, fourni à des milliers d’employés pour des expérimentations de codage, a rapidement gagné en popularité, mais l’augmentation des coûts a suivi à mesure que son usage s’est étendu
- Uber a déjà épuisé en quatre mois l’intégralité de son budget 2026 pour les outils de codage IA, et encourage l’usage des outils IA par équipe via un classement interne
- À mesure que les entreprises augmentent leur consommation de tokens pour améliorer la productivité, la facture totale peut augmenter même si le prix unitaire des tokens baisse
- Goldman Sachs estime que l’IA agentique pourrait multiplier par 24 la consommation de tokens d’ici 2030, et Gartner juge lui aussi que la hausse de la consommation pourrait dépasser la baisse des prix unitaires
Extension de l’usage interne de l’IA en entreprise et pression sur les coûts
- Microsoft a commencé à annuler la plupart des licences directes de Claude Code après un article de The Verge, et transfère ses ingénieurs vers GitHub Copilot CLI
- L’accès à Claude Code avait été ouvert il y a six mois à des milliers d’employés — développeurs, chefs de projet, designers, etc. — pour des expérimentations de codage, et l’outil a rapidement gagné en popularité, mais les problèmes de coût sont devenus plus visibles à mesure que l’usage s’est généralisé
- L’annulation des licences Claude Code n’affecte pas le contrat Foundry de Microsoft
- Cet accord comprend un investissement pouvant aller jusqu’à 5 milliards de dollars dans Anthropic, l’accès des clients Foundry aux modèles Claude, et un engagement d’achat de 30 milliards de dollars de capacité de calcul Azure par Anthropic
- Praveen Neppalli Naga, CTO d’Uber, a déclaré à The Information qu’Uber avait déjà consommé la totalité de son budget 2026 pour les outils de codage IA en seulement quatre mois
- Uber encourage activement l’adoption via un classement interne qui hiérarchise l’usage des outils IA par équipe
- Bryan Catanzaro, vice-président de l’apprentissage profond appliqué chez Nvidia, a déclaré dans une interview à Axios : « Dans mon équipe, les coûts de calcul dépassent de loin les coûts salariaux. »
- Anthropic n’a pas répondu immédiatement à la demande de commentaire de Fortune, et Microsoft n’a pas non plus fait de commentaire
Quand des tokens moins chers produisent une facture plus élevée
- Les entreprises poussent leurs employés à utiliser davantage l’IA pour gagner en productivité, mais avec une facturation fondée sur les tokens, plus l’usage augmente, plus le coût total grimpe
- Un employé de Meta a créé un tableau de bord nommé d’après les modèles d’Anthropic, le classement « Claudeonomics », pour suivre l’usage de l’IA par employé
- Amazon encourage ses employés au « tokenmaxxing », c’est-à-dire à utiliser un maximum de tokens, l’unité de base du calcul IA
- Goldman Sachs prévoit qu’avec l’adoption d’agents IA par les consommateurs et les entreprises, l’IA agentique pourrait multiplier par 24 la consommation de tokens d’ici 2030, pour atteindre 120 duodécillions de tokens par mois
- Gartner estime que le coût d’inférence d’un LLM à 1 trillion de paramètres pourrait baisser de près de 90 % d’ici 2030 par rapport à 2025, mais prévoit que des tokens moins chers ne se traduiront pas automatiquement par une réduction des coûts IA pour les entreprises
- Les modèles agentiques nécessitent bien plus de tokens par tâche que les modèles standards
- La hausse de la consommation peut dépasser la baisse des prix unitaires
- Les fournisseurs d’IA pourraient ne pas répercuter intégralement la baisse des coûts sur les clients
- Will Sommer, Senior Director Analyst chez Gartner, a averti : « Les CPO ne doivent pas confondre la déflation des tokens généralistes avec la démocratisation de l’inférence de frontière. »
- Le CEO de Nvidia, Jensen Huang, a déclaré qu’un jour 100 agents IA travailleront aux côtés de chaque employé, mais si la consommation de tokens augmente plus vite que la baisse des prix unitaires, cet avenir agentique pourrait s’accompagner de coûts bien plus lourds que prévu par les dirigeants
1 commentaires
Commentaires sur Hacker News
La discussion animée basée sur l’article original se trouve ici : https://news.ycombinator.com/item?id=48238896
L’article indique que « The Verge a rapporté que Microsoft a commencé à annuler la plupart de ses licences directes de Claude Code »
Le passage disant que « dans une facturation basée sur les tokens, plus on l’utilise et plus l’efficacité s’améliore, plus cela coûte cher » est aussi étrange. Je ne vois pas pourquoi une meilleure efficacité ferait augmenter les coûts
Le titre semble trompeur, et en lisant l’article, on comprend encore mieux pourquoi. Dans ces entreprises, il existe des OKR et des objectifs absurdes du type brûlez autant de tokens que possible
Si l’on fait de l’usage des tokens un indicateur, on obtient forcément un résultat extrêmement coûteux
Le coût d’inférence lui-même reste supportable, et il n’est pas nécessaire d’avoir les tout derniers modèles propriétaires pour utiliser cette technologie utilement. Les ingénieurs humains seront encore nécessaires pendant longtemps, mais je ne suis pas d’accord avec l’idée que « quelques humains + un LLM » seraient plus chers que d’embaucher simplement davantage d’humains, ni que cela le resterait durablement
En ce moment, le problème me semble être moins le vibe coding que le vibe leadership, et le vibe leadership n’a au fond rien à voir avec l’IA. Ce sont des gens qui s’accrochent à une intuition floue et poussent jusqu’à des conclusions irrationnelles, sans rapport avec les coûts ni les résultats
Le postulat de cet article est faux. Si Microsoft annule l’usage interne de Claude Code, ce n’est pas parce que le coût de l’IA est trop élevé, mais parce que l’entreprise possède le produit concurrent GitHub Copilot et veut que ses employés utilisent son propre produit
C’est la même raison pour laquelle Teams a bénéficié d’autant d’attention pendant les confinements
Mais cette équipe n’utilise pas des LLM pour le développement logiciel ; c’est littéralement une équipe de deep learning, qui brûle du calcul selon les méthodes du développement en deep learning
Un simple calcul suffit à voir que Microsoft ne peut pas dépenser davantage en IA qu’en développeurs. Il y a environ 80 000 employés dans les fonctions de développement produit, et le coût total d’un développeur senior doit probablement tourner autour de 400 000 dollars
Microsoft aurait-il une facture Claude de 32 milliards de dollars ? J’en doute
En revanche, je ne vois pas très bien en quoi l’exemple de Teams pendant les confinements est parallèle à l’argument précédent
Nulle part dans l’article il n’est dit que Microsoft a rapporté que l’IA coûte plus cher que les employés humains
Même si Microsoft ne l’a pas dit explicitement, le fait que l’IA soit plus chère ressort bien
La mode du tokenmaxxing est à mon avis l’une des idées les plus stupides sorties de cette vague IA. Elle va totalement à l’encontre de la maximisation de l’efficacité et de la productivité, et pourtant elle est largement acceptée
http://archive.today/l3EEo
Si Microsoft a annulé Claude, c’est parce que Copilot n’est pas terrible, donc il faut bien utiliser Copilot soi-même. C’est reconnu en interne et ce n’est pas un secret
À ce stade, comme les tokens Anthropic étaient subventionnés, il est même possible qu’ils soient devenus plus coûteux du point de vue de Microsoft
Pour analyser le coût de l’usage de l’IA, il faut regarder le contexte d’utilisation
Beaucoup de gens utilisent l’IA pour embellir des documents, des conversations Slack ou des e-mails, ou pour générer inutilement de gros documents à partir de prompts courts. Il n’y avait aucune raison qu’on ait besoin d’IA pour envoyer des messages Slack ou des e-mails en interne. C’est du gaspillage de ressources et de temps pour rendre les choses plus présentables sans en changer vraiment le sens
Brûler des tokens est aussi facile que jeter de l’argent dans un brasero
L’usage des tokens n’est pas un bon indicateur de productivité. Le problème, c’est que personne n’a encore vraiment trouvé comment mesurer un usage productif de l’IA. Il est difficile de distinguer si les développeurs maximisent leur productivité, s’ils brûlent simplement des tokens, ou s’ils résistent au changement
L’IA ne coûte pas plus cher que de verser un salaire à des employés humains. L’IA ne peut toujours pas remplacer les employés humains, donc le postulat du titre est faux