AWS a augmenté de 15 % le prix des GPU samedi, en espérant peut-être que vous ne le remarqueriez pas
(theregister.com)- AWS a augmenté d’environ 15 % le prix des instances GPU d’EC2 Capacity Blocks for ML ; le tarif horaire des instances p5e.48xlarge et p5en.48xlarge est passé dans la plupart des régions de 34,61 $ à 39,80 $ et de 36,18 $ à 41,61 $ respectivement
- Dans la région US West (Northern California), la hausse a été encore plus marquée, de 43,26 $ à 49,75 $
- Dans un e-mail, AWS a expliqué que « cet ajustement reflète les schémas d’offre et de demande »
- Cette hausse intervient après l’annonce passée d’une baisse pouvant aller jusqu’à 45 % des instances GPU (il y a 7 mois), et constitue un cas rare où AWS augmente directement ses prix
- Cet événement marque la rupture du tabou des baisses de prix permanentes dans le cloud et pourrait affecter à l’avenir d’autres services de ressources
Vue d’ensemble de la hausse des prix des GPU chez AWS
- AWS a augmenté d’environ 15 % le prix d’EC2 Capacity Blocks for ML un samedi de week-end
- L’instance p5e.48xlarge est passée de 34,61 $ à 39,80 $ de l’heure, et la p5en.48xlarge de 36,18 $ à 41,61 $
- Dans la région US West (Northern California), la hausse a été plus importante, de 43,26 $ à 49,75 $
- La page tarifaire officielle d’AWS comportait la mention « les prix seront mis à jour en janvier 2026 », sans indiquer qu’il s’agissait d’une hausse
- Dans un e-mail, AWS a expliqué que « les prix varient en fonction des schémas d’offre et de demande » et que cet ajustement reflétait les tendances attendues pour le trimestre concerné
Nature des Capacity Blocks et profil des utilisateurs
- Les Capacity Blocks permettent de réserver et garantir des ressources GPU à un moment précis, afin d’exécuter de manière stable des tâches d’entraînement ML
- Il est possible de réserver des instances GPU pour une période donnée, d’une journée à plusieurs semaines plus tard, et de payer à l’avance un tarif fixe
- Les clients de ce service sont principalement des équipes d’entreprise menant de grands projets ML, avec des budgets qui se chiffrent en millions de dollars
- Il y a 7 mois, AWS avait réduit de jusqu’à 45 % le prix des instances GPU on-demand et via Savings Plans, mais la hausse actuelle ne s’applique qu’aux Capacity Blocks
Impact sur le secteur et sur les clients
- AWS a déjà ajusté ses prix par le passé, mais une hausse directe ligne par ligne (line-item increase) reste rare
- Auparavant, l’approche habituelle consistait plutôt à modifier la structure tarifaire ou à promouvoir le fait que « pour la plupart des clients, l’effet correspond à une baisse »
- Cette hausse offre un angle de comparaison favorable à Azure et GCP
- Les deux concurrents cherchent activement à attirer les charges de travail ML, et le fait qu’« AWS ait augmenté de 15 % le prix des GPU » pourrait devenir un argument commercial
- Pour les clients entreprises utilisant l’Enterprise Discount Program (EDP), le taux de remise peut rester inchangé, mais le coût réel augmente du fait de la hausse du prix de base
Situation du marché et perspectives
- Dans un contexte où l’offre de GPU reste limitée à l’échelle mondiale, cette hausse est interprétée comme un signal de déséquilibre entre l’offre et la demande
- AWS a façonné pendant 20 ans l’idée que « les prix baissent toujours », mais cette mesure fait voler en éclats cette hypothèse
- Une fois qu’un acteur a relevé ses prix sans forte réaction du marché, la probabilité de hausses supplémentaires augmente
- L’article évoque la possibilité d’ajustements similaires à l’avenir sur d’autres services, comme les instances Graviton ou les coûts de transfert de données
- L’article résume la situation ainsi : « la croyance selon laquelle les prix du cloud ne vont que dans un seul sens a disparu un samedi de janvier 2026 »
Conclusion
- Cette hausse du prix des GPU est présentée comme un tournant dans la politique tarifaire d’AWS
- Elle a ébranlé la confiance dans la stabilité des coûts sur le marché du cloud,
et soulève la possibilité de nouvelles hausses à l’avenir pour des ressources soumises à des contraintes d’approvisionnement
1 commentaires
Commentaires Hacker News
En voyant les prix des GPU, de la RAM et des disques durs tous augmenter, on finit par imaginer un futur où les ordinateurs domestiques seraient remplacés par des clients légers (thin clients) et où tout le calcul basculerait vers des services par abonnement
Des slogans du type « pas besoin de stockage, utilisez un abonnement cloud » ou « pas besoin de puissance de calcul, streamez vos jeux » pourraient devenir réalité
Les éditeurs de jeux envisagent déjà des modèles de facturation à l’heure, ce qui pourrait complètement transformer la structure de jeux comme Call of Duty ou GTA
Les supports physiques pourraient disparaître, le stockage des iPhone diminuer, et tout être forcé vers iCloud
Cela évoque aussi une société où l’on ne possède plus sa voiture, remplacée par du partage de véhicules autonomes, et où les magasins physiques ferment au profit de livraisons par drone
Le « hopes you weren't paying attention » du titre de l’article semble excessivement sensationnaliste
Cela ressemble simplement à une logique de marché où la demande en GPU et en RAM dépasse l’offre
À propos de l’article sur la hausse des prix AWS, il est déroutant d’indiquer « mise à jour à venir » sans préciser le sens de la modification, hausse ou baisse
Les clients existants ne consultent pas la page des tarifs tous les jours, donc ce type d’annonce relève en pratique d’une communication opaque
Certains critiquaient l’allongement de la période d’amortissement des GPU de 3 à 5 ans, mais cette hausse de prix semble au contraire montrer que la durée de vie en valeur des GPU s’allonge
L’IA dans le cloud n’est pour la plupart des entreprises qu’une taxe de commodité
Les documents, prévisions, monitoring, support et systèmes de contrôle peuvent être traités localement avec des modèles locaux. Si l’on tient compte de la gravité des données, de la latence et des questions de confidentialité, il est plus rationnel de posséder du matériel en edge
On dirait qu’un choc tarifaire va bientôt frapper l’ensemble du secteur de l’IA
L’IA aspire toutes les ressources et asphyxie les autres industries
Je me demande s’il existe un service qui suit les variations de prix des GPU heure par heure
J’ai été content de voir Corey Quinn apparaître dans The Register
Les dépenses d’investissement en forte hausse dues aux achats massifs de GPU tirent aussi vers le haut la demande pour d’autres composants, comme la mémoire
Mais on peut se demander dans quelle mesure ces GPU sont réellement utilisés. Cela amène à se demander si nous ne payons pas en réalité pour du stock inutilisé