1 points par GN⁺ 2026-01-07 | 1 commentaires | Partager sur WhatsApp
  • AWS a augmenté d’environ 15 % le prix des instances GPU d’EC2 Capacity Blocks for ML ; le tarif horaire des instances p5e.48xlarge et p5en.48xlarge est passé dans la plupart des régions de 34,61 $ à 39,80 $ et de 36,18 $ à 41,61 $ respectivement
  • Dans la région US West (Northern California), la hausse a été encore plus marquée, de 43,26 $ à 49,75 $
  • Dans un e-mail, AWS a expliqué que « cet ajustement reflète les schémas d’offre et de demande »
  • Cette hausse intervient après l’annonce passée d’une baisse pouvant aller jusqu’à 45 % des instances GPU (il y a 7 mois), et constitue un cas rare où AWS augmente directement ses prix
  • Cet événement marque la rupture du tabou des baisses de prix permanentes dans le cloud et pourrait affecter à l’avenir d’autres services de ressources

Vue d’ensemble de la hausse des prix des GPU chez AWS

  • AWS a augmenté d’environ 15 % le prix d’EC2 Capacity Blocks for ML un samedi de week-end
    • L’instance p5e.48xlarge est passée de 34,61 $ à 39,80 $ de l’heure, et la p5en.48xlarge de 36,18 $ à 41,61 $
    • Dans la région US West (Northern California), la hausse a été plus importante, de 43,26 $ à 49,75 $
  • La page tarifaire officielle d’AWS comportait la mention « les prix seront mis à jour en janvier 2026 », sans indiquer qu’il s’agissait d’une hausse
  • Dans un e-mail, AWS a expliqué que « les prix varient en fonction des schémas d’offre et de demande » et que cet ajustement reflétait les tendances attendues pour le trimestre concerné

Nature des Capacity Blocks et profil des utilisateurs

  • Les Capacity Blocks permettent de réserver et garantir des ressources GPU à un moment précis, afin d’exécuter de manière stable des tâches d’entraînement ML
    • Il est possible de réserver des instances GPU pour une période donnée, d’une journée à plusieurs semaines plus tard, et de payer à l’avance un tarif fixe
  • Les clients de ce service sont principalement des équipes d’entreprise menant de grands projets ML, avec des budgets qui se chiffrent en millions de dollars
  • Il y a 7 mois, AWS avait réduit de jusqu’à 45 % le prix des instances GPU on-demand et via Savings Plans, mais la hausse actuelle ne s’applique qu’aux Capacity Blocks

Impact sur le secteur et sur les clients

  • AWS a déjà ajusté ses prix par le passé, mais une hausse directe ligne par ligne (line-item increase) reste rare
    • Auparavant, l’approche habituelle consistait plutôt à modifier la structure tarifaire ou à promouvoir le fait que « pour la plupart des clients, l’effet correspond à une baisse »
  • Cette hausse offre un angle de comparaison favorable à Azure et GCP
    • Les deux concurrents cherchent activement à attirer les charges de travail ML, et le fait qu’« AWS ait augmenté de 15 % le prix des GPU » pourrait devenir un argument commercial
  • Pour les clients entreprises utilisant l’Enterprise Discount Program (EDP), le taux de remise peut rester inchangé, mais le coût réel augmente du fait de la hausse du prix de base

Situation du marché et perspectives

  • Dans un contexte où l’offre de GPU reste limitée à l’échelle mondiale, cette hausse est interprétée comme un signal de déséquilibre entre l’offre et la demande
  • AWS a façonné pendant 20 ans l’idée que « les prix baissent toujours », mais cette mesure fait voler en éclats cette hypothèse
  • Une fois qu’un acteur a relevé ses prix sans forte réaction du marché, la probabilité de hausses supplémentaires augmente
  • L’article évoque la possibilité d’ajustements similaires à l’avenir sur d’autres services, comme les instances Graviton ou les coûts de transfert de données
  • L’article résume la situation ainsi : « la croyance selon laquelle les prix du cloud ne vont que dans un seul sens a disparu un samedi de janvier 2026 »

Conclusion

  • Cette hausse du prix des GPU est présentée comme un tournant dans la politique tarifaire d’AWS
  • Elle a ébranlé la confiance dans la stabilité des coûts sur le marché du cloud,
    et soulève la possibilité de nouvelles hausses à l’avenir pour des ressources soumises à des contraintes d’approvisionnement

1 commentaires

 
GN⁺ 2026-01-07
Commentaires Hacker News
  • En voyant les prix des GPU, de la RAM et des disques durs tous augmenter, on finit par imaginer un futur où les ordinateurs domestiques seraient remplacés par des clients légers (thin clients) et où tout le calcul basculerait vers des services par abonnement
    Des slogans du type « pas besoin de stockage, utilisez un abonnement cloud » ou « pas besoin de puissance de calcul, streamez vos jeux » pourraient devenir réalité
    Les éditeurs de jeux envisagent déjà des modèles de facturation à l’heure, ce qui pourrait complètement transformer la structure de jeux comme Call of Duty ou GTA
    Les supports physiques pourraient disparaître, le stockage des iPhone diminuer, et tout être forcé vers iCloud
    Cela évoque aussi une société où l’on ne possède plus sa voiture, remplacée par du partage de véhicules autonomes, et où les magasins physiques ferment au profit de livraisons par drone

    • Les prix des abonnements augmentent eux aussi. Ceux qui ont déjà acheté un ordinateur peuvent tenir quelques années, mais les utilisateurs en location sont touchés immédiatement
    • Le réveil reçu en cadeau de Noël (Hatch.co) ne fonctionne pas sans un abonnement à 50 dollars par an. Les consommateurs devraient mieux comprendre le coût total de possession (TCO). L’État devrait peut-être imposer une étiquette indiquant le coût annuel, comme pour les appareils électroménagers
    • La chaîne d’approvisionnement est tellement fragile que, avec TSMC à 60 % de part de marché, si la Chine envahissait Taïwan, plus de la moitié de la production mondiale de CPU et de GPU pourrait disparaître. À ce moment-là, l’iPhone pourrait tout simplement cesser d’être vendu, et un PC pourrait coûter 5 000 dollars
    • Les MMORPG utilisent déjà depuis longtemps un modèle d’abonnement mensuel. Mais pour la plupart des jeux, un passage à la facturation horaire ferait probablement baisser les revenus. Les gens achètent beaucoup de jeux, mais en jouent en réalité très peu
    • Cette tendance a déjà été théorisée sous le nom de Technofeudalism (lien Wikipedia)
  • Le « hopes you weren't paying attention » du titre de l’article semble excessivement sensationnaliste
    Cela ressemble simplement à une logique de marché où la demande en GPU et en RAM dépasse l’offre

    • Un titre accrocheur typique de The Register. L’intention est de provoquer le clic, mais cette fois, ça a clairement marché
    • L’offre de GPU et de RAM ne change pas soudainement en un week-end. Il n’y avait aucune raison particulière d’augmenter les prix un samedi
    • Le fait d’annoncer une hausse de prix un samedi, quand les clients ne travaillent pas, interroge
    • Même avec un niveau d’économie de lycée, on peut relever que ces entreprises n’ont jusqu’ici produit que de la dette et une faible productivité
  • À propos de l’article sur la hausse des prix AWS, il est déroutant d’indiquer « mise à jour à venir » sans préciser le sens de la modification, hausse ou baisse
    Les clients existants ne consultent pas la page des tarifs tous les jours, donc ce type d’annonce relève en pratique d’une communication opaque

    • Dans les commentaires, quelqu’un tournait en dérision la façon de communiquer d’AWS avec une blague de The Hitchhiker’s Guide to the Galaxy sur « l’avis affiché dans un tiroir verrouillé à l’intérieur des toilettes »
  • Certains critiquaient l’allongement de la période d’amortissement des GPU de 3 à 5 ans, mais cette hausse de prix semble au contraire montrer que la durée de vie en valeur des GPU s’allonge

    • Je ne suis pas spécialiste, mais une hausse de prix peut aussi être le signe inverse, celui d’une durée de vie plus courte. Cela peut venir soit d’une baisse de l’offre, soit d’une hausse de la demande. Il est aussi possible que la demande en GPU soit inélastique, ce qui pousse encore les prix à la hausse
    • Cela dépend du degré auquel NVIDIA a survendu les gains de performance. Si des ajouts comme les fonctions RL, la séparation prefill/decode ou des améliorations structurelles comme nvfp4 ont vraiment amélioré l’efficacité, alors les anciennes puces restent tout à fait utiles
    • Les GPU haut de gamme peuvent effectivement être utilisés plus de 6 ans. Avec un bon refroidissement, ils peuvent tenir près de 10 ans. Les modèles avec au moins 80GB de VRAM ont notamment une forte valeur à long terme
  • L’IA dans le cloud n’est pour la plupart des entreprises qu’une taxe de commodité
    Les documents, prévisions, monitoring, support et systèmes de contrôle peuvent être traités localement avec des modèles locaux. Si l’on tient compte de la gravité des données, de la latence et des questions de confidentialité, il est plus rationnel de posséder du matériel en edge

    • Je prototype moi aussi des LLM pour plusieurs usages, et le vrai problème est moins le coût que la fiabilité. L’écart entre 99,95 % et 99 % peut entraîner des pertes supérieures à celles de la main-d’œuvre. Dans les domaines où ce calcul est possible, je pense toujours que l’humain reste préférable
  • On dirait qu’un choc tarifaire va bientôt frapper l’ensemble du secteur de l’IA

    • Notre équipe n’a absolument aucun plan au cas où les coûts d’API et d’infrastructure exploseraient. Pour l’instant, on ajoute des fonctions IA quasi gratuites à des fins marketing, mais si les vrais coûts arrivent, on devra peut-être tout retirer
    • Au final, beaucoup d’usages vont probablement basculer vers des modèles open weights chinois. En dehors des modèles haut de gamme, ils sont déjà largement « good enough » pour la plupart des usages
    • Ce choc ne touchera pas seulement le secteur de l’IA, mais toutes les industries
    • En tant qu’utilisateur de Claude, cette hausse des prix m’inquiète aussi
  • L’IA aspire toutes les ressources et asphyxie les autres industries

    • Philip K. Dick et Frank Herbert avaient déjà très bien anticipé cette structure immuable du capitalisme
  • Je me demande s’il existe un service qui suit les variations de prix des GPU heure par heure

    • Je développe justement computeprices.com comme side project depuis un an
    • Le fait qu’AWS ait augmenté le prix de certaines instances est inhabituel. Mais le vrai problème plus large, c’est l’opacité d’une hausse sans préavis. Du point de vue du client, c’est une manière de perdre sa confiance
  • J’ai été content de voir Corey Quinn apparaître dans The Register

  • Les dépenses d’investissement en forte hausse dues aux achats massifs de GPU tirent aussi vers le haut la demande pour d’autres composants, comme la mémoire
    Mais on peut se demander dans quelle mesure ces GPU sont réellement utilisés. Cela amène à se demander si nous ne payons pas en réalité pour du stock inutilisé