4 points par GN⁺ 2025-12-30 | 1 commentaires | Partager sur WhatsApp
  • La croissance explosive des centres de données IA fait que la demande de RAM dépasse l’offre, provoquant une pénurie mondiale de mémoire
  • Le prix de la DRAM a augmenté de 50 % d’un trimestre à l’autre, et une hausse supplémentaire de 40 % est attendue au trimestre suivant, sans perspective de baisse des prix avant 2026
  • De grands fabricants comme Micron Technology se concentrent sur la production de mémoire avancée pour l’IA, ce qui entraîne une baisse de l’approvisionnement en puces pour les PC, smartphones et appareils électroménagers
  • Les systèmes d’entraînement et d’inférence de l’IA exigent une mémoire de grande capacité et à large bande passante, ce qui rend impossible tout ajustement de la demande à court terme
  • Les experts avertissent que le goulot d’étranglement de l’offre persistera jusqu’à la mise en service de nouvelles usines en 2027 et qu’il exercera une pression à la hausse sur les prix des appareils

Pénurie mondiale de puces mémoire

  • L’expansion du cloud computing et des centres de données liés à l’IA fait exploser la demande pour certaines puces mémoire, provoquant des pénuries d’approvisionnement
    • Cela soulève la possibilité d’une hausse des prix pour divers appareils électroniques, notamment les smartphones, ordinateurs et consoles de jeu
    • Avril Wu de TrendForce a déclaré : « Si vous voulez acheter un appareil, il faut le faire maintenant. »
  • La RAM est un composant essentiel pour exécuter plusieurs applications en même temps ou assurer une lecture fluide des vidéos
    • La demande dépasse l’offre d’environ 10 %, et les fabricants paient des prix plus élevés chaque mois

La flambée des prix de la DRAM

  • Au quatrième trimestre 2025, le prix de la DRAM a augmenté de 50 % par rapport au trimestre précédent
    • En cas de livraison anticipée, il faut payer un prix 2 à 3 fois plus élevé
  • TrendForce prévoit une hausse supplémentaire de 40 % au trimestre suivant et estime qu’il n’y aura pas de baisse des prix avant 2026
  • Cette flambée est principalement attribuée à la demande explosive des centres de données IA

Comment l’IA engloutit la mémoire

  • Les centres de données IA ont besoin d’une grande quantité de mémoire en plus des GPU
    • Sanchit Vir Gogia de Greyhound Research explique : « Les charges de travail de l’IA sont construites autour de la mémoire. »
  • Les systèmes d’entraînement et d’inférence des modèles d’IA exigent une mémoire massive et continue, une bande passante élevée et une proximité avec les unités de calcul
    • En raison de ces caractéristiques, réduire la demande entraîne inévitablement une baisse des performances

Réaction des fabricants et du marché

  • Micron Technology, l’un des principaux fabricants mondiaux de RAM, a enregistré des résultats supérieurs aux prévisions grâce à la hausse de la demande liée à l’IA
    • Son PDG, Sanjay Mehrotra, a déclaré que « la situation où l’offre ne parvient pas à suivre la demande va se prolonger »
  • Les fabricants sont en train de basculer vers la production de mémoire avancée pour l’IA, ce qui réduit en conséquence l’approvisionnement en puces pour les PC, mobiles et téléviseurs
    • Jeff Clarke, COO de Dell, a affirmé que « cette hausse des coûts sera répercutée sur les consommateurs »

Goulots d’étranglement de l’offre et perspectives

  • Les experts soulignent qu’il n’existe pas de solution à court terme
    • Les usines actuelles devraient atteindre leurs limites de capacité de production d’ici fin 2026
  • La nouvelle usine de Micron dans l’Idaho doit entrer en service en 2027, ce qui laisse prévoir une poursuite des pénuries d’approvisionnement jusque-là
  • En conséquence, il est très probable que les hausses de prix des fournisseurs de mémoire se poursuivent

1 commentaires

 
GN⁺ 2025-12-30
Réactions sur Hacker News
  • Je n’arrive pas à me défaire de l’idée que tout ce que les LLM touchent en ce moment finit par être abîmé
    On peut citer les graphismes façon Ghibli, le support client, le contenu sur Internet, et même le cours de l’action Oracle
    Maintenant, on dirait que cela affecte aussi les puces. On en vient à se demander s’il faudra renoncer à toute technologie pour que ça s’arrête

    • Je ne sais pas si cela pourra s’arrêter. J’ai l’impression que ça retombera quand le baratin des CEO sera considéré comme de l’air. Le rejet du contenu généré ne disparaîtra pas
    • Comme la mode des cliparts dans MS Word autrefois, les LLM en sont à un stade similaire
      Au début, tout le monde les utilise maladroitement, puis on finit par trouver le bon niveau d’usage. Le problème, ce n’est pas la technologie elle-même, mais le cycle de hype excessif
    • Certaines personnes prennent leurs distances quand elles voient la technologie se dégrader, mais la plupart non
      Au final, les grandes entreprises vont sans doute monopoliser davantage l’attention des gens
    • J’ai déjà pris mes distances avec les réseaux sociaux au début des années 2010
      J’essaie de moins dépendre de la technologie et de réapprendre les loisirs hors ligne ainsi que les relations humaines directes
      Je compte n’utiliser Internet qu’au strict minimum, pour le travail et pour organiser des rencontres
    • J’ai des doutes sur l’affirmation selon laquelle « Oracle était l’une des entreprises technologiques les plus solides au monde »
  • L’IA consomme de manière inefficace des ressources de calcul limitées
    Un PC gaming de milieu de gamme permet déjà d’afficher des graphismes haute résolution, d’encoder des vidéos et de faire de grosses compilations, mais avec la même machine il est difficile de faire tourner ne serait-ce qu’un LLM local ordinaire
    Les modèles d’entreprises comme OpenAI ou Anthropic exigent des ressources bien plus coûteuses. Ces ressources auraient été plus utiles pour la prévision météorologique ou la recherche sur le cancer

    • Depuis deux ans, les caractéristiques des PC et ordinateurs portables grand public régressent plutôt
      La RAM reste à 8 Go, les CPU sont d’entrée de gamme et il n’y a pas de GPU. Pendant ce temps, les OS et les logiciels deviennent de plus en plus complexes et instables
      À force de se concentrer uniquement sur l’IA, le secteur risque de faire faire un grand bond en arrière aux étudiants et aux chercheurs
    • Il faudrait définir ce qu’on entend par « efficace »
      Les investisseurs actuels pensent que l’IA est plus efficace pour transformer des GPU et de la RAM en argent, donc ils paient davantage pour le même matériel
  • On peut craindre qu’un petit nombre d’entreprises fasse monter le prix des ressources de calcul via l’IA, en excluant le reste de l’humanité du marché

    • Si l’IA réussit réellement, le grand public risque de subir à la fois le chômage et l’explosion du prix des ressources
    • On observe un phénomène similaire sur les marchés de l’immobilier et du capital-investissement
    • À court terme, on a l’impression que tout est sacrifié pour faire baisser le coût du travail technique. Au final, c’est un mécanisme qui appauvrit les individus
    • Si l’offre augmente, le prix d’équilibre pourrait se maintenir. Avec les économies d’échelle, il pourrait même baisser
    • Ce n’est pas simplement une « mode de l’IA » : c’est une question de priorité d’accès à des ressources rares
  • Le recul du matériel grand public est net depuis deux ans
    8 Go de RAM, CPU bas de gamme, pas de GPU. En parallèle, les OS deviennent lourds et instables. On a l’impression que le secteur se concentre uniquement sur l’IA
    Cela risque d’être un coup dur surtout pour les étudiants et le monde scientifique

    • Même mon MacBook Pro M3 Max met deux secondes à lancer Slack. La plupart des logiciels se soucient peu des performances
      Il existe des exceptions comme Zed, mais dans l’ensemble l’optimisation passe après tout le reste
    • L’absence de GPU s’explique aussi par les progrès des GPU intégrés au cours des cinq dernières années. Les dGPU d’entrée de gamme n’ont de toute façon jamais été grand-chose d’autre qu’un argument marketing
    • Le problème, ce n’est pas le matériel, mais les logiciels inefficaces
      Sous Linux, la même configuration fonctionne bien plus fluidement. Ce sont les tâches inutiles en arrière-plan de Windows 11 qui posent problème
      J’aimerais que Microsoft propose un mode basse configuration
    • J’utilise encore sans problème un desktop de 11 ans (8 Go de RAM). Mint 22.x tourne aussi sans difficulté
      En revanche, le chat YouTube a toujours de gros problèmes de fuite mémoire
    • Il y a dix ans, 16 Go de RAM relevaient du haut de gamme. On revient maintenant à un niveau plus réaliste
      Cela pourrait pousser à écrire des logiciels plus efficaces
  • Je pense que le gouvernement coréen devrait intervenir sur le problème de distorsion de l’approvisionnement en mémoire
    SK hynix et Samsung fournissent massivement de la HBM et de la DRAM haut de gamme aux entreprises d’IA, ce qui pourrait nuire aux autres secteurs
    Même en interne chez Samsung, la division MX (smartphones) n’obtient pas de la division DS (mémoire) une garantie d’approvisionnement prioritaire
    C’est un signal d’alerte pour l’économie coréenne très dépendante des exportations

    • Si même au sein de Samsung il devient impossible de sécuriser un approvisionnement stable en mémoire à cause de la demande des hyperscalers, c’est un problème grave
    • Le retrait de Micron du marché a aussi un impact. Des acteurs comme Kioxia devraient envisager de produire de la DRAM
  • La pénurie de DRAM ne concerne pas seulement les PC ou les téléphones
    Les voitures, les avions, le contrôle du trafic, le contrôle industriel, les infrastructures publiques — tous ces systèmes dépendent de la DRAM
    On peut s’inquiéter des répercussions dans tous ces domaines

    • Heureusement, les microcontrôleurs industriels utilisent des anciens procédés de 45 nm ou plus, donc ils ne sont pas en concurrence avec la mémoire de pointe
      Le monde fonctionnait très bien avec de la DDR3
    • La quantité de DRAM dans un véhicule électrique est comparable à celle d’un smartphone. Les hausses de prix y sont donc moins sensibles
  • Heureusement, aujourd’hui un iPhone d’occasion vieux de 4 ans, un Mac de série M ou un portable Linux restent tout à fait utilisables
    Ceux qui ont vraiment besoin de hautes performances seront pénalisés, mais pour la plupart des gens, repousser un achat de 1 à 2 ans reste acceptable

    • D’accord. Mais pour les utilisateurs de self-hosting ou de homelab, l’impact est important
      La discussion s’est poursuivie aussi dans ce fil
  • Les discours excessivement catastrophistes ne servent à rien
    Si c’est une bulle, elle éclatera bientôt ; sinon, la production s’adaptera

    • Je pense que la plupart des problèmes seront résolus dans les 24 mois
  • Au final, le coût des datacenters d’IA sera payé par nous tous via des PC, portables et téléphones plus chers
    Pendant ce temps, les entreprises de l’IA profiteront de contrats à bas prix

  • Je me demande pourquoi des fabricants de mémoire comme Crucial réduisent leurs produits grand public pour se concentrer sur l’IA
    Même si la rentabilité est plus faible, il est difficile de comprendre pourquoi ils accepteraient de faire grandir des concurrents

    • Crucial avait déjà réduit sa production en usine et, avec l’explosion de la demande liée à l’IA, l’entreprise s’est réorientée vers la vente de puces pour l’IA
      Les puces pour l’IA sont 3 à 4 fois plus chères que celles destinées au grand public, avec de meilleures marges
      Au final, la raison est la hausse du cours de l’action à court terme et la maximisation du profit. Le marché est en plus structurellement fragile, car dominé par trois grands acteurs
    • Créer une gamme grand public dédiée à l’IA serait risqué
      Les cycles de développement sont longs, la demande est incertaine et il est tout à fait possible que la fièvre autour de l’IA retombe