10 points par GN⁺ 2024-07-04 | 1 commentaires | Partager sur WhatsApp
  • La bulle de l’IA atteint un point d’inflexion. Il sera important de savoir s’adapter aux évolutions à venir
  • En septembre 2023, l’auteur a publié un texte intitulé « The $200B Question of AI ». Son objectif était de poser la question : « Où sont les revenus ? »
    • À l’époque, il constatait un écart important entre les attentes de revenus intégrées à la construction de l’infrastructure IA et la croissance réelle des revenus de l’écosystème IA. Il l’avait décrit comme « un trou de 125 Md$ à combler chaque année pour justifier le niveau actuel de CapEx »
    • Récemment, Nvidia est devenue l’entreprise la plus valorisée au monde. Avant cela, beaucoup de personnes l’avaient interrogé sur les conclusions de son analyse. Elles voulaient savoir si le problème des 200 Md$ de l’IA avait été résolu ou s’il s’était aggravé
  • Si l’on refait cette analyse aujourd’hui, on obtient le résultat suivant :
    • Le problème des 200 Md$ de l’IA est désormais un problème de 600 Md$
    • En prenant les prévisions de chiffre d’affaires annuel de Nvidia et en les multipliant par deux, on peut refléter le coût total des data centers IA (les GPU représentent la moitié du coût total de possession ; l’autre moitié comprend l’énergie, les bâtiments, les générateurs de secours, etc.)
    • Il faut ensuite multiplier encore par deux pour refléter la marge brute totale de 50 % des utilisateurs finaux de GPU (par exemple, les startups ou les entreprises qui achètent de la puissance de calcul IA auprès d’Azure, AWS ou GCP doivent elles aussi dégager des profits)

Ce qui a changé

  1. Résorption de la pénurie d’offre

    • Fin 2023, la pénurie de GPU a atteint son pic
    • Aujourd’hui, il est facile de se procurer des GPU
  2. Hausse des stocks de GPU

    • La moitié du chiffre d’affaires data center de Nvidia provient des grands fournisseurs cloud
    • Microsoft représente environ 22 % du chiffre d’affaires T4 de Nvidia
    • Les CapEx des hyperscalers ont atteint des niveaux historiques
  3. Part des revenus d’OpenAI

    • Les revenus d’OpenAI sont passés de 1,6 Md$ fin 2023 à 3,4 Md$ aujourd’hui
    • En dehors de ChatGPT, il existe peu de produits IA que les consommateurs utilisent réellement
  4. Le trou de 125 Md$ devient un trou de 500 Md$

    • On suppose que Google, Microsoft, Apple et Meta génèrent chacun 10 Md$ de nouveaux revenus annuels liés à l’IA
    • On suppose qu’Oracle, ByteDance, Alibaba, Tencent, X et Tesla génèrent chacun 5 Md$ de nouveaux revenus IA
    • Même si ces hypothèses sont justes, le trou de 125 Md$ s’est maintenant élargi à 500 Md$
  5. L’arrivée du B100

    • Nvidia a annoncé la puce B100
    • Le B100 offre des performances 2,5 fois supérieures au H100 pour un coût en hausse de seulement 25 %
    • La demande pour le B100 devrait fortement augmenter

Principales objections (et différences par rapport aux précédents cycles de construction d’infrastructure)

  1. Faible pouvoir de fixation des prix

    • Contrairement aux infrastructures physiques, les data centers GPU ont moins de pouvoir de fixation des prix
    • La puissance de calcul GPU devient de plus en plus une commodité facturée à l’heure
  2. Destruction du capital investi

    • Comme pour les infrastructures physiques telles que le rail, les phases d’investissement spéculatif s’accompagnent d’un fort taux de destruction du capital
    • Selon les moteurs qui font avancer le marché, beaucoup de ceux qui se sont concentrés sur le rail ont perdu beaucoup d’argent lors des vagues technologiques spéculatives
  3. Amortissement

    • Les semi-conducteurs gagnent en performance avec le temps
    • Nvidia continuera à produire de meilleures puces de nouvelle génération
    • Cela entraînera un amortissement plus rapide des puces des générations précédentes
  4. Gagnants et perdants

    • L’IA a de fortes chances d’être la prochaine grande vague technologique transformatrice
    • La baisse du prix du calcul sur GPU est positive à long terme pour l’innovation et les startups

Conclusion

  • L’IA créera une immense valeur économique
  • Nvidia mérite d’être largement saluée pour le rôle qu’elle a joué dans cette transition
  • Les emballements spéculatifs font partie de la technologie ; il n’y a pas lieu de les craindre
  • Il ne faut pas tomber dans l’illusion que l’AGI arrivera bientôt
  • La route à venir sera longue et cahoteuse, mais elle en vaudra presque certainement la peine

L’avis de GN⁺

  • L’IA créera une immense valeur économique. Les fondateurs d’entreprise qui se concentrent sur la création de valeur pour l’utilisateur final seront largement récompensés
  • Les emballements spéculatifs font partie de la technologie, il n’y a donc pas lieu d’en avoir peur. Ceux qui traversent ce moment avec sang-froid auront l’occasion de bâtir des entreprises très importantes
  • Mais il faut veiller à ne pas croire au délire qui s’est propagé de la Silicon Valley à tout le pays, et en réalité au monde entier.
    • Ce « délire » affirme que nous allons tous devenir riches rapidement, parce que l’AGI arrivera demain et que nous devons tous stocker des GPU, seule ressource jugée réellement précieuse
    • Il ne faut pas tomber dans l’illusion que l’AGI arrivera bientôt
  • En réalité, la route à venir sera longue. Elle connaîtra des hauts et des bas, mais elle en vaudra presque certainement la peine

1 commentaires

 
GN⁺ 2024-07-04
Avis Hacker News
  • Selon Jensen, entraîner un modèle de la taille de GPT-4 nécessite 8 000 GPU H100 pendant 90 jours

    • Meta possède 350 000 GPU, ce qui lui permettrait d’entraîner 200 modèles de type GPT-4 par an
    • Cela pourrait ramener la marge bénéficiaire réelle des entreprises centrées sur l’IA à un niveau proche de zéro
    • C’est mauvais pour les investisseurs, mais bon pour les développeurs
    • Le facteur le plus important de la qualité de sortie d’un modèle est les données propriétaires utilisées pour l’entraînement
  • Les grandes entreprises technologiques investissent massivement dans le matériel

    • Cela ressemble aux investissements dans Sun Microsystems et Netscape à la fin des années 1990
    • On savait qu’Internet allait changer le monde, mais pas comment l’argent allait circuler
  • Les revenus de l’IA ne sont pas directs, mais proviennent de la réduction des coûts et des gains de productivité

    • L’IA aide dans tous les aspects d’une startup
  • L’accent est trop mis sur les gains de productivité

    • Il y a davantage de potentiel dans la valeur de divertissement
    • Pour l’instant, ce sont des applications bancales qui gagnent de l’argent
    • On ne sait pas encore quel sera le véritable produit à succès
  • Il est probable que les investissements dans l’IA réussissent

    • Si l’on regarde Internet et le mobile, beaucoup d’entreprises ont réussi après la disparition du battage médiatique
  • Certains prédisent que l’IA créera une forte valeur économique

    • Mais cela reste une affirmation très spéculative sans preuve
    • Il existe une croyance selon laquelle l’IA va tout changer
  • Le développement de l’IA sera long et difficile

    • Mais cela en vaudra la peine
    • L’affaire FTX a peut-être servi de leçon
  • Les LLM excellent dans les tâches de base, mais ont des limites sur les tâches complexes

    • Les gens ont tendance à rejeter la faute sur les autres
    • Ils seront davantage utilisés dans le divertissement et des usages inattendus que dans les rôles en contact avec la clientèle
  • L’hypothèse selon laquelle tous les GPU de datacenter sont utilisés pour l’IA est erronée

    • Le modèle économique de l’IA ne se limite pas aux frais d’utilisation d’API
    • L’IA joue déjà un rôle majeur dans l’activité de recherche et de publicité de Google
  • Compte tenu de la population et du PIB des pays de l’OCDE, les investissements dans l’IA pourraient fortement améliorer la productivité

    • Mais on peut douter de la rapidité avec laquelle les investissements actuels pourront être récupérés