Interview du CEO d’OpenAI Sam Altman sur Sora, l’énergie et la construction d’un empire de l’IA
(a16z.substack.com)- Dans le podcast a16z, il décrit la vision d’OpenAI comme l’intégration d’un abonnement d’IA personnelle, d’une infrastructure à très grande échelle et de la recherche sur l’AGI, en soulignant que ces trois éléments forment une pile unique reliée verticalement
- L’objectif d’OpenAI est un « service d’abonnement à une IA personnelle », en intégrant verticalement recherche, infrastructure et produits grand public afin de poursuivre à la fois le développement de l’AGI et son usage concret
- L’intention stratégique du lancement de Sora va au-delà de la simple sortie d’un générateur vidéo : il s’agit de préparer la société à l’arrivée de modèles vidéo puissants et de faire progresser la recherche sur l’AGI via le développement de world models
- Avec GPT-5, l’ère des scientifiques IA est en train d’arriver ; des premiers cas où les modèles réalisent effectivement des découvertes scientifiques apparaissent déjà, et des découvertes majeures sont anticipées dans les deux prochaines années
- Il avance une vision optimiste autour de la convergence entre énergie et IA, de l’application possible du principe de fair use au copyright, et de l’idée que l’AGI arrivera de façon plus progressive que prévu, laissant à la société le temps de s’adapter ; selon lui, l’époque où l’IA accélère le progrès scientifique a déjà commencé
Vision et structure d’OpenAI
- OpenAI s’articule autour de trois piliers : un abonnement d’IA grand public, une infrastructure à très grande échelle et un laboratoire de recherche
- L’objectif est de proposer, via une IA personnalisée, un service sur abonnement jouant le rôle d’un véritable assistant personnel capable de comprendre le contexte de l’utilisateur
- La plupart des gens devraient disposer d’un abonnement à une IA personnelle, et certains en utiliseront plusieurs
- Les utilisateurs se connecteront à divers services et exploiteront l’IA via des appareils dédiés
- Le but est que l’IA apprenne à connaître l’utilisateur et devienne extrêmement utile
- L’infrastructure est un élément indispensable pour développer l’AGI et fournir les services
- À ce stade, il n’est pas prévu de vendre de l’infrastructure brute à d’autres entreprises
- La porte reste toutefois ouverte à d’autres usages vu l’ampleur du projet
- OpenAI est en train de construire le plus grand datacenter de l’histoire de l’humanité, ou plus précisément le plus grand projet d’infrastructure
- Initialement sceptique sur l’intégration verticale, l’entreprise a désormais basculé vers l’idée que « sans intégration verticale, il est impossible de réaliser l’AGI »
- Il y a eu un passage d’une logique d’investisseur à une logique d’opérateur
- La théorie selon laquelle l’économie est efficiente et qu’une entreprise peut très bien se concentrer sur une seule chose ne s’applique pas au cas d’OpenAI
- L’histoire d’OpenAI a évolué vers l’idée qu’il faut faire plus de choses que prévu pour accomplir sa mission
- L’iPhone est présenté comme le produit le plus remarquable créé par l’industrie technologique, et comme un exemple d’intégration extrêmement verticale
- Il faut une pile verticale où la recherche permet de créer d’excellents produits, et où l’infrastructure rend la recherche possible
Intention stratégique du lancement de Sora
- En apparence, Sora semble sans lien avec l’AGI, mais la construction de world models devrait être importante pour l’AGI
- Tout comme ChatGPT a préparé la société à l’AGI, Sora aide aussi la société à s’adapter à l’impact concret des vidéos générées par IA
- La vidéo a une résonance émotionnelle bien plus forte que le texte, d’où l’importance que la société en comprenne les effets
- D’ici peu, apparaîtront des modèles vidéo impressionnants capables de produire des deepfakes ou pratiquement tout ce que l’on veut montrer
- Il ne suffit pas de rendre l’IA efficace : elle doit aussi être amusante et agréable à utiliser
- Cela ne mobilise pas la plus grande part des ressources de calcul totales, mais en valeur absolue, les ressources engagées restent considérables
- Le nouveau Sora évolue dans une direction intéressante avec l’ajout de fonctions de réseau social
- « La société et la technologie doivent évoluer ensemble » : il insiste sur l’importance d’expérimenter et de s’adapter avant même l’arrivée complète de ces technologies
L’arrivée du scientifique IA
- Avec GPT-5, on voit apparaître les premiers exemples d’IA réalisant des découvertes scientifiques
- De nouvelles découvertes mathématiques, ainsi que de petites contributions en physique et en biologie
- Il s’attend à ce que, dans les deux prochaines années, les modèles puissent mener des travaux scientifiques de plus grande ampleur et aboutir à des découvertes importantes
- Pour Sam Altman, l’équivalent moderne du test de Turing pourrait être la capacité de l’IA à faire de la science
- Cela produirait un véritable changement dans le monde
- Le progrès scientifique est, à long terme, le facteur le plus important pour améliorer le monde
- Le test de Turing serait déjà passé, sans pour autant que le monde ait changé de façon radicalement inimaginable
- L’AGI arrivera probablement de manière similaire, mais sans singularité réelle, avec des changements plus progressifs qu’attendu
- Même avec une recherche menée à un rythme frénétique, la société apprendra plus vite qu’on ne le pense
- Les individus et la société sont bien plus adaptables qu’on ne l’imagine
- Ils intègrent l’idée que l’AGI va arriver, l’acceptent, puis retrouvent une forme d’équilibre
- L’évolution sera beaucoup plus continue que prévu
Évolution de l’interface IA-humain
- Les modèles ont déjà atteint un très bon niveau pour les interactions de base de type chatbot
- En revanche, ils ne peuvent pas encore répondre à des demandes comme « guéris-moi le cancer »
- Le style d’interface textuelle peut encore énormément progresser
- Cela s’étendra vers un monde où la vidéo rendue en temps réel deviendra l’interface
- Des appareils ambiants où l’IA perçoit l’environnement et n’affiche les informations qu’au moment nécessaire
- Au lieu d’envoyer sans discernement des notifications par SMS, l’IA comprend le contexte et fournit l’information au bon moment
- À long terme, l’interface évoluera vers un système où « l’IA comprend l’utilisateur et choisit d’abord le style de conversation personnalisé qui lui convient »
- L’importance de la personnalisation utilisateur
- Il serait étrange que des milliards de personnes parlent toutes au même cerveau
- La manière dont chacun souhaite que son IA se comporte varie énormément
- ChatGPT évoluera vers un système qui interroge l’utilisateur, comprend ses préférences et s’ajuste automatiquement
Infrastructure, partenariats et énergie
- OpenAI collabore avec AMD, NVIDIA, Oracle et d’autres pour étendre massivement son infrastructure
- Comme la raison d’être d’OpenAI est de construire l’AGI, la recherche reste prioritaire, et les GPU sont alloués en priorité à la recherche plutôt qu’aux produits
- Des exceptions ne sont faites que dans des cas particuliers, par exemple lorsqu’une nouvelle fonctionnalité devient virale
- L’objectif de construire d’énormes capacités est justement de ne plus avoir à prendre ce type de décisions douloureuses
- Une bonne culture de recherche ressemble à la gestion d’une société d’investissement en phase très early-stage
- Il s’agit de miser sur des fondateurs et de les soutenir
- C’est une approche différente de celle d’une entreprise produit
- Sur l’énergie, il insiste : « une énergie abondante et bon marché est la clé pour améliorer la qualité de vie de l’humanité »
- À court terme, le gaz naturel dominera ; à long terme, ce seront le solaire + stockage et le nucléaire avancé (SMR, fusion)
- Il explique qu’un assouplissement de la régulation du nucléaire est indispensable, et que si les prix baissent fortement, la transition pourrait être très rapide
Évaluation des capacités des modèles
- Les scores sur benchmarks statiques perdent de leur intérêt et sont fortement sujets au gaming
- Les découvertes scientifiques pourraient devenir un indicateur d’évaluation pertinent à long terme
- Le chiffre d’affaires est aussi envisagé comme un indicateur d’évaluation intéressant
Vision de la sécurité et de la régulation de l’IA
- Ce n’est pas parce que la technologie n’a pas encore généré de risques vraiment terrifiants et massifs qu’elle n’en créera jamais
- Il s’attend à quelques moments vraiment étranges ou effrayants
- Comme pour les technologies précédentes, certaines choses vraiment graves finiront par arriver
- « La technologie IA connaîtra inévitablement des moments dangereux », et il reconnaît la nécessité de mettre en place des garde-fous sociétaux
- Comme la plupart des régulations risquent d’avoir de nombreux effets négatifs, il propose de les limiter aux modèles extrêmement puissants
- Quand un modèle atteint réellement des capacités extrêmement surhumaines, ce modèle — et lui seul — mérite des tests de sécurité très rigoureux
- Il espère qu’on n’imposera pas de fardeau réglementaire aux nombreuses choses positives que peuvent faire les modèles moins capables
- Une répression totale à l’européenne serait très mauvaise
- La Chine n’aurait pas ce type de contraintes ; si les États-Unis prenaient du retard sur l’IA, cela serait très dangereux pour le monde
- Une régulation excessive pourrait au contraire accroître le risque global
Copyright, open source et avenir du contenu
- Concernant les données d’entraînement, il estime probable que « l’apprentissage relève du fair use »
- En revanche, de nouveaux modèles commerciaux seront nécessaires pour la génération de contenus fondés sur des personnages, des styles ou des IP
- C’est comparable à un auteur humain qui peut lire un roman et s’en inspirer, mais pas le copier
- Certains ayants droit se plaignent déjà que « leur personnage n’apparaît pas assez », signe d’une recomposition en cours des structures de collaboration autour du contenu
- Le modèle open source gpt-oss est évalué positivement, avec la mention de la nécessité d’éviter une diffusion monopolistique des modèles chinois
Convergence entre énergie et IA
- Ses deux grands centres d’intérêt, l’IA et l’énergie, convergent vers une seule et même réalité
- Historiquement, ce qui a le plus amélioré la qualité de vie des gens, c’est une énergie plus abondante et moins chère
- Pousser bien plus loin l’énergie est donc une bonne idée
- À court terme, le gaz naturel devrait représenter l’essentiel des nouvelles capacités nettes de base load aux États-Unis
- À long terme, le solaire + stockage et le nucléaire domineront
- Y compris le nucléaire avancé (SMR, fusion, etc.)
- Si le nucléaire devenait économiquement écrasant par rapport à toutes les autres sources, l’adoption s’accélérerait rapidement
- Historiquement, le monde bascule très vite vers une source d’énergie nettement moins chère
- Le nucléaire devrait être la forme d’énergie la moins chère sur Terre, ou partout ailleurs
Monétisation et confiance des utilisateurs
- Le coût élevé de génération vidéo de Sora impose de nouveaux modèles de monétisation
- Les gens l’utilisent de façons inattendues, par exemple pour générer des mèmes amusants avec leurs amis dans des conversations de groupe
- Il faut d’autres modes de monétisation pour les personnes qui s’en servent des centaines de fois par jour
- Le coût des GPU étant élevé, un modèle pay-per-generation sera probablement nécessaire
- Les hypothèses traditionnelles sur la création de contenu changent
- Modèle classique : 1 % créent, 10 % commentent, 100 % regardent
- Beaucoup plus de personnes veulent créer du contenu ; c’était simplement difficile jusqu’ici
- Il se dit ouvert à la publicité, mais la confiance reste essentielle
- « Seulement dans la mesure où cela ne nuit pas à la confiance des utilisateurs »
- Les publicités Instagram sont citées comme un bon exemple de valeur nette ajoutée (découvrir un produit qu’on ne connaissait pas)
- Il ne faut pas briser la forte relation de confiance entre ChatGPT et l’utilisateur
- Si, à la question « quel cafetière devrais-je acheter ? », le système recommande non pas la meilleure mais celle qui a payé, la confiance est perdue
Retour sur les débuts d’OpenAI
- Au départ, OpenAI était davantage centré sur la recherche que sur le business, mais en tant que CEO, « le plus grand changement a été d’apprendre les complexités psychologiques de l’exécution et de l’organisation »
- Les premières années ont été la période professionnelle la plus amusante, à diriger un laboratoire avec des personnes parmi les plus brillantes et à mener un travail historique
- La sortie de ChatGPT a complètement bouleversé sa vie. Presque trois ans ont passé ; avec le temps, cela devient un peu plus fou encore, mais on s’y habitue
- Le passage d’investisseur à CEO
- Il n’avait pas de disposition naturelle pour diriger une entreprise
- Il a dû comprendre qu’au lieu de conseiller une entreprise comme investisseur, il fallait réellement la piloter
- Avec le temps, il a beaucoup appris sur ce qu’exige la direction opérationnelle
Conseils pour l’avenir
> « Les géants de la prochaine génération n’imiteront pas OpenAI ; ils émergeront sur la base technologique créée par OpenAI »
> « La plupart des tentatives de prédiction des industries futures se trompent ; la seule vraie réponse est de construire, d’expérimenter et d’apprendre directement »
- Une profonde humilité s’impose : les prévisions sont toujours fausses
- Faire le quarterback en fauteuil sonne intelligent, mais revient souvent à dire la même chose que tout le monde
- Il est extrêmement difficile d’acquérir la bonne conviction
- La seule manière de savoir est d’être profondément impliqué sur la frontière où les idées sont explorées
- Parler avec beaucoup de gens, fabriquer des choses, jouer avec la technologie et être présent dans le monde réel
- La volonté des investisseurs de soutenir ce genre d’initiatives est décevamment faible
- La plupart des entreprises se contentent de suivre les tendances du moment
- Il espère voir davantage de personnes tenter des choses nouvelles
Vision du monde après l’AGI
- Altman définit l’IA comme le moteur central d’un progrès continu dans la science, l’énergie et l’économie
- L’IA sera fascinée par l’étude et l’observation de tout le reste : il s’attend à ce qu’elle s’intéresse à l’ensemble de l’algorithme humain
- Si OpenAI accomplit sa mission, une AGI massive et quasi gratuite deviendra possible
- Les prédictions concrètes restent difficiles, mais il faut les découvrir en jouant avec la technologie, en parlant aux gens et en étant dans le monde
- L’AGI ne s’imposera pas comme un bouleversement explosif, mais comme un processus d’évolution continue dans la société, et l’humanité entre avec l’IA dans « une ère d’apprentissage commun permanent »
Aucun commentaire pour le moment.