- OpenAI a déclenché d’urgence le mode « code rouge » pour améliorer la qualité de ChatGPT, afin de retrouver un avantage érodé par la pression de Google
- Aujourd’hui, des améliorations critiques sont attendues sur des fonctions clés comme la personnalisation, la vitesse, la fiabilité et l’élargissement du champ des questions, et pour cela tous les nouveaux projets, dont la publicité, Pulse, la santé et le shopping, ont été mis en pause ou retardés
- Gemini 3 de Google devance désormais plusieurs modèles d’OpenAI sur de nombreux benchmarks récents, et le succès du modèle image Nano Banana, qui a fait monter le MAU de 4,5 à 6,5 centaines de millions d’utilisateurs, est apparu comme une menace majeure
- OpenAI fait aussi face à une pression financière croissante avec un accord d’investissement en centres de données de plusieurs centaines de milliards de dollars, la nécessité de 2 000 milliards de dollars de revenus annuels d’ici 2030, etc., tandis que la croissance des clients entreprises d’Anthropic joue également un rôle concurrentiel
- OpenAI met en place un contrôle quotidien et une réallocation d’équipes, tout en indiquant en interne que le nouveau modèle de reasoning qui sera annoncé prochainement devance la dernière version de Gemini, ce qui fait de la reconquête de la main un passage décisif
Activation du code rouge et plan d’amélioration de ChatGPT
- Il a été révélé dans une note interne qu’OpenAI a déclenché le niveau d’urgence maximum, le « code rouge », pour résoudre les problèmes de ChatGPT
- OpenAI utilise un dispositif d’alerte en trois niveaux : yellow → orange → red, et cette mesure correspond à un cran au-dessus du code orange
- Le champ d’amélioration couvre l’expérience globale, incluant le renforcement de la personnalisation, l’accélération de la latence, l’amélioration de la fiabilité des serveurs et l’extension du champ des questions auxquelles le modèle peut répondre
- Pour ce faire, la publicité, Pulse (assistant personnel), les agents santé et shopping ainsi que tous les nouveaux projets ont été relégués en priorité plus basse
- OpenAI encourage la réallocation de l’ensemble des effectifs et prévoit de mettre en place un daily call dédié pour vérifier chaque jour l’avancement du développement
- Récemment, il y avait des plaintes sur le ton froid de GPT-5 et les erreurs sur des questions de base, ce qui a également inclus un réajustement du ton du modèle et de sa capacité à exécuter les consignes
Poursuite de Google Gemini et pression concurrentielle
- Le plus récent modèle Gemini 3 de Google dépasse OpenAI sur plusieurs benchmarks sectoriels, dans une situation où l’équilibre concurrentiel semble fortement bouleversé
- L’action de Google a grimpé après l’annonce de Gemini, et les performances ont fortement émergé sur le marché
- Depuis le lancement en août du modèle de génération d’images Nano Banana, le MAU global de Google AI a
- connu une hausse de 450 millions en juillet à 650 millions en octobre selon les données fournies
- Anthropic s’étend également sur la base clients entreprises, révélant une dynamique où l’avance exclusive d’OpenAI s’affaiblit
- L’épisode où le « code rouge » annoncé par Google juste après l’arrivée de ChatGPT est présenté comme une situation désormais retournée vers OpenAI est décrit comme ironique
Investissements, pression financière et inquiétude des marchés
- OpenAI a conclu avec Microsoft et Amazon un contrat d’énergie pour centres de données d’une taille de 36 GW,
- ce qui pourrait entraîner annuellement un coût de location de data centers de l’ordre de 620 milliards de dollars
- Un scénario interne évoque également qu’il faut environ 2 000 milliards de dollars de revenus annuels pour devenir rentable d’ici 2030
- Bien qu’OpenAI ne prévoie pas d’introduction en bourse,
- cette structure financière est fortement corrélée au cours de sociétés technologiques clés comme Nvidia, Oracle et Microsoft, et pèse sur l’ensemble du marché
- OpenAI reste déficitaire et est jugée en survie difficile sans levées de fonds massives et continues
Annonce imminente d’un nouveau modèle et confiance interne
- Altman indique dans la note que le nouveau modèle de reasoning qui sera dévoilé la semaine prochaine devance la version la plus récente de Google Gemini
- présenté comme un facteur de relance interne, il met l’accent sur la capacité de croissance de ChatGPT et la volonté de reconquérir le leadership
- ChatGPT dispose encore d’une base solide avec plus de 800 millions d’utilisateurs hebdomadaires,
- OpenAI prévoit d’y ajouter à nouveau des améliorations de vitesse, précision et personnalisation pour maintenir la dynamique de croissance
Contexte global
- Dans un contexte de concurrence accrue (Google, Anthropic), de débat sur la qualité des produits et de coûts d’infrastructure massifs, il ressort que rétablir la qualité de base de ChatGPT est la stratégie de survie d’OpenAI et la priorité la plus urgente
3 commentaires
Les problèmes de ChatGPT
Il y a beaucoup trop de bugs. On appuie sur envoyer, mais le message ne se génère pas, ou bien une erreur apparaît pendant le streaming du message et tout disparaît, etc. Deep Research a encore moins de sources que le mode raisonnement. Il n’y a donc plus vraiment de raison d’utiliser Deep Research.
Les problèmes de Codex
C’est trop lent. Une tâche qui prendrait 5 minutes avec Claude Code met plus de 10 minutes avec Codex. C’est vraiment trop bête.
Mais Gemini n’est-il pas aussi, côté UI et globalement, plus inconfortable à utiliser que ChatGPT.. ?
Avis Hacker News
La semaine dernière, un client a envoyé une question sur une fonctionnalité que j’avais en partie développée. Un ingénieur support a généré une réponse avec Claude et, bien qu’il ait été entraîné sur de la documentation interne et publique, il a produit avec énormément d’assurance une hallucination plausible
Pendant que j’expliquais pourquoi c’était faux, un autre ingénieur a essayé avec Augment, qui a à son tour sorti une autre absurdité avec aplomb. Au final, on s’est juste échangé des emojis en larmes, et moi je vais continuer à utiliser ma propre intelligence
J’ai entendu la rumeur qu’OpenAI n’avait plus réussi de pre-training convaincant depuis la mi-2024. Si on demande à ChatGPT 5.1 des événements actuels sans accès à Internet, il dit que sa coupure de connaissances date de juin 2024. Je ne sais pas si c’est lié à un petit modèle, mais à ce stade, avoir 18 mois de retard ressemble à un signal inquiétant
On dirait que la fuite des chercheurs clés d’OpenAI qui dure depuis l’an dernier commence maintenant à avoir un vrai impact. Sam Altman est un commercial, pas un chercheur. Ilya n’est plus là, et des profils majeurs sont partis chez Google, Meta, Anthropic ou ont créé leur startup. Ceux qui restent sont bons pour l’amélioration incrémentale, mais on peut douter de leur capacité à mener eux-mêmes le prochain grand saut
L’OpenAI actuel ressemble à Netscape : innovant, mais sans modèle économique durable. D’un côté, Google bundle l’IA gratuitement dans ses produits existants ; de l’autre, Deepseek ou Qwen font baisser les prix en open source. Au final, l’entreprise se retrouve prise en étau des deux côtés
Il y a une question que je me pose sincèrement : comment OpenAI peut-il échouer en pre-training ? Ils ont déjà réussi auparavant, ils ont des talents de tout premier plan ; il ne suffirait pas de réentraîner le modèle de 2024 ?
Dans mon expérience, un « Code Red » servait surtout à emballer le fait qu’une entreprise avait perdu sa direction. Les managers intermédiaires ne savent plus quoi faire, et au final la charge retombe sur les ingénieurs
Le vrai Code Red, ce n’est pas que Google ait dépassé OpenAI, c’est que l’industrie de l’IA n’a pas de moat. Au final, tout le monde se livre à la guerre des prix plancher la plus coûteuse qui soit
OpenAI a pris des engagements de dépenses à long terme de l’ordre de 500 milliards de dollars avec le projet Stargate et d’autres initiatives. L’entreprise prévoit de consacrer 250 milliards de dollars à Microsoft Azure et plusieurs milliards de plus à des GPU AMD. Oracle a contracté pour cela 18 milliards de dollars d’obligations et 9,6 milliards de dollars de prêts
Si OpenAI prend du retard, il pourrait ne pas être en mesure d’honorer ces contrats, avec un risque de défaut en chaîne. Une intervention publique devient alors possible
On dit qu’OpenAI reporte des projets comme publicité, shopping, agent santé, Pulse pour se concentrer sur l’amélioration de ChatGPT, mais au fond les talents clés sont peu nombreux, tandis que les autres peuvent très bien travailler sur la pub ou des fonctions commerciales. Les deux ne sont pas forcément en conflit
Selon le WSJ, OpenAI reporte la publicité, l’IA pour la santé et le shopping, ainsi que l’assistant personnel Pulse. Avec en plus la collaboration hardware avec Jony Ive, cela donne une impression de dispersion
Si la publicité rapporte, OpenAI pourrait devenir une entreprise de niveau Mag 7 ; si elle échoue, la réalité apparaîtra au grand jour.
Si les résultats des expérimentations publicitaires sont déjà inférieurs aux attentes, alors ce « Code Red » peut aussi être un signal pour gagner du temps et le masquer.
ChatGPT n’est pas un point d’entrée de recherche comme Google, et il ne peut pas non plus faire de publicité basée sur un feed comme Meta.
Au final, il y a de fortes chances que cela répète l’échec d’Alexa.