10 points par princox 2026-04-01 | 5 commentaires | Partager sur WhatsApp
Publicité

Incident sur Claude Code, retour d’expérience de Boris Cherny : « Ce n’est pas une erreur individuelle, mais un problème de processus »

Boris Cherny (@bcherny), créateur de Claude Code, a publié un commentaire bref mais marquant au sujet de l’incident du service Claude survenu le 31 mars.
« Des erreurs arrivent. L’important, en tant qu’équipe, est de reconnaître que ce n’est pas la faute d’une personne en particulier — c’est un problème de processus, de culture ou d’infrastructure. Dans ce cas, il y avait une étape de déploiement manuelle qui aurait dû être automatisée. L’équipe a déjà appliqué plusieurs améliorations d’automatisation, et d’autres sont en cours. »

Que s’est-il passé ?

Du 31 mars à 17:45 UTC au 1er avril à 05:52 UTC, Claude Opus 4.6 et Sonnet 4.6 ont connu une forte hausse des timeouts.  Selon Downdetector, plus de 2 400 utilisateurs avaient signalé des problèmes à 8 h 30 (PT), principalement liés à Claude Chat. 
Cherny a indiqué lui-même qu’une étape de déploiement manuelle, insuffisamment automatisée, était à l’origine du problème.

Plus que l’incident lui-même, c’est la manière de réagir qui frappe

Le commentaire de Cherny reflète pleinement la philosophie du blameless postmortem dans la culture d’ingénierie. Il montre que l’équipe Claude Code met en pratique ce principe longtemps mis en avant dans les cultures SRE (site reliability engineering) de Google ou Netflix — « si l’on punit des individus, les problèmes se cachent ; il faut corriger le système ».

Dans des services d’IA en forte croissance, une seule étape manuelle dans un déploiement peut provoquer un incident majeur. Le fait de le reconnaître publiquement et d’y répondre par l’automatisation est un point à retenir, aussi bien pour les petites équipes que pour les grands services.
Référence
∙ Selon la page officielle de statut de Claude (status.claude.com), l’incident est entièrement résolu.
∙ Tweet original : https://x.com/bcherny/status/2039210700657307889​​​​​​​​​​​​​​​​

5 commentaires

 
snowhare 2026-04-02

C’est de loin le résumé Hacker News le plus étrange. Seul le titre est correct, et si le premier point correspond bien au contenu traduit, tout le reste reprend ce que d’autres personnes ont raconté sur X, et même les explications données en arrière-plan parlent d’autre chose. Comme le texte original est un court tweet, on dirait que du contenu y a été rattaché par erreur.

 
runableapp 2026-04-02

Le résumé sur GeekNews est sans doute généré à l’aide d’un LLM, n’est-ce pas ?

Et sur x.com, on dirait maintenant que presque tout le monde a le badge bleu. Si je me souviens bien, avant, c’était plutôt réservé aux comptes « officiels », mais j’imagine que tout le monde a fini par adopter l’abonnement.

 
click 2026-04-02

Pour écrire un long texte, il faut apposer ce badge, donc j’ai l’impression que tous ceux qui l’utilisent pour leur blog ou pour publier des annonces le mettent.
À l’époque de Twitter, si je me souviens bien, c’était un badge de vérification gratuit accordé par Twitter aux personnes reconnues, sans fonctionnalité particulière.

 
runableapp 2026-04-03

Je vois. Merci pour votre réponse.

 
princox 2026-04-01

Il vaudrait sans doute mieux écrire qu’il s’agit non pas de la voie de fuite, mais plutôt des circonstances de la fuite… mais je ne peux pas modifier le message.