Incident affectant les modèles Opus 4.5 et Sonnet 4/4.5 sur l’ensemble des services Anthropic
(status.claude.com)- Une hausse du taux d’erreur sur plusieurs modèles a été signalée sur la plateforme Claude
- Les utilisateurs peuvent s’abonner aux notifications d’incident et de résolution par e-mail ou par SMS
- Les notifications par SMS peuvent être configurées avec des numéros de différents pays via une liste mondiale d’indicatifs internationaux
- Les abonnés peuvent recevoir les mises à jour par SMS après une vérification par OTP (mot de passe à usage unique)
- Il s’agit d’un exemple du dispositif de supervision des incidents des services Claude opérés par Anthropic
Avis d’incident du service Claude
- La page d’état de Claude indique un taux d’erreur élevé sur plusieurs modèles
- Affiché avec la mention « Elevated errors across many models »
- Aucune explication précise n’est donnée sur la cause ou l’étendue de l’impact
Mode d’abonnement aux alertes
- Les utilisateurs peuvent recevoir des mises à jour sur les incidents par e-mail ou par SMS
- L’e-mail envoie une notification à chaque mise à jour de l’incident
- Les SMS sont envoyés lorsque Claude crée ou résout un incident
Procédure d’inscription aux alertes SMS
- Pour recevoir des alertes par SMS, il faut suivre la procédure sélection de l’indicatif pays → saisie du numéro de mobile → vérification OTP
- Le numéro doit être validé en saisissant un OTP (mot de passe à usage unique)
- Une fois vérifié, il est possible de recevoir les mises à jour par SMS
Liste des pays pris en charge
- La page comprend une liste d’indicatifs internationaux couvrant la plupart des pays du monde
- Exemples : États-Unis (+1), Corée du Sud (+82), Japon (+81), Royaume-Uni (+44), Allemagne (+49), etc.
- Les utilisateurs de chaque pays peuvent recevoir des alertes par SMS selon la même procédure
Signification du suivi de l’état du service
- La page d’état de Claude sert de point d’accès public à la situation des incidents en temps réel des services Anthropic
- Elle offre aux utilisateurs une fonction transparente de notification des incidents et de partage de l’avancement du rétablissement
- Elle permet aux développeurs et aux clients entreprises de vérifier immédiatement la disponibilité du service
1 commentaires
Réactions sur Hacker News
J’ai trouvé impressionnant qu’ils aient mis à jour la page de statut dès que le problème est survenu
J’utilisais Claude Code, j’ai vu une erreur API, puis j’ai vérifié la page de statut et l’incident y était bien indiqué
À mon avis, ce genre de transparence devrait être la norme pour tous les services
Le fait que j’utilisais justement Claude à ce moment-là m’a permis de comprendre immédiatement la gravité de la panne
On dirait que les utilisateurs de Claude travaillent dur même le dimanche soir
Je fais partie des ingénieurs de réponse à incident sur ce cas
À 14:43 PT / 22:43 UTC, nous avions atténué le problème. Désolé pour la gêne occasionnée
Des annonces de routes dupliquées ont envoyé le trafic destiné à certains backends d’inférence dans un black hole
La détection a pris environ 75 minutes, et certaines voies d’atténuation n’ont pas fonctionné comme prévu
Les routes incorrectes ont été supprimées et le service a été rétabli
À l’avenir, nous allons renforcer le synthetic monitoring et la visibilité sur les changements d’infrastructure pour détecter ce type de problème plus rapidement
Cette transparence m’a fait davantage confiance à Cloudflare
J’imagine une dystopie steampunk dans 50 ans
« L’hébergement des LLM s’est arrêté, la production mondiale s’est figée et les marchés se sont effondrés. Sam, tu m’entends ? »
Rien que d’y penser, ça me fait rire
Vidéo associée : YouTube Shorts
J’ai reçu ce message dans le chat Claude.ai
Soit le timing était incroyablement parfait, soit les responsables de la monétisation méritent une prime
Le backend ne renvoie peut-être pas les erreurs 429/402, ou la gateway les traite mal et renvoie un mauvais message
Si jamais ils arrêtent Opus 4.5, je vais pleurer
Juste avant la panne, Opus s’est mis à produire des réponses anormalement longues
Même à une question simple, il répondait comme s’il recrachait toute la base de code, et sur une simple question concernant un schéma de base de données, la compression s’est déclenchée deux fois
canivibe.ai — selon le service utilisé, on pourra peut-être ajuster sa vibe
Je me demande si ce n’était pas en fait une panne AWS cette fois
D’après la page de statut, cela semble maintenant rétabli
J’ai vu un agent rester bloqué dans la même boucle d’erreurs, puis cette fois produire correctement le résultat
Je me demande s’ils n’ont pas ajouté une règle pour détecter automatiquement ce type d’incident, et j’ai trouvé la réponse assez inspirante