Panne de GCP

(status.cloud.google.com)

2 points par GN⁺ 2025-06-13 | 1 commentaires | Partager sur WhatsApp

Le tableau de bord Google Cloud Service Health affiche l’état des services Google Cloud par produit et par localisation, et l’écran actuel indique aucun incident grave généralisé
L’impact par projet peut ne pas être suffisamment visible via le seul tableau de bord global ; il faut donc consulter Personalized Service Health pour vérifier les alertes personnalisées, les données d’API et même les logs
La portée de l’état est répartie entre Americas, Europe, Asia Pacific, Middle East, Africa, Multi-regions et Non-regional, ce qui permet de voir l’état par produit selon l’axe géographique
Multi-regions désigne des emplacements redondants et distribués sur plusieurs régions, et Non-regional indique l’état des services déployés à l’échelle mondiale plutôt que dans une région spécifique
L’historique des incidents, un flux RSS, JSON History et JSON Product Catalog sont fournis, l’heure affichée est basée sur US/Pacific et la dernière mise à jour date du 3 juillet 2026 à 12:35 PDT

État actuel de Google Cloud

Google Cloud Service Health fournit des informations d’état sur les services Google Cloud
L’état affiché actuellement en haut du tableau de bord est No broad severe incidents
Il est indiqué de consulter la vue par compte pour les événements susceptibles d’affecter un projet
La dernière mise à jour date du 3 juillet 2026 à 12:35 PDT

Vérification des incidents par projet

Personalized Service Health présente de manière plus détaillée les incidents qui affectent les projets Google Cloud
- alertes personnalisées
- données d’API
- logs
La vérification de l’état par compte suit un parcours qui consiste à passer par le compte Google Cloud

Structure de l’état par produit et par localisation

Le tableau de bord permet de vérifier l’état par produit selon un axe géographique
- Americas
- Europe
- Asia Pacific
- Middle East
- Africa
- Multi-regions
- Non-regional
Multi-regions désigne des emplacements de service gérés par Google afin d’être redondants et distribués sur plusieurs régions à l’intérieur d’une vaste zone géographique
Non-regional représente l’état de services déployés globalement plutôt que dans un emplacement précis
- Les mises à jour dans cette zone indiquent un problème concernant le service en question
- Cela ne signifie pas forcément une panne de plateforme touchant l’ensemble des régions

Indication d’état et services concernés

La légende d’état inclut Available et Multiple regions affected
Le tableau d’état couvre plusieurs produits Google Cloud
- Google Compute Engine
- Google Kubernetes Engine
- Google Cloud Storage
- Google BigQuery
- Cloud Run
- Cloud SQL
- les API et services liés à Vertex AI
- IAM, VPC, Cloud Logging, Cloud Monitoring, etc.
Chaque produit est présenté avec son état selon la localisation

Historique des incidents et accès aux données

L’historique des incidents est disponible via View incident history
Les données d’état sont fournies dans plusieurs formats
Il est indiqué de consulter une page d’état distincte pour les incidents liés à Google Security Products
Il est également indiqué de consulter une page d’état distincte pour les incidents liés à Looker original

1 commentaires

GN⁺ 2025-06-13

Avis sur Hacker News

Il semble que Chemist, un service central de Google, soit tombé
"Chemist checks the project status, activation status, abuse status, billing status, service status, location restrictions, VPC Service Controls, SuperQuota, and other policies."
Cela explique donc des erreurs comme "visibility check (of the API) failed" et "cannot load policy", ainsi que l’impact étendu sur de nombreux services
Référence : https://cloud.google.com/service-infrastructure/docs/service...
Google a en outre indiqué que "(Google Cloud) is down due to Identity and Access Management Service Issue"
- Ce n’est pas seulement GCP : plusieurs services Internet sont tombés
  Il est possible que ce service Chemist ait été particulièrement touché par des dépendances externes, et que la panne se soit propagée jusqu’aux services réseau internes de GCP
- J’utilise le relais Expo pour les notifications, et dans ce contexte Google, je me demande s’il est possible que FCM soit également affecté
Beaucoup d’erreurs sur Claude Sonnet 4 (Cursor) et Gemini Pro
Zut, maintenant je vais devoir réutiliser mon cerveau et écrire 100 % du code moi-même, comme un homme des cavernes de décembre 2024
- Même problème dans AI Studio : Failed to generate content: user has exceeded quota. Please try again later.
- J’étais en train de tester l’upload de fichiers vers Cloud Storage, donc ça ressemble à un bon moment pour aller marcher
- Des erreurs apparaissent aussi dans le mode Auto Agent de Cursor
- Les développeurs avant le 12 juin 2025 : "L’IA ? Pfff, ce n’est qu’un tas d’hallucinations. Elle ne me remplacera jamais !"
  Les développeurs pendant la panne GCP du 12 juin 2025 : "Quoi, pas d’IA ?! Vous me prenez pour un esclave ?!"
- openrouter.ai est également inaccessible
Cloudflare est aussi tombé. D’après https://www.cloudflarestatus.com :
"Update - We are seeing a number of services suffer intermittent failures. We are continuing to investigate this and we will update this list as we assess the impact on a per-service level."
Les services affectés sont Access, WARP, les Durable Objects basés sur SQLite, Workers KV, Realtime, Workers AI, Stream, ainsi qu’une partie du tableau de bord Cloudflare
12 juin 2025, 18:48 UTC
Ajout : https://news.ycombinator.com/item?id=44261064
- Si Cloudflare utilise GCP comme dépendance critique, ça ressemble à un WTF assez sérieux
À 18:43 UTC, presque tout semblait être tombé : https://downdetector.com/
- Oui. Le graphique de ce service était probablement le résultat d’une détection effectuée depuis l’intérieur de GCP
  Pendant un appel avec quelqu’un de Google, quelqu’un a dit "AWS est aussi tombé", et avant de vérifier moi-même la disponibilité d’AWS, j’ai bêtement lâché "ça pourrait être une attaque BGP". La honte
- C’est intéressant, car je ne m’attendais pas à ce qu’une panne Google affecte aussi AWS ou Microsoft 365
- Peut-être que leur logique de détection tourne sur Google Cloud /s
- Dans ce genre d’incident, Downdetector diffuse des informations erronées dans 100 % des cas
La page de statut est au vert, mais des signalements d’incident remontent : https://downdetector.com/status/google-cloud/
- Je ne vois pas l’intérêt d’avoir une page de statut si c’est pour ça
  Il y avait aussi des signalements indiquant qu’une organisation de plus de 100 000 utilisateurs ne pouvait pas utiliser Google Meet. Si les entreprises ne mettent pas à jour leurs pages de statut, autant ne pas en avoir
  https://www.google.com/appsstatus/dashboard/
  https://status.cloud.google.com/index.html
  Ajout : moins d’une minute après avoir posté ce message, la page de statut de GCP a été mise à jour, et les services affectés affichés sont Cloud Data Fusion, Cloud Memorystore, Cloud Shell, Cloud Workstations, Google Cloud Bigtable, Google Cloud Console, Google Cloud Dataproc, Google Cloud Storage, Identity and Access Management, Identity Platform, Memorystore for Memcached, Memorystore for Redis, Memorystore for Redis Cluster et Vertex AI Search
- Le lien de l’incident est ici : https://status.cloud.google.com/incidents/ow5i3PPK96RduMcb1S...
- Je ne comprends pas pourquoi les entreprises n’arrivent pas à reconnaître franchement une panne. Ça nous éviterait de passer une heure à chercher en pensant que le problème vient de chez nous
  On est vraiment entre les mains de Dieu
  $ prod
  Fetching cluster endpoint and auth data.
  ERROR: (gcloud.container.clusters.get-credentials) ResponseError: code=503, message=Visibility check was unavailable. Please retry the request and contact support if the problem persists
- Dans une entreprise de plusieurs centaines de personnes en télétravail, l’accès à Google Meetings échoue dans plus de 90 % des cas. Quand on rejoint une réunion, on se prend simplement une 504
- C’est maintenant à jour et l’impact sur Console, Dataproc, GCS, IAM et Identity Platform est affiché : https://status.cloud.google.com/incidents/ow5i3PPK96RduMcb1S...
C’est étrange que même la messagerie RCS soit tombée à cause de cette panne. Ça montre à quel point la conception technique ou l’infrastructure est fragile
- RCS, ce n’est au fond que de la messagerie instantanée, non ? Je ne vois pas pourquoi sa panne serait surprenante
- C’est donc pour ça que je n’ai pas reçu aujourd’hui la photo du chien de mes parents
- Bon sang, c’est donc pour ça que mon chat RCS a échoué tout à l’heure ?!
L’authentification Firebase est tombée et cela affecte beaucoup d’apps. Les mêmes confirmations affluent aussi sur des groupes Discord et Slack
C’est un peu décevant qu’il n’y ait rien sur la page de statut depuis près de 30 minutes : https://status.firebase.google.com/
- Ça vient d’être mis à jour. Ils ont probablement été affectés par leur propre panne
L’incident Cloudflare vient aussi d’être mis à jour
"Cloudflare’s critical Workers KV service went offline due to an outage of a 3rd party service that is a key dependency. As a result, certain Cloudflare products that rely on KV service to store and disseminate information"
- Ce service tiers, ce serait GCP ?
Je me demande s’il existe un bon dashboard pour vérifier une anomalie de routage BGP comme celle qui semble se produire ici
Je fouille en ce moment https://radar.cloudflare.com/routing, mais il ne montre pas concrètement quelles routes ont fuité
J’aimerais bien des recommandations de bons outils
- Je crois que c’est la première fois que je vois CF Radar, et c’est plutôt chouette
  Il y a aussi d’autres outils. Cela dit, certains semblent avoir des problèmes, peut-être à cause de l’incident en cours
  https://atlas.ripe.net/probes/public
  https://www.ihr.live/en/global-report
  https://www.ihr.live/en/network
  https://bgp.he.net/
  https://ioda.inetintel.cc.gatech.edu/dashboard/asn
- L’endroit que je consulte d’abord par défaut, c’est ici : https://bgp.tools/
  Mais je me demande pourquoi tu as pensé que cette panne était liée au BGP sur Internet
- Je débute aussi dans ce domaine, mais je me demande si une hausse aussi forte du nombre d’adresses dans la section "Announced IP Address Space" est normale
- Une attaque BGP ?
Heureusement que HN est hébergé sur un unique serveur bare metal, sans toutes ces énormes usines à gaz
- Je me souviens pourtant que HN est aussi tombé assez souvent

Panne de GCP

État actuel de Google Cloud

Vérification des incidents par projet

Structure de l’état par produit et par localisation

Indication d’état et services concernés

Historique des incidents et accès aux données

À lire aussi

1 commentaires

Avis sur Hacker News