1 points par p2c2kbf 2026-04-13 | Aucun commentaire pour le moment. | Partager sur WhatsApp

AIWatch est un projet open source qui surveille en temps réel les pannes, la disponibilité et les temps de rétablissement des principaux services IA comme Claude, OpenAI et Gemini.

Tableau de bord : https://ai-watch.dev
Page de présentation : https://ai-watch.dev/intro
GitHub : https://github.com/bentleypark/aiwatch

En cas d’incident, l’IA analyse la cause, prédit le temps de rétablissement
et envoie immédiatement des alertes via Discord/Slack.

Aujourd’hui, nous publions le rapport de fiabilité de 27 services (référence de mars)
basé sur les données collectées du 20 au 31 mars (12 jours). Comme il s’agit du premier rapport, la période est courte ; à partir d’avril, il sera publié avec les données du mois complet.

3 constats clés

1. Le pourcentage de disponibilité est incomplet
L’API Claude a affiché 99 % de disponibilité, mais 9 incidents se sont produits en 12 jours.
Cohere a atteint 100 % de disponibilité avec zéro incident.
À première vue, les chiffres semblent proches, mais la fiabilité réelle est totalement différente.

2. L’accumulation de courts incidents devient un gros problème
Together AI a enregistré le plus d’incidents sur 12 jours, avec 20 au total,
mais un temps moyen de rétablissement de 25 minutes, pour un temps d’arrêt cumulé de 8 h 37.
À l’inverse, ChatGPT n’a eu que 4 incidents, mais l’un d’eux a duré 19 h 46.

3. Le risque lié aux dépendances amont
La panne de 74 heures de Voice Agent chez Deepgram a commencé par une panne d’OpenAI.
Les services IA construits au-dessus d’autres IA héritent directement des pannes des services en amont.


Top 5 de l’AIWatch Score (référence de mars)

Service Score Niveau Incidents
Cohere API 100 Excellent 0
Hugging Face 100 Excellent 0
OpenRouter 99 Excellent 0
Groq Cloud 93 Excellent 1
DeepSeek API 92 Excellent 1
OpenAI API 88 Excellent 1 (2h 56m)
Together AI 84 Good 20 (moy. 25m)
ChatGPT 73 Good 4 (max. 19h 46m)
Claude API 59 Fair 9 (agrégé par modèle)
ElevenLabs 47 Degrading 2 (max. 4h 47m)

Formule du score (référence du rapport de mars) : Uptime(50) + jours d’impact des incidents(30) + temps de rétablissement(20) = score sur 100
Comme le calcul se base sur les jours d’impact (affected_days) et non sur le nombre d’incidents, une comparaison équitable est possible quel que soit le mode de reporting.
Méthode de calcul complète : https://ai-watch.dev/#about-score

Avec une disponibilité de 97,55 %, ElevenLabs est le seul des 27 services à avoir reçu la mention Degrading.
Si vous utilisez des services vocaux/audio en production, la prudence est nécessaire.


Remarques

  • La période de surveillance couvre du 20 au 31 mars (12 jours) et, comme il s’agit du premier rapport, les données sont partielles.
    À partir d’avril, il sera publié avec les données du mois complet.

Recommandations selon l’usage (référence du rapport de mars)

  • Critique pour la production : Cohere (100 points, 0 incident), OpenAI API (88 points, 1 incident / temps d’arrêt total 2h 56m)
  • Faible latence / stabilité : Groq Cloud (93 points, 100 % de disponibilité), DeepSeek API (92 points)
  • Workflow de développement : Cursor, Windsurf (forte disponibilité)
  • Voix / audio : AssemblyAI recommandé + fallback indispensable (pannes multiples sur ElevenLabs et Deepgram)

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.