- Depuis plusieurs décennies, l’objectif central des outils d’observability était de rendre compréhensibles par les humains de vastes volumes de données de télémétrie hétérogènes
- Avec l’arrivée de l’IA et des LLM, le paradigme centré sur les « tableaux de bord + alertes + échantillonnage » évolue, et le processus d’analyse est remplacé par l’automatisation
- En pratique, un agent IA a analysé la cause d’un pic de latence en 80 secondes avec 8 appels d’outils, automatisant ce qui se faisait auparavant dans les démos, pour un coût de seulement 60 cents
- Les jolis tableaux de bord ou une instrumentation pratique n’ont plus vraiment de valeur distinctive, car les LLM banalisent l’analyse et OpenTelemetry banalise l’instrumentation
- L’observability du futur aura pour clés du succès des boucles de feedback rapides et des workflows de collaboration IA+humain, ouvrant l’ère de davantage de logiciels et d’automatisation
Histoire des outils d’observability et arrivée de l’IA
- Pendant des décennies, l’objectif fondamental des outils d’observability a été de compresser/résumer d’immenses volumes de données hétérogènes (télémétrie) à un niveau compréhensible par les humains
- Chaque fois que de nouvelles abstractions logicielles sont apparues (par ex. Rails, AWS, Kubernetes, OpenTelemetry, etc.),
divers outils ont été développés pour masquer cette complexité — monitoring, instrumentation, tableaux de bord, alertes adaptatives, échantillonnage dynamique, etc. — afin de fournir une version compressée de la complexité des données adaptée aux capacités cognitives humaines
LLM = approximateur universel de fonctions, et enfin vraiment utile
- Mathématiquement, les LLM ne sont rien d’autre que des approximateurs universels de fonctions (
universal function approximator), mais en pratique ils sont très utiles pour résoudre des problèmes d’observability
- Exemple : dans une démo Honeycomb, on demande à un agent IA d’analyser en langage naturel un pic de latence sur une heatmap
- « Analyse la cause des pics de latence qui se produisent toutes les 4 heures dans le service frontend »
- Intégration entre un LLM prêt à l’emploi (Claude Sonnet 4) et le Model Context Protocol (MCP) de Honeycomb
- 80 secondes, 8 appels d’outils, et 60 cents de coût pour une analyse automatique de la cause
- Le niveau atteint permet de résoudre un scénario réel en zero-shot, sans prompt supplémentaire, entraînement spécifique ni guide
- Banalisation de l’analyse (
commoditization) :
- Si les LLM automatisent le travail d’analyse, les anciens différenciateurs des produits d’observability (beaux graphiques, instrumentation facile, etc.) perdent leur sens
- OpenTelemetry banalise l’instrumentation, et les LLM banalisent l’analyse
- À l’avenir, la « boucle de feedback rapide » remplacera la valeur centrale des outils d’observability
Le rôle des humains, et les changements à venir
- Le rôle des humains ne disparaîtra pas complètement
- De la même façon que l’arrivée du cloud n’a pas supprimé l’informatique elle-même, l’IA ne remplacera pas les développeurs/opérateurs
- Les gains de productivité élargissent l’ensemble du paysage et font naître encore plus de logiciels
- La question clé est la suivante :
dans un monde où le coût d’écriture/refactorisation/analyse du code chute fortement, et où l’analyse devient quasi constante,
vers quoi se déplace l’essence même de l’observability ?
Ce qui compte vraiment, c’est le « feedback rapide »
- Le plus important est de disposer de boucles de feedback rapides et serrées à toutes les étapes du développement et des opérations
- L’IA sera toujours plus rapide que les humains sur la vitesse
- Les LLM formulent rapidement des dizaines d’hypothèses, échouent, puis finissent par trouver le bon résultat
(pour un coût très faible)
- Philosophie de Honeycomb :
- Boucles de feedback rapides, partage collaboratif des connaissances, développement/exploitation expérimentaux
- À l’avenir, l’assistance par IA sera introduite sur tout le cycle de vie du développement et des opérations logicielles
- Exemples
- Lors de l’écriture et du déploiement du code, des agents IA fournissent un feedback en temps réel et suggèrent des améliorations de bugs/de qualité
- En production, détection/analyse/reporting automatique des
emergent behavior, puis amélioration automatique après approbation
- Les organisations les plus avancées automatiseront les rôles SRE/SWE avec l’IA et des outils, jusqu’à atteindre directement des objectifs business
- Conditions de réussite pour le futur de l’observability
- Performance de requête à très faible latence
- Stockage unifié des données
- Workflows de collaboration fluides entre humains et IA
- Conclusion :
- Les outils d’observability traditionnels centrés sur les tableaux de bord, les alertes et la visualisation
ne sont plus le cœur du sujet à l’ère de l’IA,
et seules survivront les « boucles de feedback rapides » et les plateformes de collaboration IA-humain
4 commentaires
Tout comme l’observability n’a pas marqué la fin du monitoring, les LLM ne marqueront probablement pas la fin de l’observability
De même que l’observability s’est développée sur la base d’un monitoring plus avancé, l’analyse par LLM se développera sur la base d’une observability plus avancée
J’attends avec impatience de voir à quelle vitesse le domaine de l’observability va innover grâce aux LLM, mais le titre est vraiment trop putaclic lol
Faire la promotion de son propre service en disant que « la fin approche », c’est un peu embarrassant...
Personnellement, j’attends surtout les progrès des vision LLM pour les utiliser dans les tâches de monitoring. J’ai récemment vu le billet d’un parent qui utilisait un VLM pour vérifier, pendant que son enfant dormait, qu’il n’y avait rien d’anormal, et j’ai trouvé ça vraiment intéressant.
Commentaires sur Hacker News