- L’infrastructure de LinkedIn est composée de plusieurs centaines de milliers de serveurs répartis sur plusieurs data centers
- À mesure que l’infrastructure grandit, l’observability devient plus importante pour identifier précisément les causes potentielles des pannes et anomalies de l’infrastructure
- eBPF permet d’extraire directement les informations souhaitées tout en minimisant l’overhead
- LinkedIn a nommé son agent eBPF Skyfall et l’exécute sur la quasi-totalité de ses serveurs
Skyfall
- Collecte des informations liées aux protocoles TCP/UDP avec
kprobes et kretprobes
tcp_set_state, tcp_v4_connect, tcp_v6_connect, inet_csk_accept
ip4_datagram_connect, ip6_datagram_connect
- Envoie les données collectées à InFlow (plateforme interne de collecte/visualisation des flux) via UDP
- Depuis InFlow, les données sont envoyées vers Kafka, stockées dans HDFS, puis enregistrées dans le Graph Data Store via Samza
1 commentaires
J’ai déjà expliqué eBPF auparavant dans le podcast GeekNews.
→ https://www.youtube.com/watch?v=aCw0YwEHpCU&t=1892s