Amélioration d’architecture pour un pipeline de données temps réel sans lag

(engineering.ab180.co)

17 points par toughrogrammer 2021-11-11 | 2 commentaires | Partager sur WhatsApp

Voici un retour d’expérience sur la relation entre les Kafka consumer groups et le nombre de partitions, les difficultés d’auto scaling qui en découlent, et l’adoption d’une nouvelle architecture pour les résoudre.

Présentation du service Airbridge et de la charge de travail
Problèmes de l’architecture existante
Proposition d’une nouvelle architecture
- Option 1 : modèle driver/executor comme Spark Streaming
- Option 2 : modèle découplé entre Kafka consumer et serveur d’application
Pourquoi l’option 2 a été choisie
Architecture du modèle découplé entre Kafka consumer et serveur d’application
Points à considérer dans la nouvelle architecture
Difficultés rencontrées
Résultats après l’adoption de la nouvelle architecture
Ce qu’il reste à essayer par la suite

2 commentaires

lamanus 2021-11-11

Waouh... j’utilise aussi ECS, mais je n’avais jamais réfléchi à ce point-là, c’est vraiment bien.

lamanus 2021-11-11

En utilisant envoy, il semble que la demande visant à réduire le trafic inter-AZ était en attente.

https://github.com/aws/aws-app-mesh-roadmap/issues/94

Amélioration d’architecture pour un pipeline de données temps réel sans lag

À lire aussi

2 commentaires