- Cet article présente WarpStream, une plateforme de streaming de données compatible avec le protocole Kafka et construite directement sur S3.
- WarpStream est proposé sous la forme d’un binaire Go unique et sans état, ce qui élimine la nécessité de gérer des disques locaux, de rééquilibrer les brokers et d’exploiter ZooKeeper.
- En diffusant les données directement vers S3, cette plateforme réduit fortement les coûts d’infrastructure et revient 5 à 10 fois moins cher que Kafka dans le cloud.
- L’article critique l’adéquation de Kafka aux charges de travail modernes, en soulignant les coûts élevés de bande passante inter-AZ et la surcharge opérationnelle.
- L’architecture de WarpStream diffère de celle de Kafka. Au lieu de brokers, elle utilise des « agents » sans état, capables d’agir comme « leader » pour n’importe quel topic, de valider les offsets pour n’importe quel groupe de consommateurs ou de faire office de coordinateur du cluster.
- Dans WarpStream, tout le stockage est déporté vers un object storage comme S3, ce qui permet une montée en charge simple et une récupération rapide après incident.
- WarpStream sépare les données et les métadonnées, et stocke les métadonnées de tous les « clusters virtuels » dans une base de données de métadonnées personnalisée.
- La plateforme réduit de 5 à 10 fois le coût total de la plupart des charges de travail Kafka, mais avec une latence plus élevée : un P99 d’environ 400 ms pour les requêtes de production et environ 1 seconde entre le producteur et le consommateur.
- WarpStream est actuellement en phase de developer preview et n’est pas encore prêt pour un usage en production.
- Les créateurs de WarpStream estiment que l’UX développeur de Kafka pose problème, en particulier l’abstraction bas niveau des partitions. Ils prévoient de corriger cela dans de futures mises à jour de WarpStream.
- L’article se conclut en invitant les lecteurs à essayer WarpStream et à faire part de leurs retours.
1 commentaires
Avis sur Hacker News