28 points par xguru 2023-08-08 | 4 commentaires | Partager sur WhatsApp
  • WarpStream est une plateforme de data streaming compatible avec le protocole Kafka, construite directement sur S3
  • Fournie sous la forme d’un unique binaire Go stateless, elle ne nécessite ni disque local à gérer, ni brokers à rééquilibrer, ni ZooKeeper à exploiter
  • Comme les données transitent directement via S3, elle coûte 5 à 10 fois moins cher que Kafka (et pourrait représenter plus de 80 % du coût d’infrastructure d’un Kafka à grande échelle)
  • Kafka est un excellent logiciel conçu en 2011 pour les data centers, mais il n’est pas adapté aux workloads modernes
    • Économie : par conception, la stratégie de réplication de Kafka engendre d’énormes coûts de bande passante entre AZ
    • Surcharge opérationnelle : faire tourner un cluster Kafka nécessite une équipe dédiée ainsi que des outils personnalisés complexes
  • WarpStream s’exécute directement sur le stockage objet de plusieurs clouds (AWS S3, GCP GCS, Azure Blob Storage)
  • Actuellement en developer preview

4 commentaires

 
xguru 2023-08-09

Voir aussi la version résumée par GN⁺. https://fr.news.hada.io/topic?id=10254

 
pseudojo 2023-08-08

Un outil qui réduit les couches, mais qu’il faut manipuler avec énormément de précautions. Ce type d’outil laisse toujours planer le risque d’une facture exorbitante. (* exception si l’on l’exploite dans son propre datacenter avec MinIO, etc.)

 
ehlegeth 2023-08-08

C’est une tentative intéressante qui exploite l’orientation vers le stockage désagrégé.
Je me demande comment ils ont géré des questions comme le caching.

 
xguru 2023-08-08

Le titre de l’article de blog est certes un peu putassier, mais cela semble être une tentative intéressante comme alternative légère à Kafka.