- Conçu avec pour objectif de réduire la complexité et les coûts lors du développement d’applications en temps réel
- Récupère des données de flux, exécute des requêtes continues en SQL et met à jour dynamiquement les résultats
- Requêtes et transformations
- Création de vues matérialisées
- Lit les données depuis Kafka/Pulsar/Kinesis/Redpanda ainsi que des sources CDC
- Prise en charge de PostgreSQL/MySQL CDC (Change Data Capture)
- Les données sont stockées sur S3 et des stockages objet compatibles S3 afin de réduire les coûts
- Utilise un SQL compatible PostgreSQL
4 commentaires
Ce n’est pas une question directement liée, mais quelle serait une bonne façon de mettre en place du CDC sur un système bare metal de petite taille, pas à grande échelle ?
Il y a souvent Kafka comme base, mais Kafka en lui-même est déjà franchement excessif dans ce cas…
https://github.com/debezium/debezium Ce genre de chose, non ? (Je n’en connais que le nom, je ne l’ai pas encore utilisé moi-même… )
Debezium semble surtout être le plus connu pour le CDC open source de PostgreSQL, mais c’est basé sur Kafka ^^
C’est un peu comme ksqlDB ou Materialize, non ?