- Le moyen le plus simple de déplacer et de transformer des données entre des bases de données PostgreSQL
- Streaming en temps réel : diffuse les changements de données quasiment en temps réel à l’aide de la réplication logique de PostgreSQL
- Copie en masse : effectue rapidement la synchronisation initiale des données grâce à une copie en masse parallélisable
- Transformations puissantes : applique des transformations basées sur des expressions régulières, masque les données sensibles et filtre selon les valeurs de colonnes
- Routage flexible : réachemine les données de manière fluide entre les tables, y compris vers des tables portant un autre nom ou vers la même table via un mappage de colonnes personnalisé
- Exemples de règles de transformation
- Masquage d’adresses e-mail : transforme la colonne d’e-mail avec des caractères de masquage.
- Formatage des numéros de téléphone : transforme le format des numéros de téléphone à l’aide d’expressions régulières.
- Routage de tables et mappage de colonnes
- Routage flexible de tables : réachemine une table d’utilisateurs vers une table de clients, en mappant l’ID et le nom d’utilisateur vers l’ID client et le nom du client.
- Routage multi-tables : réachemine une table de commandes vers une table de transactions, en mappant l’ID et le montant total vers l’ID de transaction et le montant.
- Cas d’usage courants
- Réplication de données en temps réel entre des bases PostgreSQL
- Mise en place de pipelines ETL avec transformation des données
- Réacheminement, masquage et filtrage des données
- Exécution de migrations de base de données sans interruption de service
- Event streaming depuis PostgreSQL
- Fonctionnement
- pg_flo exploite le système de réplication logique de PostgreSQL pour capturer et diffuser les changements de données.
- Il utilise NATS comme message broker afin de découpler la lecture du WAL des processus de réplication et des workers, pour plus de flexibilité et de scalabilité.
- Les transformations et le filtrage sont appliqués avant que les données n’atteignent la destination.
1 commentaires
Avis Hacker News
Le projet pg_flo semble très intéressant, en particulier l’archivage vers S3 et la version low-cost de l’outil
Un projet est en cours pour nettoyer les données de la base principale et les archiver vers S3 à l’aide de la réplication logique de PostgreSQL
Quelqu’un étudie les solutions CDC pour Postgres et se demande si pg_flo pourrait aider
En espérant que cela puisse devenir une alternative à Debezium
pglogical peut s’exécuter à l’intérieur de Postgres, mais pg_flo semble être un service externe plutôt qu’une extension
Très impatient d’essayer cet outil
Il se demande en quoi cela diffère de Sequin
Il cherchait un outil similaire, le timing est parfait
Il se demande si utiliser la réplication serait préférable à une sauvegarde vers S3
Très bel outil