- Outil open source qui utilise OpenAI GPT-4o pour générer de façon interactive des jeux de données réalistes et prend en charge en une seule fois l’aperçu, l’export CSV/SQL et l’intégration avec Metabase
- Constructeur de prompts interactif permettant de configurer intuitivement le type d’activité, le schéma, le nombre de lignes, etc.
- Prise en charge de l’aperçu en temps réel dans le navigateur
- Export possible en CSV (fichier unique ou fichier Zip multi-tables) ou en instructions SQL Insert
- Possibilité de lancer Metabase en un clic pour explorer les données
- Stack technique : Next.js + Tailwind CSS + ShadCN UI + OpenAI API + Metabase
- L’API OpenAI (environ $0.05) n’est utilisée que lors de l’aperçu/de la génération des spécifications ; le téléchargement/l’analyse des données est entièrement généré gratuitement en local avec Faker — confidentialité des données et maîtrise des coûts garanties
- Lors de l’aperçu du jeu de données, OpenAI est utilisé pour générer des spécifications détaillées des données (schéma, règles métier, logique d’événements) pour le type d’activité et les paramètres sélectionnés
- Toutes les lignes de données réelles sont générées localement avec Faker sur la base des spécifications produites par le LLM
- Il n’est plus nécessaire d’appeler OpenAI lors du téléchargement ou de l’export des données
- Options de schéma
- One Big Table (OBT) : une table unique dénormalisée contenant toutes les colonnes associées
- Star Schema : plusieurs tables pour l’analyse avancée (faits + dimensions). La structure est déterminée selon les spécifications du LLM, et le générateur produit toutes les tables en local
1 commentaires
Cela semble vraiment très utile en situation réelle. On dirait que l'aspect coût a aussi été pris en compte avec beaucoup d'attention.