35 points par xguru 2025-07-04 | 1 commentaires | Partager sur WhatsApp
  • Outil open source qui utilise OpenAI GPT-4o pour générer de façon interactive des jeux de données réalistes et prend en charge en une seule fois l’aperçu, l’export CSV/SQL et l’intégration avec Metabase
  • Constructeur de prompts interactif permettant de configurer intuitivement le type d’activité, le schéma, le nombre de lignes, etc.
  • Prise en charge de l’aperçu en temps réel dans le navigateur
  • Export possible en CSV (fichier unique ou fichier Zip multi-tables) ou en instructions SQL Insert
  • Possibilité de lancer Metabase en un clic pour explorer les données
  • Stack technique : Next.js + Tailwind CSS + ShadCN UI + OpenAI API + Metabase
  • L’API OpenAI (environ $0.05) n’est utilisée que lors de l’aperçu/de la génération des spécifications ; le téléchargement/l’analyse des données est entièrement généré gratuitement en local avec Faker — confidentialité des données et maîtrise des coûts garanties
    • Lors de l’aperçu du jeu de données, OpenAI est utilisé pour générer des spécifications détaillées des données (schéma, règles métier, logique d’événements) pour le type d’activité et les paramètres sélectionnés
    • Toutes les lignes de données réelles sont générées localement avec Faker sur la base des spécifications produites par le LLM
    • Il n’est plus nécessaire d’appeler OpenAI lors du téléchargement ou de l’export des données
  • Options de schéma
    • One Big Table (OBT) : une table unique dénormalisée contenant toutes les colonnes associées
    • Star Schema : plusieurs tables pour l’analyse avancée (faits + dimensions). La structure est déterminée selon les spécifications du LLM, et le générateur produit toutes les tables en local

1 commentaires

 
nicewook 2025-07-04

Cela semble vraiment très utile en situation réelle. On dirait que l'aspect coût a aussi été pris en compte avec beaucoup d'attention.