2 points par kiyeonjeon21 20 일 전 | Aucun commentaire pour le moment. | Partager sur WhatsApp

Bonjour.

En ce moment, j’expérimente jusqu’où il est possible d’aller sur des tâches vidéo avec des agents de code comme Codex / Claude Code / Cursor, et je développe une CLI appelée VibeFrame.

J’ai eu l’impression que la plupart des outils vidéo existants gardent leur état dans l’UI, ce qui les rend difficiles à manipuler pour des agents. Je l’oriente donc vers une approche où un projet vidéo peut être traité autant que possible comme un projet de code.

Le flux de base ressemble à ceci.

  • STORYBOARD.md: scènes, narration, timing, indications de génération d’images/vidéo
  • DESIGN.md: ton, mise en page, typographie, direction du motion
  • vibe build: génération des assets + composition des scènes
  • vibe render: rendu MP4
  • vibe inspect: inspection du résultat du rendu

En pratique, cela s’utilise comme ceci.

curl -fsSL https://vibeframe.ai/install.sh | bash  
vibe setup --scope project  
vibe init launch --from brief.md  
  
# Après avoir demandé à Codex / Claude Code / Cursor, etc.  
# de mettre à jour STORYBOARD.md et DESIGN.md à partir des recherches  
  
vibe build launch --dry-run  
vibe build launch  
vibe render launch  
vibe inspect render launch --cheap  

La partie composition des scènes a été fortement influencée par les idées de Hyperframes. L’approche consiste à considérer les scènes vidéo comme une composition HTML/CSS/JS sur une timeline, puis à les capturer de manière déterministe dans le navigateur pour les rendre en MP4.

VibeFrame se rapproche davantage d’une couche projet, posée au-dessus, que les agents de code peuvent manipuler facilement. En prenant STORYBOARD.md / DESIGN.md comme source of truth, j’y ai ajouté des workflows agentiques comme la génération multi-provider d’images/vidéos/narration/musique, l’edit/remix basé sur FFmpeg, la sortie JSON, le dry-run, la configuration scoped au projet et les rapports d’inspection.

Dans cette démo, après seulement vibe setup --scope project puis vibe init launch, j’ai enregistré le processus où l’on demande à un agent de code de rechercher un sujet et de mettre à jour STORYBOARD.md / DESIGN.md, puis de construire le MP4 final, y compris avec les indications de génération d’images.

Vidéo du processus complet :
https://t.co/YD0SYyODcQ

C’est encore très tôt, donc je serais particulièrement preneur de retours sur les points ci-dessous.

  • Est-ce qu’utiliser STORYBOARD.md + DESIGN.md comme interface agent pour le travail vidéo vous paraît naturel ?
  • La distinction entre les trois lanes de workflow build / generate / edit-remix est-elle facile à comprendre ?
  • Est-ce que la surface de la CLI semble trop large, ou au contraire manque-t-il des fonctionnalités ?

C’est une tentative de faire passer le montage vidéo d’un GUI à une CLI agentique, et j’aimerais beaucoup avoir l’avis de personnes qui ont rencontré des problèmes similaires.

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.