- « DALL-E for Video » : Meta AI tente récemment le text-to-video en s’appuyant sur les avancées récentes du text-to-image
- Comprend à quoi ressemble le monde à partir d’images annotées, et apprend comment les objets bougent grâce à des vidéos non annotées
- Ce qu’il est possible de faire
- Générer des vidéos à partir de texte
- Ajouter du mouvement à une image statique
- Ajouter un mouvement intermédiaire entre deux images
- Créer des variantes à partir d’une vidéo existante
- Une compréhension des entrées textuelles 3 fois meilleure et une qualité 3 fois supérieure par rapport à l’existant
Aucun commentaire pour le moment.