- Sora est un modèle d’IA qui crée des scènes réalistes et imaginatives à partir d’instructions textuelles
- Il peut générer des vidéos d’une durée maximale d’une minute tout en restant fidèle au prompt de l’utilisateur et en conservant une qualité visuelle élevée
- Présentation d’exemples de vidéos générées à partir de divers prompts fournissant des scénarios détaillés
- Toutes les vidéos de cette page ont été produites directement par Sora, sans aucune modification
- Sora est actuellement mis à disposition d’équipes de red team pour l’évaluation des risques, et OpenAI recueille également les retours d’artistes visuels, de designers et de réalisateurs
- OpenAI souhaite partager l’avancement de ses recherches afin de recueillir des retours externes et de montrer au public l’avenir des capacités de l’IA
Capacités de Sora
- Il peut générer des scènes complexes avec plusieurs personnages, des mouvements spécifiques et des détails précis du sujet et de l’arrière-plan
- Il comprend non seulement le prompt de l’utilisateur, mais aussi la manière dont les éléments existent dans le monde physique
Sécurité de Sora
- OpenAI prévoit de mettre en place plusieurs mesures de sécurité avant d’intégrer Sora à ses produits
- Cela inclut le développement d’outils pour détecter les contenus trompeurs, ainsi que d’un classificateur capable de déterminer si une vidéo a été générée par Sora
Technologie de recherche
- Sora est un modèle de diffusion qui génère des vidéos en partant d’une vidéo très bruitée, puis en supprimant progressivement le bruit
- Il utilise une architecture Transformer similaire aux modèles GPT, offrant d’excellentes performances de montée en échelle
Avis de GN⁺
- Sora est une technologie d’IA innovante qui génère des vidéos à partir d’instructions textuelles et ouvre de nouvelles possibilités aux professionnels de la création
- Grâce aux mesures de sécurité et aux retours recueillis, il peut apprendre l’usage dans le monde réel et jouer un rôle important dans l’amélioration progressive de la sûreté des systèmes d’IA
- Cette technologie semble constituer une étape importante vers la réalisation future de l’AGI (intelligence artificielle générale)
6 commentaires
On ne peut vraiment qu’être admiratif.
Ils vont réussir à lever 7 billions ?
À première vue, on ne sait pas vraiment distinguer s’il s’agit d’une vraie vidéo ou d’une vidéo générée par une IA.
Waouh… j’ai hâte de l’essayer.
Un modèle de diffusion, ça veut dire que c’est le même principe que Stable Diffusion, non ?
Le marché des photos de stock et des vidéos de stock risque d'avoir la vie dure...
La qualité de génération est impressionnante. Les progrès sont-ils vraiment aussi rapides ?
Avis Hacker News