DreamFusion : Text-to-3D à l’aide de la diffusion 2D

xguru · 2022-10-05T10:04:01+09:00

La synthèse texte-image existante est rendue possible par des modèles de diffusion entraînés sur des dizaines de milliards de paires image-texte Pour appliquer cette approche à la 3D, il faudrait un vaste jeu de données 3D annoté ainsi qu’une architecture de débruitage, mais cela n’existe pas La synthèse Text-to-3D est donc réalisée en exploitant un modèle de diffusion 2D Text-to-Image préentraîné Le modèle 3D généré à partir du texte peut être visualisé sous tous les angles, avec un éclairage modifiable ou intégré dans d’autres environnements 3D

(dreamfusion3d.github.io)

11 points par xguru 2022-10-05 | Aucun commentaire pour le moment. | Partager sur WhatsApp

La synthèse texte-image existante est rendue possible par des modèles de diffusion entraînés sur des dizaines de milliards de paires image-texte
Pour appliquer cette approche à la 3D, il faudrait un vaste jeu de données 3D annoté ainsi qu’une architecture de débruitage, mais cela n’existe pas
La synthèse Text-to-3D est donc réalisée en exploitant un modèle de diffusion 2D Text-to-Image préentraîné
Le modèle 3D généré à partir du texte peut être visualisé sous tous les angles, avec un éclairage modifiable ou intégré dans d’autres environnements 3D

DreamFusion : Text-to-3D à l’aide de la diffusion 2D

À lire aussi

Aucun commentaire pour le moment.