9 points par xguru 2023-07-28 | 2 commentaires | Partager sur WhatsApp
  • Le modèle Text-to-Image le plus avancé
    • Plus vivant que la version précédente, avec des couleurs plus précises et un meilleur rendu du contraste, des ombres et de l’éclairage
    • 3,5 milliards de paramètres
  • Peut générer en quelques secondes des images en résolution de 1 mégapixel
  • Personnalisable et peut être affiné pour des concepts et des styles spécifiques
  • La génération de texte a également été améliorée, avec une génération de texte avancée et une meilleure lisibilité
  • Prend en charge l’inpainting, l’outpainting et les prompts image-to-image

2 commentaires

 
ninebow 2023-07-28

J’ai utilisé GPT-4 pour générer automatiquement une explication détaillée de l’annonce officielle.


Annonce de SDXL 1.0 (ANNOUNCING SDXL 1.0)

Introduction

L’équipe de Stability AI est fière de lancer SDXL 1.0 en tant que modèle ouvert, représentant la prochaine étape de l’évolution des modèles de génération d’images à partir de texte. Après la sortie limitée de SDXL 0.9, réservée à la recherche, la version complète de SDXL a été améliorée pour devenir le meilleur modèle ouvert de génération d’images au monde.

Résumé

  • SDXL 1.0 est le principal modèle d’image de Stability AI, ainsi que le meilleur modèle ouvert pour la génération d’images. Nous l’avons comparé à divers autres modèles, et nous avons conclu que les utilisateurs préfèrent les images générées par SDXL 1.0 à celles produites par d’autres modèles ouverts. Ces résultats proviennent de plusieurs semaines de données de préférence recueillies sur notre Discord à partir de générations de modèles expérimentaux, ainsi que de tests externes.

  • SDXL génère des images de haute qualité dans pratiquement tous les styles artistiques, et constitue le meilleur modèle ouvert pour le photoréalisme. Il est possible de solliciter des images originales sans imposer au modèle une « patte » particulière, garantissant une liberté de style totale. SDXL 1.0 est particulièrement bien calibré pour offrir des couleurs nettes et précises, avec un meilleur contraste, un meilleur éclairage et de meilleures ombres que son prédécesseur. En outre, SDXL peut générer des concepts que les modèles d’image ont du mal à rendre, comme les mains et le texte, ou encore des compositions organisées dans l’espace (par exemple, une femme poursuivant un chien à l’arrière-plan).

  • SDXL ne nécessite que quelques mots pour produire des images complexes, détaillées et esthétiquement satisfaisantes. Les utilisateurs n’ont plus besoin d’ajouter des qualificatifs comme « chef-d’œuvre » pour obtenir des images de haute qualité. De plus, SDXL peut faire la distinction entre des concepts comme « The Red Square » (le lieu célèbre) et « red square » (la forme).

  • SDXL 1.0 dispose du plus grand nombre de paramètres parmi les modèles d’image en open access, et repose sur une nouvelle architecture innovante composée d’un modèle de base de 3.5B paramètres et d’un refiner de 6.6B paramètres. L’ensemble du modèle est constitué d’un pipeline Mixture of Experts appliqué à la diffusion latente : dans une première étape, le modèle de base génère des latents (bruités), qui sont ensuite davantage traités par un modèle d’affinage spécialisé dans l’étape finale de débruitage. À noter que le modèle de base peut également être utilisé comme module indépendant. Cette architecture en deux étapes offre une approche robuste de la génération d’images et permet d’obtenir des résultats encore meilleurs.

Références

Stability AI Blog : Le blog de Stability AI fournit des informations détaillées sur les dernières recherches et annonces de l’entreprise. Vous pouvez y trouver davantage d’informations sur les modèles récents comme SDXL 1.0.
https://stability.ai/blog

Stable Diffusion : Ce site web fournit des informations détaillées sur la technologie Stable Diffusion de Stability AI. Cette technologie est un composant central de SDXL 1.0, et ce site permet d’en acquérir une compréhension approfondie.
https://stability.ai/stable-diffusion

Discord Community : Cette communauté Discord réunit les chercheurs et les utilisateurs de Stability AI pour partager et discuter de leurs travaux. Elle permet de découvrir les retours d’expérience d’autres personnes utilisant des modèles comme SDXL 1.0.
https://discord.gg/stablediffusion

 
ninebow 2023-07-28