- Stable Diffusion 3 est présenté comme le meilleur modèle texte-image, avec des améliorations significatives en matière de prompts multi-thématiques, de qualité d’image et de capacité d’orthographe
- Bien qu’il ne soit pas encore largement disponible, les inscriptions à la liste d’attente de l’early preview ont commencé
- Cette étape de préversion est importante, comme pour les modèles précédents, pour obtenir des insights qui permettront d’améliorer les performances et la sécurité
Portée des modèles et technologie
- La suite Stable Diffusion 3 couvre une plage de 800M à 8B de paramètres
- Cette approche est en phase avec nos valeurs fondamentales et vise à permettre à chacun d’y accéder, en proposant une gamme d’options variées en termes d’échelle et de qualité qui correspondent au mieux aux besoins créatifs des utilisateurs
- SD3 combine l’architecture Diffusion Transformer avec le Flow Matching
- Un rapport technique détaillé sera publié prochainement
Pratiques d’une IA sûre et responsable
- L’importance de mettre en pratique une IA sûre et responsable est fondamentale
- Des mesures appropriées sont prises pour prévenir les abus de Stable Diffusion 3, et elles sont maintenues tout au long du cycle, de l’entraînement initial au test, à l’évaluation et au déploiement du modèle
- De nombreux garde-fous de sécurité ont été mis en place en préparant cette préversion initiale
- Nous espérons améliorer encore davantage le modèle en collaborant en permanence avec des chercheurs, des experts et la communauté à mesure que l’on se rapproche de son ouverture au public
Engagement et stimulation de la créativité
- L’engagement de faire de l’IA générative une technologie ouverte, sûre et accessible à tous est ferme
- Grâce à Stable Diffusion 3, des solutions adaptables seront proposées pour permettre aux particuliers, aux développeurs et aux entreprises d’exprimer leur créativité
- Si vous souhaitez utiliser commercialement un autre modèle d’image avant le lancement de Stable Diffusion 3, vous pouvez consulter la page d’adhésion de Stability AI ou accéder à l’API via la plateforme développeur
1 commentaires
Commentaires Hacker News
Utilise un nouveau type de diffusion transformer en combinant le flow matching et d'autres améliorations.
La focalisation sur la sécurité ressemble à une occasion marketing ratée si l'on considère l'incident récent autour de Gemini.
Étant donné le niveau actuel de censure, il sera intéressant de voir ce que signifie ici « sécurité ».
La moitié du message de lancement est du type « Nous sommes vraiment responsables et sûrs ».
Les images de la démo sont toutes de l'« artwork ».
La partie texte/orthographe est une grande avancée.
Ils réécrivent la section « sécurité » en la remplaçant par un couteau imaginaire nommé « Big Knife » au lieu d'un outil d'IA.