- Comparaison de trois modèles à partir du même prompt selon la précision du sujet, la précision du style, la cohérence et l’éthique (Ethics)
Photographie : humains
- À l’heure actuelle, dans le domaine de la photographie, Midjourney est en tête, mais Firefly 2 le suit de très près
- Si vous voulez des portraits moins stylisés et plus naturels, mieux vaut envisager Firefly 2 à l’avenir
- Il vaut mieux ne pas utiliser DALL-E 3 pour des usages photographiques
Photographie : humains stylisés
- Ces derniers temps, on produit beaucoup d’images de personnes stylisées
- Ces prompts ayant été spécialement optimisés pour Midjourney, il peut y avoir un léger biais
- Mais voici quelques points clés :
- Midjourney fonctionne le mieux lorsqu’on lui donne des prompts plus complexes et montre une forte cohérence
- Midjourney excelle dans la génération de combinaisons complexes de médium, de composition et d’éclairage
- DALL-E semble avoir du mal à intégrer l’éclairage pour les personnes racisées, ce qui réduit la précision des résultats
- Firefly génère les résultats les plus variés lorsque la diversité n’est pas explicitement demandée
- Pour remplacer une photographie plus créative, Firefly comme DALL-E 3 peuvent avoir du mal à atteindre le niveau de qualité et de cohérence souhaité
Photographie : objets
- Je pense que Midjourney offre globalement la cohérence d’objets la plus réaliste
- Firefly et DALL-E rattrapent leur retard, mais les préférences stylistiques de ces modèles influenceront sans aucun doute les résultats
Illustration
- En illustration, tous ont beaucoup progressé, mais pour obtenir des résultats nuancés, Midjourney reste le meilleur choix
- Cela dit, il est préférable d’expérimenter avec plusieurs modèles et de les ajuster à votre propre style
Typographie
- La génération de mots exacts n’est devenue possible que récemment
- Parmi tous les tests réalisés, seul DALL-E 3 a fidèlement rendu les mots comme des entités complètes
- Dans ce cas précis, le mot était "design", et la cohérence a été maintenue de façon constante dans toutes les expériences
Conclusion
- Le paysage évolue clairement, mais les points essentiels que je retiens sont les suivants :
- Adobe réduit clairement l’écart dans le domaine de la photo et devient un concurrent sérieux
- DALL-E 3 est le seul générateur capable de produire une typographie de manière raisonnablement bonne (hors Ideogram)
- DALL-E 3 excelle dans la création d’illustrations et, combiné à sa capacité à générer des mots, pourrait devenir à grande échelle un « générateur d’images pour clipart » en termes de style généralisé
- Il convient bien aux images de base ou à la génération d’images dans d’autres activités (via ChatGPT), mais il ne semble pas près de devenir un outil de design hautement sophistiqué
- Midjourney continue de produire les photos les plus réalistes et les plus cohérentes.
- En matière de contrôle créatif, Midjourney reste sans équivalent
2 commentaires
Pourquoi Stable Diffusion a été retiré ?
À cause de Midjourney ?
Quand j’ai essayé DALL-E 3, j’ai trouvé ça vraiment impressionnant qu’il puisse afficher le texte aussi clairement.
Mais pour l’instant, on dirait que Midjourney reste le meilleur en termes de qualité.