19 points par xguru 2023-10-30 | 2 commentaires | Partager sur WhatsApp
  • Comparaison de trois modèles à partir du même prompt selon la précision du sujet, la précision du style, la cohérence et l’éthique (Ethics)

Photographie : humains

  • À l’heure actuelle, dans le domaine de la photographie, Midjourney est en tête, mais Firefly 2 le suit de très près
  • Si vous voulez des portraits moins stylisés et plus naturels, mieux vaut envisager Firefly 2 à l’avenir
  • Il vaut mieux ne pas utiliser DALL-E 3 pour des usages photographiques

Photographie : humains stylisés

  • Ces derniers temps, on produit beaucoup d’images de personnes stylisées
  • Ces prompts ayant été spécialement optimisés pour Midjourney, il peut y avoir un léger biais
  • Mais voici quelques points clés :
    • Midjourney fonctionne le mieux lorsqu’on lui donne des prompts plus complexes et montre une forte cohérence
    • Midjourney excelle dans la génération de combinaisons complexes de médium, de composition et d’éclairage
    • DALL-E semble avoir du mal à intégrer l’éclairage pour les personnes racisées, ce qui réduit la précision des résultats
    • Firefly génère les résultats les plus variés lorsque la diversité n’est pas explicitement demandée
    • Pour remplacer une photographie plus créative, Firefly comme DALL-E 3 peuvent avoir du mal à atteindre le niveau de qualité et de cohérence souhaité

Photographie : objets

  • Je pense que Midjourney offre globalement la cohérence d’objets la plus réaliste
  • Firefly et DALL-E rattrapent leur retard, mais les préférences stylistiques de ces modèles influenceront sans aucun doute les résultats

Illustration

  • En illustration, tous ont beaucoup progressé, mais pour obtenir des résultats nuancés, Midjourney reste le meilleur choix
  • Cela dit, il est préférable d’expérimenter avec plusieurs modèles et de les ajuster à votre propre style

Typographie

  • La génération de mots exacts n’est devenue possible que récemment
  • Parmi tous les tests réalisés, seul DALL-E 3 a fidèlement rendu les mots comme des entités complètes
  • Dans ce cas précis, le mot était "design", et la cohérence a été maintenue de façon constante dans toutes les expériences

Conclusion

  • Le paysage évolue clairement, mais les points essentiels que je retiens sont les suivants :
  • Adobe réduit clairement l’écart dans le domaine de la photo et devient un concurrent sérieux
  • DALL-E 3 est le seul générateur capable de produire une typographie de manière raisonnablement bonne (hors Ideogram)
    • DALL-E 3 excelle dans la création d’illustrations et, combiné à sa capacité à générer des mots, pourrait devenir à grande échelle un « générateur d’images pour clipart » en termes de style généralisé
    • Il convient bien aux images de base ou à la génération d’images dans d’autres activités (via ChatGPT), mais il ne semble pas près de devenir un outil de design hautement sophistiqué
  • Midjourney continue de produire les photos les plus réalistes et les plus cohérentes.
    • En matière de contrôle créatif, Midjourney reste sans équivalent

2 commentaires

 
hhkkkk 2023-10-30

Pourquoi Stable Diffusion a été retiré ?
À cause de Midjourney ?

 
kuroneko 2023-10-30

Quand j’ai essayé DALL-E 3, j’ai trouvé ça vraiment impressionnant qu’il puisse afficher le texte aussi clairement.
Mais pour l’instant, on dirait que Midjourney reste le meilleur en termes de qualité.