- Un jeu d’aventure dans le style de Sierra et LucasArts des années 1990
- Si on demande directement à DALL-E de dessiner du pixel art, le résultat n’est pas bon
- La pixellisation et le dithering ont été réalisés avec ImageMagick
- Après plusieurs essais, une formule de style permettant d’obtenir des images adaptées a été trouvée
→ " in the style of a high quality, atmospheric high renaissance oil on canvas painting"
- Ce qui a été fait pour ajuster la perspective et représenter l’endroit souhaité
- Préciser l’époque, l’heure et l’éclairage : "on a sunny day in the 2000s"
- Donner une description concrète du lieu dans son ensemble ("town", "city" ou un lieu connu)
- Indiquer la zone à mettre en avant ("facade", "hotel entrance") ainsi que les bâtiments alentour : "houses", "streets", "plains"
- Il est possible de demander explicitement un espace vide : "…and street in front", "plaza surrounded by…"
- Il faut demander à laisser de l’espace libre, sinon DALL-E remplit quelque chose
- Il est possible de préciser la position de la caméra : "seen from second-floor balcony"
- Ne jamais inclure "video game". Sinon, tout se retrouve rempli de lumières néon bleues
- Comme DALL-E produit des images en 1024x1024, il faut les adapter à un format d’environ 19:10 pour les écrans actuels
- Couper l’image en deux puis rendre transparentes les zones vides de chaque côté,
- la recharger dans DALL-E et lui demander de générer le reste avec le même prompt
- il est aussi possible de modifier le prompt pour lui faire ajouter d’autres éléments
- En calculant avec la structure tarifaire actuelle de DALL-E
- Un jeu réussi comporte environ 70 scènes, mais en supposant qu’il en ait 50
- Pour obtenir une image satisfaisante d’un lieu, il faut en générer environ 200. Pour 50 lieux, cela fait 10 000 images au total
- En supposant qu’il en faille deux fois plus pour les retouches et l’extension horizontale, il faut générer 20 000 images
- 20,000 * $0.0543 = environ $1,087, donc en considérant qu’on réussit parfois un peu plus vite, cela revient à environ $1000
- Avec 6 secondes par génération, 120000 secondes = 33 heures
2 commentaires
C'est un aparté, mais ImageMagick est vraiment le meilleur...
Franchement, c'est impressionnant !