-
PabloNet
-
Je pense que le débat sur la capacité d’une IA connectée à Internet à être créative passe à côté de la question essentielle. L’art révèle le monde intérieur, et la technologie n’en est qu’une partie. Il est regrettable que l’art exige autant de technique. Il semble possible de séparer ces deux éléments. Une créativité interpolative bon marché, utilisée par 8 milliards de non-artistes, pourrait révéler une nouvelle vision du monde.
-
Pour cette raison, moi qui ne suis pas doué pour l’art, je m’intéresse énormément aux différentes formes d’art basées sur l’IA. Il y a quelques mois, j’ai commencé à utiliser StreamDiffusion pour diffuser en temps réel un flux de webcam. Mon but est de produire de beaux effets visuels et de susciter de nouvelles émotions. Mais le format ordinateur portable brise l’illusion. J’ai donc récemment fabriqué un cadre LCD pouvant être accroché au mur, afin de réduire au minimum les éléments qui cassent cette illusion. Le principal avantage de cette configuration est qu’elle ouvre un nouveau canal d’interaction en tant qu’objet permanent, et non comme un simple écran.
-
Le principal problème de la configuration actuelle est le faible nombre d’images par seconde. J’ai accéléré le système avec TensorRT et la compression d’image, mais il reste encore beaucoup de marge d’amélioration.
-
Pour les personnes intéressées, je partage comment le fabriquer et y contribuer :
- code client et serveur fournis
- hébergement du serveur sur RunPod
- client exécuté sur Raspberry Pi 5
- utilisation d’un écran Pi de 10,1 pouces
- utilisation d’un éclairage infrarouge
- utilisation d’un cadre standard
- utilisation d’une caméra Pi infrarouge
- utilisation d’un emporte-pièce pour percer le trou de la caméra (
une perceuse ne fonctionne pas) - expérimentations avec différents filtres de prétraitement, car un simple prompt ne suffit pas.
img2imgparaît trop réaliste sans prétraitement. Pour obtenir le style Picasso bleu visible dans ce billet, j’ai combiné détection de contours Canny, teinte bleue et flou.
Résumé de GN⁺
- L’art basé sur l’IA montre qu’il est possible d’offrir une nouvelle perspective en séparant technologie et créativité.
- La diffusion en temps réel d’un flux de webcam avec StreamDiffusion apporte de nouvelles émotions et expériences visuelles.
- L’installation utilisant un cadre LCD ouvre la possibilité d’une œuvre d’art permanente, au-delà d’un simple écran.
- Des problèmes techniques comme le faible nombre d’images par seconde laissent encore une marge d’amélioration.
- Parmi les projets aux fonctionnalités similaires, DeepArt.io et RunwayML sont recommandés.
1 commentaires
Avis Hacker News
Encoder des octets JPEG en Base64 augmente la taille du payload d’environ 30 % et consomme des cycles CPU côté client et serveur. Le protocole WebSocket peut transmettre des payloads binaires, donc il n’est pas nécessaire de les convertir en texte
L’art consiste à révéler le monde intérieur, et la technique n’en est qu’une partie. L’idée que le manque de maîtrise technique ne soit qu’un simple désagrément est remise en question
Sans même parler de valeur artistique, il y a un aspect intéressant pour les collectionneurs d’outils
Ce serait plus cool si la caméra se trouvait ailleurs que dans le cadre. Regarder un miroir artistique est un peu monotone
L’art a toujours été perçu comme quelque chose qui conserve et crée des émotions. Une banane sur un mur est aussi de l’art, et la pop reste de l’art
Quelqu’un demande si un effet de transformation à haute fréquence d’images entre les images a déjà été envisagé. Cela augmenterait la fréquence d’images effective et aurait un rendu sympa
Le principal problème de la configuration actuelle est la faible fréquence d’images. C’est vu comme une fonctionnalité, et avoir le temps de traiter l’image n’est pas forcément une mauvaise chose
Prix du miroir le plus énergivore. Il a été constaté que la peinture n’est pas stable face à de petites variations de l’entrée
Quelqu’un demande s’il existe un moyen de figer certaines images. Certaines vaudraient la peine d’être conservées (par exemple comme photo de profil ou écran de verrouillage)