6 points par arxivgpt 2024-09-06 | 1 commentaires | Partager sur WhatsApp

Perdre un être cher laisse à chacun un immense sentiment de vide et une tristesse poignante.

C’est d’autant plus vrai quand cet être est parti pour un voyage sans retour.

C’était il y a seulement quelques jours.

« Eric », notre chat de compagnie et membre de la famille depuis plus de dix ans, surnommé « Eric Go », nous a quittés de façon aussi soudaine qu’inimaginable, sans même nous laisser le temps de nous y préparer.

Pour ma famille et moi, plongés dans le chagrin, j’ai voulu trouver un moyen de faire vivre le souvenir d’« Eric » et de recréer cette sensation concrète qu’il est toujours à nos côtés. C’est dans cette idée, pour qu’« Eric » puisse rester avec notre famille pour toujours, que j’ai décidé d’utiliser l’IA.

Comme première étape, j’ai choisi d’utiliser des photos d’« Eric ».

Mon objectif initial était que chacun dans la famille puisse retrouver « Eric » en photo et en vidéo chaque fois qu’il lui manque.

Autrement dit, j’ai d’abord fait apprendre à l’IA à partir de photos prises de son vivant.

Ensuite, lorsque nous voulons revoir « Eric », il suffit d’entrer une requête textuelle ou vocale à l’IA. Par exemple : « Montre-moi un chat (avec exactement l’apparence qu’avait “Eric” de son vivant) sur une plage à Hawaï, portant des lunettes de soleil et des fleurs, avec une expression heureuse, en montrant un message sur lequel est écrit “Papa, je t’aime”. »

Peu après, l’IA génère alors une image ou une vidéo d’« Eric », fidèle à son apparence de son vivant, selon le contenu que je souhaite, et me l’affiche.

Pour cela, j’ai mis en place plusieurs procédures, préparatifs (développement) et stratégies.

À noter que, disposant de solides compétences de développement spécialisées en IA ainsi que de plusieurs GPU NVIDIA H100, c’était un défi et une expérimentation tout à fait réalisables pour moi.

  1. J’ai d’abord sélectionné environ 45 photos d’« Eric ».

  2. Afin d’améliorer la qualité de l’entraînement, j’ai développé un processus automatisé de prétraitement et je l’ai appliqué.

L’objectif était de rendre l’« objet » plus net et plus distinct, tout en augmentant l’efficacité de l’apprentissage supervisé pour l’IA.

L’une de ces étapes consistait à extraire automatiquement uniquement l’« objet » (le chat) depuis la « photo originale » (qui contient l’arrière-plan), puis à effectuer un prétraitement comme l’upscaling.

  1. Une fois le prétraitement terminé, j’ai entraîné les 45 photos selon la méthode LoRA.

L’entraînement a été effectué avec les paramètres par défaut et a pris environ deux heures sur un GPU A100.

  1. L’entraînement s’est déroulé, et une fois terminé, un « modèle » dédié à « Eric » a été publié sur Hugging Face.

  2. J’ai ensuite préparé la génération d’images avec la meilleure qualité possible en connectant le modèle entraîné au modèle FLUX.

J’ai codé la possibilité de saisir des prompts en coréen dans le modèle FLUX de base, et j’ai enfin pu vérifier le résultat de l’entraînement.

Le résultat était étonnamment identique à son apparence de son vivant.

Voir toute la famille émerveillée, impressionnée et heureuse devant ce résultat m’a rempli de satisfaction.

Et j’espère qu’en rendant public le récit de ce processus, cela pourra rester comme une ressource utile pour quelqu’un d’autre.

Si vous souhaitez faire la même chose avec votre chat ou votre chien de compagnie, n’hésitez pas à m’envoyer un message : je serai heureux de vous aider.

1 commentaires

 
arxivgpt 2024-09-06

Plus de détails et d’images sont disponibles sur Brunch.
Référence : https://brunch.co.kr/@seawolf/16