Deep Live Cam - outil de remplacement de visage en temps réel et de deepfake vidéo en un clic

(deeplive.cam)

30 points par GN⁺ 2024-08-11 | 4 commentaires | Partager sur WhatsApp

Prend en charge le remplacement de visage en temps réel en un clic à partir d’une seule image grâce à une technologie d’IA de pointe (vidéo deepfake)
Multi-plateforme : prise en charge de CPU, NVIDIA CUDA, Apple Silicon (M1/M2)
Une fonction de vérification intégrée empêche le traitement de contenus inappropriés et garantit une utilisation légale et éthique
Open source en Python
Étapes d’utilisation
1. Configurer l’environnement nécessaire (python, pip, ffmpeg)
2. Cloner le dépôt GitHub
3. Télécharger les modèles requis (GFPGANv1.4, inswapper_128_fp16.onnx)
4. Installer les dépendances (avec venv : CUDA, CoreML, DirectML, OpenVINO)
5. Exécuter le programme
6. Sélectionner l’image source et la cible
7. Lancer le traitement de remplacement de visage

Principales fonctionnalités de Deep Live Cam

Remplacement de visage en temps réel : permet de remplacer un visage en temps réel à partir d’une seule image, avec aperçu immédiat
Deepfake vidéo en un clic : permet de créer rapidement et facilement des vidéos deepfake de haute qualité avec une manipulation simple
Prise en charge multi-plateforme : peut fonctionner sur différentes configurations matérielles, notamment CPU, NVIDIA CUDA et Apple Silicon
Garde-fous pour un usage éthique : une fonction de contrôle intégrée empêche le traitement de contenus inappropriés et garantit une utilisation conforme à la loi et à l’éthique
Performances optimisées : s’appuie sur des algorithmes optimisés, avec une nette amélioration de la vitesse de traitement, en particulier sur les GPU NVIDIA compatibles CUDA

Résumé de GN⁺

Deep Live Cam est un outil d’IA de pointe pour le remplacement de visage en temps réel et le deepfake vidéo, capable de fonctionner sur diverses plateformes
Des garde-fous garantissant un usage éthique sont intégrés, et le projet bénéficie d’un soutien continu de la communauté open source
Cet outil est utile pour les projets créatifs et la production vidéo, en particulier lorsqu’il faut obtenir rapidement des résultats visuels de haute qualité
Parmi les autres projets offrant des fonctionnalités similaires, on trouve DeepFaceLab et FaceSwap

4 commentaires

dongwon 2024-08-13

Je l’ai testé moi-même ; ce n’est pas au point d’être totalement indiscernable, mais je me suis quand même dit : c’est possible à ce point-là avec une seule vraie image...? J’ai l’impression que les personnes âgées pourraient vraiment se faire avoir, et on vit dans un monde où on ne sait plus quoi croire.

xguru 2024-08-12

Pour quelque chose fait à partir d'une seule image, le résultat est excellent. On dirait qu’on ne pourra bientôt plus vraiment faire confiance aux vidéos.

GN⁺ 2024-08-11

Avis de Hacker News

Des « garde-fous d’usage éthique » empêcheraient le traitement de contenus inappropriés
- Il existe des exemples d’imitation de célébrités et de personnalités politiques, y compris JD Vance
- La définition d’un deepfake « éthique » reste floue
- Parmi toutes les choses qu’on peut créer avec l’IA, on se demande pourquoi avoir choisi celle-ci
La qualité est techniquement stupéfiante
- Désormais, presque n’importe quel script kiddie peut faire du deepfake de visage en temps réel lors d’un appel vidéo
- On ne peut plus vraiment faire confiance à ce qu’on voit à l’œil nu pendant un appel vidéo
- Nous vivons une époque intéressante
Ce projet s’appuie sur « GFPGAN v1.4 » et « FaceSwap Extension - Automatic 1111 - Proof of Concept »
- Le projet GFPGAN est fondé sur l’article de Wang et al., « GFP-GAN: Towards Real-World Blind Face Restoration with Generative Facial Prior »
Ce projet semble être un fork de roop, désormais abandonné, avec surtout des améliorations de l’interface utilisateur
- L’un des principaux développeurs de roop travaille sur facefusion, qui prend en charge le remplacement de visage sur webcam en temps réel
C’est techniquement impressionnant, mais il est difficile de trouver un bon cas d’usage qui ne soit pas lié à la propagande ou à l’escroquerie
- Le site web non plus ne présente pas de cas d’usage clair
En y ajoutant l’amélioration vocale, cela pourrait vider le compte bancaire de tous les grands-mères et grands-pères
- Il faut tirer la sonnette d’alarme dès maintenant
On peut se demander s’il existe un cas d’usage légitime pour cette technologie
- On se demande quels personas ou quels marchés verticaux étaient visés lors de la conception du produit
« Une fonction de vérification intégrée empêche le traitement de contenus inappropriés afin de garantir une utilisation légale et éthique »
- Les ingénieurs logiciels espèrent qu’un pistolet ne sautera pas de la table pour tirer sur quelqu’un
Nous sommes arrivés à un point où il faut seulement faire confiance aux contenus multimédias recoupés avec des sources fiables
- On se demande s’il serait possible que les caméras ajoutent une signature numérique pour indiquer qu’une vidéo ou une photo est authentique
- Un marquage des photos/vidéos non générées par l’IA semble plus réaliste qu’un marquage des photos/vidéos générées par l’IA
Le moment choisi pour lancer cet outil semble extrêmement malvenu
- Il pourrait perturber l’élection américaine cette année
- Rien que son impact potentiel sur les élections est déjà préoccupant
- Cela peut entraîner de nombreux problèmes : pédopornographie, terrorisme, déstabilisation des gouvernements, guerre civile ou mondiale, etc.

cosine20 2024-08-13

« Les ingénieurs logiciels espèrent juste qu’un pistolet ne saute pas de la table pour tirer sur quelqu’un » lol