YouTube modifie des vidéos avec l’IA sans l’accord des créateurs et ajoute des résumés pouvant induire en erreur
(ynetnews.com)- YouTube a appliqué des technologies de correction vidéo basées sur l’IA à certaines vidéos de chaînes populaires sans prévenir ni les créateurs ni les spectateurs.
- Les créateurs YouTube de musique Rick Beato et Rhett Shull ont fait part de légères différences dans l’apparence de la peau, des cheveux et des plis des vêtements de leurs vidéos.
- YouTube a expliqué qu’il s’agissait d’une expérience limitée à certains Shorts, consistant à améliorer la netteté et le bruit vidéo grâce à un apprentissage automatique traditionnel.
- Les experts ont toutefois critiqué l’évitement terminologique et le manque de transparence, en notant que le machine learning relève de l’IA, et ont souligné les risques pour la fiabilité des contenus.
- Cet épisode, où le contenu est modifié sans le consentement du créateur, est vu comme révélateur d’enjeux de véracité et de confiance dans les médias numériques.
Expérience confidentielle de correction vidéo de YouTube par IA
- YouTube a appliqué en secret une technologie d’amélioration vidéo basée sur l’IA à certaines vidéos de créateurs populaires.
- Les éléments visuels ont été modifiés sans préavis pour les créateurs ou les spectateurs.
- Rick Beato et Rhett Shull ont constaté des changements de la texture de la peau, des cheveux, des plis des vêtements et de la forme des oreilles.
- Beato a déclaré que les cheveux lui semblaient étranges, comme si un maquillage avait été ajouté.
- Shull a précisé que cela paraissait généré par l’IA et a noté que la confiance avec les spectateurs pouvait être mise en péril.
Confirmation de l’expérience et clarification de YouTube
- YouTube a reconnu qu’il mène une petite expérience sur certains Shorts.
- Rene Ritchie, créateur relationnel (Creator Liaison), a expliqué via X (anciennement Twitter) qu’il s’agissait d’une expérience visant à améliorer la netteté des vidéos et à réduire le bruit visuel grâce à un apprentissage automatique traditionnel.
- YouTube a affirmé que cela équivalait au niveau des fonctions de correction automatique des smartphones.
- Toutefois, le professeur Samuel Woolley de l’Université du Pittsburgh a critiqué cette explication, estimant que le machine learning est une sous-catégorie de l’IA et que la communication de YouTube est trompeuse.
Diffusion de la prétraitement par l’IA et problème de confiance
- Les experts considèrent ce cas comme faisant partie d’une tendance plus large de prétraitement des contenus par l’IA.
- Samsung utilise une fonction qui rend les photos de la Lune plus nettes avec l’IA, et le “Best Take” de Google Pixel synthétise plusieurs expressions faciales en une seule photo parfaite.
- Woolley a averti que la modification et la distribution de contenu sans le consentement du créateur installent une couche de manipulation invisible entre le public et les médias,
- ce qui soulève des inquiétudes concernant la véracité des contenus et la transparence.
Réactions des créateurs et des experts
- Beato a adopté une attitude positive à l’égard de l’initiative de YouTube, la qualifiant de plateforme qui expérimente sans cesse de nouveaux outils.
- Il a déclaré que “YouTube a changé sa vie”, en retenant ses critiques.
- À l’inverse, des critiques soulignent qu’il s’agit d’un précédent dangereux de modifications sans préavis.
- Ils soulignent que, YouTube étant une plateforme majeure non seulement pour le divertissement mais aussi pour les contenus de news, d’éducation et d’information, l’exactitude et l’authenticité y sont particulièrement cruciales.
Orientation future des médias numériques
- Cet épisode annonce un avenir où l’IA reconstruit les contenus avant la perception des utilisateurs.
- Il montre que des vidéos déjà modifiées par l’IA peuvent être proposées avant même que le spectateur n’appuie sur le bouton lecture.
- Le besoin d’un avertissement transparent sur l’usage de l’IA et de procédures de consentement des créateurs devient central.
1 commentaires
Avis Hacker News
Dans les vidéos de maquillage des lèvres, les lèvres deviennent plus grandes, et dans celles de maquillage des yeux, les yeux deviennent plus grands : l’IA détecterait le type de contenu et appliquerait automatiquement un filtre
La vidéo en question est visible ici. C’est choquant qu’une plateforme modifie les uploads d’un créateur sans accord
L’influenceuse n’étant pas technicienne, elle semble avoir pris cela à tort pour un filtre IA. Les blocs qui flottent à l’écran sont typiques d’une compression très agressive
Il est étrange qu’un forum technique accepte ce type d’affirmation tel quel. Toute la vidéo manque de détails et présente des traces de compression évidentes
Les conditions d’utilisation contiennent probablement une clause disant que la plateforme peut “faire ce qu’elle veut”, ce qui pourrait ensuite être justifié comme un “paramètre utilisateur”
« Quand Meta fait de la traduction vocale automatique, elle ajoute un filtre IA pour faire correspondre les mouvements des lèvres à l’audio, et dans ce processus un filtre bizarre peut parfois recouvrir tout le visage »
Dire que des filtres différents sont appliqués selon le type de contenu ressemble à une spéculation excessive proche du complotisme
La peau est trop lissée, les cheveux ont l’air cireux, et d’étranges halos apparaissent autour des objets en mouvement
Au début, je pensais à un upscaling côté client, mais comme le traitement se fait sur le serveur, on ne peut même pas le désactiver
Si les gens s’habituent à cette qualité, il deviendra plus difficile de remarquer plus tard quand du contenu généré par IA s’y mélangera
Les gens scrolleront sans fin en ne regardant que des pubs et du contenu qui fait fondre le cerveau
ffmpeg -i source.mkv -i suspect.mkv -filter_complex "blend=all_mode=difference" diff_output.mkvOn voit beaucoup de ce genre d’affirmations, mais je n’ai encore vu personne publier une vidéo de comparaison (diff). Si quelqu’un le faisait, ce serait intéressant
Dans la vidéo YouTube, à 0:31, elle montre Shorts et l’original côte à côte
Dans la version haute qualité publiée sur Patreon, la différence est bien plus nette
En ce moment, je capture la miniature et je pose la question à ChatGPT, ou bien je mets l’URL de la vidéo dans un extracteur de transcription pour l’analyser avec Gemini
Les fabricants de clickbait ont maintenant été rétrogradés au rang de simples “suggéreurs de sujets à demander à ChatGPT”
Faire ce type d’“amélioration” sans même prévenir les créateurs n’est pas judicieux
Il faudrait que davantage de gens expérimentent de meilleures plateformes, ne serait-ce que pour les petits et moyens créateurs qui souffrent de fausses réclamations de copyright
Comme alternative, il existe des plateformes du Fediverse comme PeerTube
Augmenter l’engagement relève du créateur ; si la plateforme intervient, les utilisateurs finiront par partir
On peut voir un exemple lié dans cet article
La compression avec pertes et la quantification adaptative peuvent donner à la peau un aspect lissé
Des scientifiques, des responsables politiques, des économistes et des experts tech y apparaissent entièrement clonés par IA
Article lié : enquête du Guardian
Je ne pense pas que Google ait la moindre raison de fournir à l’extérieur des données propres
Par exemple, cette chaîne utilise ce qui ressemble non pas à une vraie image tirée de la vidéo, mais à une image de synthèse façon Stable Diffusion
Je l’ai vue une fois sur ma propre chaîne, mais l’option a disparu depuis. La plupart des chaînes que je suis utilisent cette fonction
Personnellement, je n’aime pas cela
Par exemple, on pourrait saisir sous la vidéo des prompts comme “remplacer l’anglais par du gaélique”, “remplacer les blagues de papa par du lorem ipsum”, ou “transformer le chien en forme de vie extraterrestre”
Ce serait génial si cela pouvait tourner localement dans le navigateur, mais d’ici là ce sera peut-être interdit légalement