Déclaration de Scarlett Johansson sur la voix « Sky » d’OpenAI

(twitter.com/BobbyAllyn)

7 points par GN⁺ 2024-05-21 | 9 commentaires | Partager sur WhatsApp

Déclaration fournie à NPR par le porte-parole de Johansson, Marcel Pariseau. Traduction automatique en coréen

« En septembre dernier, Sam Altman m’a contactée pour me proposer d’incarner la voix du système actuel ChatGPT 4.0. Il m’a dit que je pourrais aider à combler le fossé entre les entreprises technologiques et les créateurs, et à faire en sorte que les consommateurs se sentent plus à l’aise face au bouleversement sismique concernant les humains et l’IA. Il a aussi affirmé que ma voix pourrait apporter du réconfort aux gens.

Après mûre réflexion, j’ai refusé cette offre pour des raisons personnelles. Neuf mois plus tard, mes amis, ma famille et le grand public ont fait remarquer à quel point le nouveau système baptisé « Sky » ressemblait à ma voix.

En entendant la démo publiée, j’ai été choquée, en colère et incrédule que M. Altman ait poursuivi une voix tellement semblable à la mienne que même mes amis les plus proches et les médias avaient du mal à faire la différence. M. Altman a même insinué que cette ressemblance était intentionnelle en tweetant le simple mot « her », en référence au film "Her", dans lequel j’interprétais Samantha, la voix d’un système de conversation qui noue une relation intime avec un humain.

Deux jours avant la publication de la démo de ChatGPT 4.0, M. Altman a contacté mon agent pour me demander de reconsidérer ma décision. Avant même que nous puissions nous parler, le système avait déjà été dévoilé.

En raison de leurs agissements, j’ai été contrainte de demander un avis juridique, et mon avocat a adressé deux courriers à M. Altman et à OpenAI pour leur demander d’expliquer précisément ce qu’ils avaient fait et le processus exact de création de la voix « Sky ». Finalement, OpenAI a accepté, à contrecœur, de retirer la voix « Sky ».

À une époque où nous sommes tous aux prises avec les deepfakes et avec la protection de notre image, de notre travail et de notre identité, je crois que ces questions exigent une clarté absolue. J’attends avec espoir une solution sous la forme de l’adoption d’une législation appropriée visant à garantir la transparence et à protéger les droits individuels. »

9 commentaires

xguru 2024-05-26

Selon les informations disponibles, OpenAI n’a pas reproduit la voix de Scarlett Johansson.

botplaysdice 2024-05-22

Je me demande comment OpenAI va réagir.

Est-ce qu’ils vont dire : « Cette voix, ce n’est pas vous. Votre voix, c’est celle-ci. » puis lui faire écouter une copie vraiment parfaite de la voix de Scarlett Johansson ?

La manière dont ils ont géré ça laisse quand même un peu à désirer. Un effet secondaire d’un excès de confiance, peut-être…

lcanon 2024-05-21

J’espère que cela portera un coup décisif à l’adage propre à ce secteur selon lequel « il est plus facile d’obtenir le pardon que la permission ». S’ils ont une telle attitude avec une star hollywoodienne, ils pourraient bien envoyer un tueur à gages face aux protestations d’un simple citoyen.

shalome7 2024-05-21

Personnellement, la voix Sky avait déjà été lancée il y a 6 mois et n’importe qui pouvait l’utiliser via l’app iOS, et cela n’avait jamais vraiment fait parler d’elle comme étant similaire à Scarlett Johansson ou à Her... (même sur Reddit, HN, etc., ceux qui l’avaient essayée disaient que ce n’était pas au point de les confondre comme étant la même voix..) Moi aussi, maintenant, quand j’essaie clairement le réglage Sky, je comprends que ça fasse penser à la voix de Scarlett Johansson dans Her, mais je n’ai pas l’impression que ce soit exactement la même voix.

Même dans ce cas, je me demande s’il est justifié que Scarlett Johansson revendique des droits sur cette voix.

Ancienne démo publiée à l’époque : https://www.youtube.com/watch?v=RcgV2u9Kxh0

Maintenant que je l’écoute en sachant que c’est censé être Scarlett Johansson, oui, ça lui ressemble clairement un peu... haha

eungook 2024-05-22

J’espère que vous avez changé d’avis depuis.

bbulbum 2024-05-21

Pff… et dire qu’une entreprise censée mener l’industrie de l’IA…

xguru 2024-05-21

OpenAI a également publié séparément un article à ce sujet : comment les voix de ChatGPT ont été choisies.

Le processus de sélection des voix de ChatGPT

Le mode vocal de ChatGPT est l’une des fonctionnalités les plus appréciées des utilisateurs
Les cinq voix distinctes (Breeze, Cove, Ember, Juniper, Sky) ont été soigneusement sélectionnées au terme d’un vaste processus de cinq mois
Des comédiens de doublage professionnels, des agences, des directeurs de casting et des consultants du secteur y ont participé

Soutien à la communauté créative et collaboration avec le secteur du doublage

OpenAI soutient la communauté créative et travaille en étroite collaboration avec le secteur du doublage pour le casting des voix
Chaque comédien de doublage est rémunéré au-dessus des standards les plus élevés du marché, et cette rémunération se poursuivra tant que sa voix sera utilisée dans le produit
OpenAI estime qu’une voix d’IA ne doit pas imiter intentionnellement la voix distinctive d’une célébrité
La voix de Sky n’est pas une imitation de Scarlett Johansson, mais la voix naturelle d’une autre actrice professionnelle
Les noms ne sont pas divulgués afin de protéger la vie privée des comédiens de doublage

Collaboration avec des directeurs de casting et producteurs primés pour définir les critères des voix

Début 2023, OpenAI a collaboré avec des directeurs de casting et producteurs indépendants, reconnus et primés afin de sélectionner les comédiens de doublage
Les critères des voix de ChatGPT ont été établis en tenant soigneusement compte de la personnalité propre à chaque voix et de son attrait pour un public mondial
Parmi ces critères figuraient la diversité des origines ou la capacité à être multilingue, une voix intemporelle, une voix inspirant confiance, ainsi qu’une voix chaleureuse, engageante et assurée

Des comédiens de doublage et acteurs à l’écran ayant reçu plus de 400 candidatures

En mai 2023, l’agence de casting et le directeur de casting ont publié un appel à candidatures
Plus de 400 candidatures ont été reçues en une semaine
Les acteurs ont passé une audition en enregistrant des scripts de réponses de ChatGPT

Sélection finale des cinq voix et discussion avec les acteurs sur la vision des interactions vocales avec l’IA

Tout au long du mois de mai 2023, l’équipe de casting a examiné et retenu de manière indépendante 14 acteurs
Les voix finalistes ont fait l’objet d’un travail d’affinage supplémentaire avant d’être soumises à OpenAI
Avec chaque acteur, des discussions ont eu lieu sur la vision des interactions vocales avec l’IA, ainsi que sur les capacités, les limites, les risques et les garde-fous de cette technologie
Il était important que les acteurs comprennent la portée et l’intention du mode vocal avant de s’engager sur le projet
Après examen des voix par les équipes internes d’OpenAI sous l’angle du produit et de la recherche, les voix finales ont été choisies avec soin

Invitation des acteurs à San Francisco pour l’enregistrement et lancement des voix de ChatGPT

En juin et juillet, les acteurs ont été invités à San Francisco pour des sessions d’enregistrement et des réunions en présentiel avec les équipes produit et recherche d’OpenAI
Le 25 septembre 2023, les voix ont été lancées dans ChatGPT
L’ensemble du processus s’est étalé sur cinq mois et a donné lieu à une collaboration approfondie avec les acteurs et l’équipe de casting
OpenAI continue de collaborer avec les acteurs pour la recherche audio de GPT-4o et les nouvelles fonctionnalités vocales

Nouveau mode vocal de GPT-4o pour les utilisateurs payants et projet d’ajout de voix supplémentaires

Une version alpha du nouveau mode vocal de GPT-4o sera proposée aux utilisateurs de ChatGPT Plus dans les prochaines semaines
GPT-4o permet d’interagir avec ChatGPT par la voix de manière bien plus naturelle
GPT-4o gère les interruptions de façon fluide, pilote efficacement les conversations de groupe, filtre les bruits de fond et s’adapte au ton
OpenAI prévoit d’ajouter à l’avenir des voix supplémentaires à ChatGPT afin de mieux répondre à la diversité des intérêts et des préférences des utilisateurs

GN⁺ 2024-05-21

Avis Hacker News

Résumé d’un recueil de commentaires Hacker News

Conflit entre OpenAI et Scarlett Johansson
- OpenAI a approché Scarlett Johansson, mais elle a refusé. Deux jours avant le lancement de GPT-4o, l’entreprise a recontacté son agent, sans obtenir de réponse. OpenAI a finalement présenté une démo d’un produit imitant sa voix. Après une demande d’explication de l’équipe juridique de Scarlett, OpenAI a retiré cette voix du produit.
Comportement excessif d’OpenAI
- Certains estiment qu’OpenAI a eu un comportement déplacé en essayant à plusieurs reprises d’engager Johansson, puis en imitant sa voix après ses refus.
Critiques de la démo de ChatGPT-4o
- Des commentaires jugent dérangeante la tentative d’Altman de copier « elle ». Le fait que Johansson ait choisi de ne pas participer est vu comme une bonne décision. Cela clarifie aussi que le moteur TTS est toujours utilisé.
Déclaration de Mira Murati
- Des commentaires trouvent marquante la déclaration de Murati selon laquelle le mode vocal de GPT-4o s’inspire moins du film Her que des aspects naturels de la conversation humaine. Le fait qu’elle soit restée figée face aux questions semble avoir visé à éviter des problèmes juridiques.
Tweet de Sam
- Certains estiment que le tweet de Sam a fourni à l’équipe juridique de Scarlett Johansson toutes les preuves nécessaires.
Questions juridiques
- La voix Sky aurait imité non pas Scarlett Johansson elle-même, mais son personnage dans le film Her. Cela alimente le débat juridique sur le fait que des voix d’acteurs ou d’actrices puissent être reproduites ou appropriées par des modèles d’IA. La situation juridique peut aussi varier selon le contrat de Johansson.
Le choix de Johansson
- Certains trouvent intéressant que Johansson ait renoncé à d’importantes royalties et à des opportunités de collaboration. Son malaise face à l’utilisation non autorisée de sa voix paraît compréhensible. La situation est comparée à celle de développeurs voyant leur code utilisé sans autorisation par l’IA.
Réaction juridique
- Des commentaires estiment qu’OpenAI a reculé parce que Johansson a les moyens financiers d’engager des avocats. Cela alimente l’inquiétude qu’Altman et OpenAI puissent facilement porter atteinte aux droits d’autrui.
Le cas de Weird Al Yankovic
- Certains estiment qu’il faudrait s’inspirer de l’exemple de Weird Al Yankovic, qui a obtenu ce qu’il voulait tout en respectant le principe du consentement.
Appels à une action en justice
- Des commentaires espèrent que Johansson intentera un procès à l’entreprise pour en faire un exemple. Ils estiment qu’elle a les ressources pour se battre et que l’entreprise le mérite.

2024-05-21

[Ce commentaire a été masqué.]