- OpenAI fait de la protection des données de conversations personnelles de ChatGPT, utilisé par plus de 800 millions de personnes, sa priorité absolue
- The New York Times a demandé au tribunal la remise de 20 millions d’historiques de conversations privées sur ChatGPT, une démarche dénoncée comme une atteinte à la vie privée des utilisateurs
- OpenAI a déjà refusé par le passé une demande portant sur 1,4 milliard d’historiques de conversations et poursuit cette fois encore, par voie judiciaire, ses efforts pour protéger les données des utilisateurs
- L’entreprise développe des fonctionnalités de sécurité renforcées comme le chiffrement côté client et met en place des systèmes automatisés minimisant l’accès aux données sensibles
- Cette affaire est considérée comme un tournant majeur autour des standards de protection des données personnelles à l’ère de l’IA
La demande de données du New York Times et la position d’OpenAI
- Dans le cadre de son procès contre OpenAI, le New York Times demande la remise de 20 millions de conversations d’utilisateurs de ChatGPT
- Il affirme vouloir vérifier si des utilisateurs ont utilisé ChatGPT pour contourner le paywall du New York Times
- OpenAI indique que cette demande viole ses principes de protection de la vie privée et ses pratiques de sécurité établis de longue date
- L’entreprise a demandé au tribunal de rejeter cette requête, en faisant valoir qu’elle inclut les conversations privées de dizaines de millions de personnes sans lien avec le litige
Antécédents de demandes similaires et réponse apportée
- Le New York Times avait déjà tenté par le passé de limiter la fonctionnalité de suppression des conversations des utilisateurs, mais OpenAI s’y est opposé et a rétabli le droit à la suppression
- Une demande de remise de 1,4 milliard d’historiques de conversations a ensuite été formulée, mais OpenAI l’a refusée
- OpenAI affirme que les conversations privées des utilisateurs leur appartiennent et qu’elles ne doivent pas devenir les victimes collatérales d’un litige sur l’accès à des contenus en ligne
Renforcement de la sécurité et de la protection de la vie privée chez OpenAI
- OpenAI, l’une des organisations les plus attaquées au monde, investit massivement pour protéger les données contre le crime organisé et les tentatives de piratage soutenues par des États
- Sa feuille de route inclut à l’avenir le chiffrement côté client (client-side encryption), avec l’objectif que même OpenAI ne puisse plus accéder aux messages des utilisateurs
- L’entreprise conçoit également un système automatisé de détection de sûreté afin que seuls les cas graves d’usage abusif — menaces contre la vie, préjudices causés à autrui, risques de cybersécurité — soient transmis de manière limitée à une équipe humaine de revue
Détails relatifs à la demande de données (résumé FAQ)
- Périmètre des données demandées : 20 millions de conversations ChatGPT grand public tirées aléatoirement entre décembre 2022 et novembre 2024
- Services exclus : ChatGPT Enterprise, ChatGPT Edu, ChatGPT Business (anciennement Team) et les clients API ne sont pas concernés
- Mesures de protection des données personnelles : toutes les conversations passent par une procédure de suppression des informations personnellement identifiables (PII) et des informations sensibles comme les mots de passe
- Droits d’accès aux données : seuls certains membres des équipes juridique et sécurité d’OpenAI, ainsi que les avocats externes et conseillers techniques du New York Times, peuvent y accéder
- Mode de conservation : stockage isolé dans un système sécurisé distinct afin de satisfaire aux obligations légales, sans accès général
Considérations juridiques et internationales
- OpenAI précise qu’il prend les mesures nécessaires pour respecter les réglementations internationales sur la vie privée, dont le RGPD, mais que la demande du New York Times n’est pas conforme à ses propres standards de confidentialité
- L’entreprise continue de contester cette demande par la voie judiciaire et affirme qu’à chaque étape, la protection de la vie privée des utilisateurs restera sa priorité absolue
- OpenAI promet de fournir à l’avenir des mises à jour transparentes sur les décisions du tribunal et sur l’évolution du traitement des données
Plans et vision pour la suite
- OpenAI souligne que plus l’IA s’intègre profondément dans la vie des individus, plus le niveau de sécurité et de protection de la vie privée doit être renforcé
- L’objectif est un futur où les conversations IA les plus personnelles des utilisateurs restent sûres et privées
- À court terme, l’entreprise prévoit de publier rapidement des mesures de renforcement de la sécurité et d’atténuation immédiates
- À long terme, elle poursuit la mise en place de cadres de protection techniques et juridiques pour bâtir un environnement d’IA digne de confiance
1 commentaires
Avis sur Hacker News
C’est une demande qu’un plaignant peut naturellement formuler, mais ce type de procès ne se limite pas forcément aux questions de copyright
Le vrai problème serait plutôt de savoir pourquoi OpenAI collecte et conserve autant de données de conversations privées
La demande du NYT n’est utilisée que dans le cadre de la procédure judiciaire, les informations confidentielles étant masquées, puis les données sont détruites une fois le procès terminé
À l’inverse, OpenAI conserve les données indéfiniment à des fins commerciales
Et il n’est même pas clair pour quel modèle économique ces données sont accumulées. Cela ressemble à une collecte de données sans discernement
Documents associés : ordonnance du tribunal 1, ordonnance du tribunal 2
Voir l’article d’Ars Technica
Le problème est que même si l’utilisateur clique sur le bouton de suppression, les données doivent être conservées à cause de l’ordonnance judiciaire
Au final, je pense que la cause profonde est la violation du copyright. Le NYT a raison de se battre
Résumé des décisions concernées
Ne pas contribuer à la culture ouverte tout en cherchant l’attention serait hypocrite
Les promesses autour de l’AGI auraient été mensongères et n’auraient servi qu’à angoisser les gens
Mais l’idée que des conversations privées entre personnes finissent entre les mains des avocats du NYT me met mal à l’aise
Comme le NYT n’a pas démontré clairement son préjudice, cela ressemble à une fishing expedition
L’analogie donnée est celle d’exiger les registres de vente d’une librairie de livres piratés
Les utilisateurs auraient du mal à faire valoir juridiquement un droit à la vie privée
La vraie question est de savoir si l’entraînement de l’IA constitue une violation du copyright, et s’il relève ou non du fair use
Il est également reproché à OpenAI d’avoir répondu de manière peu coopérative pendant la procédure
PDF de la plainte du NYT
Ceux qui peuvent ignorer le copyright finiront par bénéficier d’un avantage concurrentiel
C’est simplement que presque personne ne les lit
ESPN vs YouTube, et maintenant OpenAI vs NYT
Je n’ai pas spécialement envie de soutenir l’un ou l’autre. Cela dit, si OpenAI ne reproduit vraiment pas textuellement les phrases du NYT, elle ne devrait pas avoir peur d’une vérification
Proposition d’une vérification par un tiers neutre — un tiers comparerait les articles du NYT et les logs de ChatGPT, sans que les deux parties aient directement accès aux originaux
Au final, chaque camp ne peut que présenter ses experts et mener devant le tribunal une bataille de crédibilité
J’espère quand même que cette affaire fera prendre conscience aux gens des risques du surpartage de données personnelles
En réalité, selon les conditions d’utilisation, OpenAI possède et exploite ces données
Une communication qui déforme aussi les intentions du NYT n’inspire pas confiance
C’est un problème qu’elle a elle-même créé
OpenAI ne montre aucun sens des responsabilités comparable
Dans ce cas, pourquoi brandir maintenant la vie privée comme un bouclier ?
Ce genre d’affirmation est souvent le signe d’une attitude défensive
S’inquiéter maintenant de la vie privée est contradictoire
Techniquement, cela semble possible, mais l’entreprise a sans doute choisi de les conserver en clair pour des analyses internes
Si les employés peuvent y accéder, c’est encore plus gênant que si les avocats du NYT les consultent
Cela ne me paraît pas très différent d’un enquêteur qui ouvrirait un courrier sur ordonnance judiciaire