1 points par GN⁺ 2025-06-07 | 1 commentaires | Partager sur WhatsApp
  • Dans le cadre du procès intenté par les plaignants, dont le New York Times, contre OpenAI, il est demandé à l’entreprise de conserver indéfiniment les données des utilisateurs de ChatGPT et de l’API
  • OpenAI conteste activement cette exigence et fait appel en estimant qu’elle entre en conflit avec ses engagements en matière de vie privée des utilisateurs
  • Cette ordonnance de conservation ne s’applique qu’aux utilisateurs de ChatGPT Free, Plus, Pro, Team et de l’API standard ; les utilisateurs Enterprise/Edu et de la ZDR API ne sont pas concernés
  • Même les données supprimées doivent faire l’objet d’une conservation légale dans un système distinct, avec un accès strictement limité à l’équipe juridique et sécurité d’OpenAI
  • OpenAI affirme que la protection de la vie privée reste sa priorité absolue et entend continuer à agir dans toutes les procédures judiciaires pour défendre ses utilisateurs

How we’re responding to The New York Times’ data demands in order to protect user privacy

  • Les plaignants, y compris le New York Times, ont demandé dans leur procès contre OpenAI que les données des clients grand public de ChatGPT et de l’API soient conservées indéfiniment
  • Cette demande entre fondamentalement en conflit avec les principes de confidentialité promis par OpenAI à ses utilisateurs et affaiblit les standards du secteur ainsi que le niveau de protection de la vie privée
  • OpenAI considère cette demande comme excessive et poursuit sa procédure d’appel en faisant de la vie privée des utilisateurs sa priorité absolue

Questions et réponses principales

1. Pourquoi le New York Times et les autres plaignants formulent cette demande

  • En intentant un procès contre OpenAI, le New York Times a demandé au tribunal la conservation indéfinie de tous les contenus utilisateurs, en se fondant sur la supposition qu’il pourrait y trouver des éléments favorables à sa procédure
  • OpenAI estime que cette demande menace la vie privée des utilisateurs et n’apporterait pas d’aide concrète à la résolution du litige
  • Les utilisateurs de ChatGPT Free, Plus, Pro, Team et de l’API standard peuvent être concernés, mais les clients de ChatGPT Enterprise, ChatGPT Edu et de la Zero Data Retention API ne le sont pas

2. La réponse juridique d’OpenAI

  • OpenAI s’est d’abord opposée à cette demande en affirmant que l’obligation de conserver toutes les données de sortie était excessive et incompatible avec sa politique de confidentialité
  • Devant le Magistrate Judge, OpenAI a obtenu la confirmation que ChatGPT Enterprise constituait une exception
  • Une procédure d’appel supplémentaire devant le District Court Judge est en cours

3. Les clients professionnels sous contrat Zero Data Retention

  • Les clients professionnels utilisant la Zero Data Retention API ne sont pas concernés, car les données d’entrée et de sortie n’y sont pas stockées

4. En cas de suppression des données ChatGPT

  • Les comptes grand public peuvent être affectés par la procédure, mais les clients Enterprise, Edu et les utilisateurs de la Zero Data Retention API ne sont pas concernés

5. Méthode de stockage des données et droits d’accès

  • Les données visées par l’ordonnance judiciaire sont stockées séparément dans un système sécurisé dédié
  • Ces données ne peuvent pas être utilisées à d’autres fins que le respect des obligations légales, et leur accès est strictement limité à un petit nombre de personnes des équipes juridique et sécurité d’OpenAI

6. Possibilité de partage externe des données

  • Les données conservées ne sont pas automatiquement transmises à des tiers comme le New York Times
  • En cas de nouvelles demandes de divulgation, OpenAI prévoit de réagir activement pour défendre la vie privée

7. Durée de conservation des données et fin de l’obligation

  • À ce stade, une conservation indéfinie des données utilisateurs est imposée par ordonnance judiciaire, mais OpenAI la conteste activement sur le plan juridique
  • Si cette contestation aboutit, un retour à la politique habituelle de conservation des données sera possible

8. Y a-t-il violation du GDPR et d’autres lois sur la vie privée ?

  • OpenAI respecte ses obligations légales en vertu de l’ordonnance judiciaire, mais la demande du New York Times entre en conflit avec les standards de confidentialité d’OpenAI
  • L’entreprise poursuit ses recours et ses réponses de politique interne sur ce sujet

9. Y a-t-il un changement dans la politique d’entraînement des modèles ?

  • Les données des clients professionnels ne sont pas utilisées par défaut pour l’entraînement des modèles, et cette ordonnance ne change pas cette politique
  • Les clients grand public peuvent contrôler eux-mêmes l’utilisation de leurs données à des fins d’entraînement selon leurs paramètres individuels, sans impact de cette ordonnance

10. Information des utilisateurs et transparence

  • OpenAI promet de continuer à informer les utilisateurs et à maintenir la transparence
  • En cas d’évolution de l’ordonnance judiciaire ou d’impact sur les données utilisateurs, une information rapide sera fournie

11. Résumé de la politique de conservation des données

  • ChatGPT (Free/Plus/Pro) : en cas de suppression d’une conversation ou du compte, les données sont supprimées immédiatement du compte puis définitivement effacées dans un délai de 30 jours
  • ChatGPT Team : chaque utilisateur peut contrôler la conservation de ses conversations ; les données supprimées ou non conservées sont effacées dans les 30 jours (hors obligations légales)
  • ChatGPT Enterprise/Edu : l’administrateur de l’espace de travail gère la durée de conservation des données ; les conversations supprimées sont effacées dans les 30 jours (hors obligations légales)
  • API : les utilisateurs professionnels peuvent choisir eux-mêmes la durée et le mode de conservation pour la gestion de l’état de leur application ; les données d’entrée et de sortie de l’API sont supprimées des logs après 30 jours (hors obligations légales)
  • Zero Data Retention API : dans ce cas, les données d’entrée et de sortie ne sont pas stockées dès le départ

Conclusion

  • OpenAI fait de la confiance des utilisateurs et de la protection de la vie privée la priorité de sa politique, et continue de répondre activement au défi juridique
  • Certaines catégories de clients, comme les usages professionnels, éducatifs et la ZDR API, ne sont pas affectées, tandis que les données des consommateurs font l’objet de mesures de protection distinctes
  • OpenAI prévoit de communiquer de manière transparente sur toute évolution de la situation juridique et de sa politique de protection des données utilisateurs

1 commentaires

 
GN⁺ 2025-06-07
Avis sur Hacker News
  • Ce serait vraiment très utile si OpenAI permettait de demander officiellement l’option Zero Data Retention (ZDR). Dans beaucoup de contextes d’entreprise, il n’y a absolument aucune raison de conserver les logs de requêtes. La documentation indique à plusieurs reprises qu’on peut en faire la demande, mais en pratique, c’est simplement ignoré. Je comprends qu’une approbation soit nécessaire et qu’il y ait une barrière à l’entrée, mais dans les faits, on a l’impression qu’OpenAI ne mentionne ZDR qu’à des fins marketing. J’ai fait la demande plusieurs fois sans jamais recevoir de réponse. En regardant les messages sur les forums, cela semble être très courant
    • Je comprends qu’un processus d’approbation soit nécessaire, mais je me demande pourquoi la valeur par défaut n’est ni la protection de la vie privée ni l’absence de conservation. Beaucoup d’utilisateurs doutent des promesses d’OpenAI en matière de confidentialité. Ils se disent que les entrées sont peut-être stockées, analysées et partagées. Si l’on a réellement besoin de confidentialité, alors seuls les LLM exécutés en local constituent une véritable alternative
    • Si j’ai bien compris, les logs sont conservés 30 jours par défaut pour le traitement des bugs. Il est aussi possible de demander une conservation de 0 jour. C’est indiqué dans la documentation officielle
    • L’élément manquant, au fond, c’est l’argent
    • Il existe une politique disant : « pour certains cas d’usage, vous pouvez également demander le zero data retention (ZDR). Pour plus d’informations sur le traitement des données, consultez la page Platform Docs » OpenAI Privacy Policy. 1) Pouvoir faire une demande ne garantit pas l’approbation. 2) Les valeurs par défaut comptent. Dans la Silicon Valley, les réglages par défaut visent non pas la confidentialité, mais la maximisation des revenus. Chez OpenAI aussi, la conservation des données est activée par défaut, y compris pour les sorties. Cela rend difficile de prendre au sérieux la note d’OpenAI s’opposant à l’ordonnance de conservation des données
    • Ils répètent officiellement qu’on peut faire une demande, mais je soupçonne qu’en réalité ce n’est qu’une formule marketing qui ne fonctionne pas du tout
  • Les données couvertes par l’ordonnance du tribunal sont conservées dans un système isolé et ne sont accessibles que pour remplir les obligations légales. Seules quelques personnes auditées au sein des équipes juridique et sécurité d’OpenAI peuvent y accéder dans le cadre de ces obligations. En cas de fuite, OpenAI en porterait la responsabilité. Mais le ton général de ce texte, surtout le fait de répéter que le procès est « sans fondement », nuit à sa crédibilité ; cela ressemble à un texte promotionnel auquel il est difficile de faire confiance
    • Cette affaire a pris de l’ampleur dans le cycle médiatique, et le fait que des chats supprimés ne soient pas réellement supprimés à cause du litige est devenu un sujet sensible ; OpenAI devait donc réagir pour rassurer ses clients
    • Si, lors du processus de recherche, des données liées au litige sont jugées pertinentes pour l’affaire, elles seront au minimum accessibles aux deux parties ainsi qu’au tribunal
    • Il est naturel qu’OpenAI défende sa propre position. Il est logique qu’ils qualifient le procès de « sans fondement »
    • Je suis utilisateur d’OpenAI. Je paie pour ce service parce qu’il est utile. Je ne veux pas que mes données soient conservées au-delà de ce qui est explicitement prévu dans les conditions d’utilisation et la politique de confidentialité. Si le tribunal ne comprend pas que l’obligation de conservation imposée à OpenAI met en danger la vie privée de dizaines de millions d’utilisateurs, alors je le juge inapte
    • Le premier principe de la sécurité des données, c’est que les systèmes sont imparfaits ; la seule vraie protection consiste donc à ne pas stocker les données du tout. En cas de fuite, OpenAI en serait responsable. Les entreprises qui promettent la sécurité des données sont soit incapables, soit de mauvaise foi
  • Je me demande si l’équipe juridique d’OpenAI pourrait mettre en place un système qui ne conserve, à la place des conversations réelles, que des informations floues comme des hachages ssdeep ou des chunks de contenu. Si le périmètre de données demandé par le NYT est limité et que le contenu litigieux est généré via l’API, une comparaison par valeur de hachage serait possible. Bien sûr, l’idéal serait de ne rien stocker du tout, mais face à une ordonnance judiciaire excessivement large, cela pourrait constituer un compromis réaliste. Voir aussi : ssdeep, content-defined chunking
    • Il faut souligner à quel point il est difficile d’expliquer ce type de termes techniques à des avocats ou à un juge au tribunal
    • Le simple fait de chercher activement à contourner l’esprit d’une décision de justice est en soi une très mauvaise idée
    • Je n’ai pas trouvé les documents relatifs à l’ordonnance du tribunal, mais il semble que le juge ait demandé à OpenAI s’il était possible de distinguer les données, et qu’OpenAI n’ait donné absolument aucune réponse — non pas un simple refus, mais une ignorance pure et simple. On a l’impression qu’OpenAI n’a aucune volonté de chercher activement une solution et se contente d’une stratégie de relations publiques
    • Aussi élégant que cela puisse paraître dans un livre blanc, en pratique toutes les conversations ChatGPT sont stockées dans S3, avec des sauvegardes régulières par diverses entités. C’est une base de données textuelle pleine de contenu sensible, comme les e-mails en interne. Je n’ai aucune confiance dans les « promesses » de la direction
  • Avant, j’aurais trouvé très honteux qu’un historique de navigation fuite ; aujourd’hui, je pense qu’une fuite de l’historique de conversations avec un LLM serait bien pire. Plus encore que des conversations privées avec d’autres, ce sont des échanges qui enregistrent exactement qui je suis quand je suis seul et sans filtre
    • D’autres réagissent en demandant ce qu’on peut bien poser comme questions pour attendre une quelconque confidentialité de la part d’un LLM
  • Discussion liée : OpenAI slams court order to save all ChatGPT logs, including deleted chats (juin 2025, 878 commentaires)
  • Je trouve étrange de blâmer le NYT. Si le NYT a un motif valable pour agir en justice, le tribunal l’autorisera ; s’il n’en a pas, OpenAI gagnera devant le tribunal. Il est bizarre d’utiliser l’ordonnance du tribunal comme prétexte pour attaquer le NYT
    • Le NYT exploite une faiblesse du système juridique américain : une procédure de discovery très large, qui se soucie très peu de la vie privée. C’est évidemment dans son intérêt, mais pour une fois, je ne peux pas ne pas être du côté d’OpenAI
    • Le NYT semble changer de position selon les circonstances. Par le passé, il a vendu une base de données d’articles de pigistes et défendu un affaiblissement du copyright. Aujourd’hui, il met le copyright au-dessus de tout. À ce sujet, cet article sur le revirement du NYT est intéressant
    • Le NYT est aussi partie au litige. Il est donc légitime de qualifier le procès de « sans fondement »
    • Si le NYT n’avait réellement aucun motif mais obtenait quand même l’approbation du tribunal, ce serait aussi anormal
    • Le fait que quelque chose soit légal n’absout pas ceux qui abusent du système juridique
  • Il manque quelque chose dans l’explication d’OpenAI intitulée « Pourquoi cela se produit-il ? ». On a l’impression qu’elle présente les gens comme s’ils se mettaient en colère sans raison, alors que du point de vue des clients, c’est absurde
  • Ils expliquent dans les « Paramètres » qu’on peut contrôler si les données utilisateur sont utilisées pour l’entraînement du modèle, mais en réalité le bouton « Améliorer le modèle pour tout le monde » est un dark pattern qui n’a aucun effet, et il faut faire une demande directe via un portail peu visible, donc difficile à trouver. Cela a conduit beaucoup d’utilisateurs à mal comprendre le fonctionnement réel
    • Demande de précisions
    • Demande d’explication concrète sur l’affirmation selon laquelle le bouton « Améliorer le modèle pour tout le monde » n’a en réalité aucun effet, ainsi que du lien vers le portail concerné
  • J’ai toujours supposé que tout ce qui est envoyé à l’API d’un prestataire externe est conservé de manière permanente. Penser le contraire me paraît plus naïf. C’est aussi naïf que de croire qu’une application ne fait pas de suivi web
    • Il est sage de supposer le pire, mais il est idiot de simplement s’y résigner sans aucune résistance
    • Le nihilisme en matière de vie privée reste lui aussi un choix que l’on fait soi-même
  • Je ne suis pas d’accord avec la position officielle d’OpenAI selon laquelle « la confiance et la confidentialité sont des valeurs fondamentales » et qu’ils « offrent des outils de gestion des données et des options de suppression ». Ils font la promotion d’une confidentialité accessible moyennant un coût supplémentaire, mais même les utilisateurs Pro ne peuvent pas bénéficier de cette « confidentialité ». Malgré de nombreuses demandes de suppression d’informations, ils refusent de retirer les données personnelles des modèles et des données d’entraînement
    • Tous les utilisateurs peuvent se désinscrire. ChatGPT Plus, Pro et Free ont tous le partage de données activé par défaut, mais n’importe qui peut désactiver l’utilisation de ses données à des fins d’entraînement. Seule l’offre Enterprise le désactive par défaut. Référence : What if I want to keep my history on but disable model training?
    • Ce n’est rien d’autre que du « trustwashing » d’entreprise. Des termes ambigus et flous, une rhétorique flatteuse, et des valeurs creuses, rien de plus