1 points par GN⁺ 2023-12-16 | 1 commentaires | Partager sur WhatsApp

Méfiance envers les nouvelles fonctionnalités IA de Dropbox

  • Dropbox a ajouté de nouvelles fonctionnalités IA.
  • Ces fonctionnalités sont critiquées parce qu’elles enverraient des données à OpenAI.
  • Dropbox nie que les fichiers personnels soient utilisés comme données d’entraînement des modèles.

Détails importants

  • Dropbox dispose d’un document énonçant le principe selon lequel les données des clients ne seront pas utilisées pour l’entraînement des modèles d’IA sans leur consentement.
  • Une case à cocher est cachée dans les paramètres, ce qui rend flou le fait de savoir si l’utilisateur a réellement donné son consentement.

Ceux qui ne font pas confiance à OpenAI

  • OpenAI, partenaire tiers de Dropbox, affirme ne pas utiliser les données pour l’entraînement interne de ses modèles et les supprimer sous 30 jours.
  • Les gens ne croient pas aux affirmations d’OpenAI et traversent une crise de confiance envers l’IA.

Facebook ne vous espionne pas via votre microphone

  • La théorie selon laquelle Facebook vous écouterait via le microphone de votre téléphone pour vous montrer des publicités peut être facilement réfutée pour des raisons techniques et non techniques.
  • Pourtant, les gens continuent de ne pas y croire à cause de leurs propres expériences.

C’est vraiment important

  • La confiance est essentielle, et accuser une entreprise de mentir sur sa gestion des données personnelles est une affirmation grave.
  • Le rôle des pouvoirs publics est d’empêcher que ce genre de chose se produise.

Ce que nous pouvons faire

  • Les grands laboratoires d’IA pourraient améliorer la confiance en partageant des informations sur leurs données d’entraînement.
  • Les interactions avec ChatGPT sont utilisées pour améliorer le modèle, mais les détails sur la manière dont elles sont exploitées restent insuffisants.

Une opportunité pour les modèles locaux

  • Les gens font davantage confiance aux modèles locaux qui s’exécutent sur leurs propres appareils qu’à ceux hébergés dans le cloud.
  • La qualité des modèles locaux s’améliore et leur taille diminue.

L’avis de GN⁺

  • L’intersection entre l’IA et la protection de la vie privée est un enjeu important, qui nécessite un dialogue transparent.
  • La méfiance envers les affirmations de Dropbox et d’OpenAI provient d’un manque de compréhension de la technologie et d’un déficit de confiance.
  • Cet article met en lumière la rapidité des progrès de l’IA et l’importance croissante de la protection de la vie privée, tout en montrant pourquoi une communication transparente fondée sur la compréhension et la confiance est nécessaire, ce qui le rend particulièrement intéressant.

1 commentaires

 
GN⁺ 2023-12-16
Avis Hacker News
  • La capture d’écran a été prise directement depuis mon compte. C’est indiqué comme « activé », mais je ne l’ai pas activé moi-même.

    • Il existe aussi une crise du « consentement » en matière de confidentialité sur les sites web. Nous avons besoin d’une définition juridiquement applicable du consentement, et cela ne devrait pas vouloir dire que l’utilisateur doit donner un accord positif à l’envoi de ses données à des tiers. Bon article, mais l’analogie entre « mon téléphone m’écoute » et « OpenAI pourrait mentir sur la façon dont il utilise mes données » est quelque peu bancale. De fortes vérifications existent pour les apps tierces qui accèdent au micro de l’iPhone, ce qui n’est pas équivalent au moment où des données sont transmises à un tiers. Pour le grand public, cela peut sembler identique, mais en réalité on est protégé contre le premier cas. Agir comme si la bataille pour la vie privée et la souveraineté des données des utilisateurs était déjà perdue est très contre-productif. Je vois souvent des personnes un peu technophiles réagir aux nouveaux abus d’entreprises avec une attitude du type « vieille histoire ». Ces gens devraient montrer un meilleur exemple. Cette impuissance nuit à la confiance et ne donne pas l’impression qu’un monde meilleur soit possible. La bévue de Dropbox semble être le retour de cet état d’esprit : penser que les utilisateurs ne se soucieront pas qu’on envoie leurs fichiers privés à un tiers sans leur demander. J’avais déjà retiré la plupart de mes données de Dropbox, et hier j’ai ressenti la nécessité de résilier définitivement Dropbox. Merci, Dropbox !
  • Ce texte semble assez naïf et donne l’impression de « présumer la bonne foi ». Regardez ce qui s’est passé hors de l’IA ces dix dernières années : tout le monde consomme des données comme un collectionneur compulsif. Pas seulement Google et Facebook, mais absolument tout le monde. Aujourd’hui, j’ai découvert qu’un mini-site sur la cuisine traditionnelle suédoise avait ajouté des vidéos en lecture automatique, des bannières de consentement aux cookies pleines de dark patterns, etc. Presque toutes les nouvelles apps et tous les nouveaux sites sont construits autour de cet axe économique. Et au moment même où les LLM commencent à devenir puissants, on assiste soudain à un verrouillage coordonné des API tierces. Maintenant, nous avons ChatGPT/OpenAI et ses concurrents. Si les autres acteurs engloutissent les données comme une collation nocturne en cachette, la génération actuelle d’IA ressemble plutôt à des zombies rapides et agiles avides de sang et de cerveau. C’est parce que les données jouent un rôle plus direct dans le produit, mais aussi parce que l’instinct concurrentiel typique du hype train des VC de la tech s’est réveillé pour la première fois depuis des décennies. Tout indique un mélange d’apocalypse zombie / ruée vers l’or / on demandera pardon plus tard, etc. C’est pourquoi je crois fermement qu’ils mettent tous davantage l’accent sur la rhétorique de la sécurité et de la responsabilité. Ils accumulent à l’avance des munitions pour brouiller les pistes avant l’arrivée des inévitables crises de RP liées à leur réputation, au pluriel. Pendant ce temps, nous autres techniciens traînons comme si nous n’avions pas pleinement vécu la dernière décennie, en nous disant que cette fois ce sera différent, parce que l’IA a des bases académiques, parce qu’il y a de nouvelles entreprises brillantes, à cause du discours sur la sécurité, à cause des prises de position edgy sur Twitter de fondateurs qui ont « les pieds sur terre ». Je ne sais pas exactement ce qui est en train de se passer, mais je connais les gens depuis assez longtemps pour savoir comment ils fonctionnent. Et ils ne se sont pas améliorés.

  • Je pense que votre article passe à côté des problèmes de confidentialité qui vont au-delà de l’entraînement sur mes données.

    • En tant que professionnel, j’ai des clients soumis à des accords de confidentialité et à des réglementations sur l’endroit où vont mes informations. Je préfère les services où mes données restent sur le serveur. Je ne comprends pas pourquoi mes données ne sont pas toujours entièrement chiffrées et visibles uniquement par moi, mais le fait qu’elles soient envoyées via Internet à une autre entreprise pour traitement sans mon consentement ni mon intérêt est horrible. Quand j’utilise des fonctions IA, j’y consens, mais envoyer mes fichiers privés sur tout Internet sans mon consentement, c’est de la folie. Franchement, OneDrive a un outil de migration, et j’ai pris une version d’essai de Dropbox Business pour déplacer automatiquement tous mes fichiers hier soir. C’est la goutte d’eau finale après que cette entreprise a continué à faire des choses que je n’ai pas demandées et à ne pas fournir la fonctionnalité que je demande constamment… le chiffrement de bout en bout. Si vous voulez migrer en quelques clics de Dropbox Business vers un compte Office 365 OneDrive, c’est ici : [lien vers l’outil de migration]
  • Le problème central ici, c’est que les gens craignent que les fichiers privés de Dropbox soient utilisés par OpenAI pour entraîner des modèles.

    • Ce n’est qu’une partie du problème. Je ne veux pas que mes données soient envoyées où que ce soit sans mon approbation. Dans ce cas précis, nous n’avons pas de raison de douter qu’OpenAI ne se servira pas de nos fichiers pour l’entraînement, comme ils le disent, mais il faut encore croire qu’ils sauront traiter nos fichiers en toute sécurité.
  • Facebook dit qu’ils ne font pas ça. S’ils étaient pris à mentir, le risque pour leur réputation serait énorme.

    • Je ne crois pas que Facebook écoute en douce via le micro du téléphone de qui que ce soit, mais cet argument précis n’est pas du tout convaincant. La réputation de Facebook est déjà au plus bas, du moins parmi les gens ordinaires non technophiles que je connais. Je vis aux États-Unis, et les gens savent que Facebook a contribué à attiser l’émeute du 6 janvier 2021, puis a esquivé toute responsabilité sans rien corriger. Les dégâts réputationnels qu’ils absorberaient pour cette pratique, que beaucoup pensent déjà probable, ne sont pas comparables.
  • Dans l’article, l’aspect lié à la confiance dans le microphone semble être un faux débat qui détourne l’attention de ce qui pourrait rendre le point principal plus clair.

    • Facebook prend vos données depuis son app et depuis Internet pour suivre votre comportement en ligne, puis injecte ces données dans votre <i>modèle</i>. Ces modèles sont parfois si précis qu’ils peuvent presque prédire ce que vous pensez. C’est ce qui amène les gens ordinaires à conclure qu’ils doivent forcément vous écouter via le micro. Les entreprises de LLM comme OpenAI et leurs partenaires utilisent quasiment exactement les mêmes modèles. Elles prennent des données où elles veulent pour améliorer les modèles, vous faire continuer à cliquer là où elles veulent que vous cliquiez et vous monétiser.
  • Je ne « fais pas confiance » à OpenAI ni à aucune autre grande entreprise sur ce qu’elles disent avoir fait, ce qu’elles disent qu’elles feront, ou ce qu’elles sont en train de faire.

    • En revanche, je crois qu’OpenAI n’utilise pas les données de Dropbox pour l’<i>entraînement</i> sans le consentement de l’utilisateur. Mais ce n’est pas le problème ici. Le problème apparaît lorsque les données sont en transit ; vous envoyez les données à un tiers qui peut effectivement les lire, Dropbox peut avoir des employés malveillants qu’elle ne contrôle pas, les données peuvent apparaître dans des logs ou être traitées selon d’autres politiques. Si j’envoie des données personnelles à Dropbox, elle ne devrait pas pouvoir les envoyer à un tiers pour quelque raison que ce soit sans mon consentement explicite et éclairé. Je ne vois pas en quoi cela peut être controversé. Si Dropbox hébergeait le modèle et proposait de la recherche RAG aux utilisateurs consentants, ce serait une chose. Si Dropbox envoyait à l’avance toutes les données de tous les utilisateurs à un tiers sans en informer personne, ce serait tout autre chose. C’est horrible.
  • Crise de confiance dans l’IA ?

    • À quoi s’attendre après avoir entendu qu’un conseil d’administration / PDG d’une entreprise a été limogé ou remplacé à cause d’accusations de mensonge ou de manipulation ? Si Dropbox obtient quelque chose en analysant des données dérivées des données utilisateur, alors ces données « dérivées » cessent d’être des « données utilisateur » pour devenir des données Dropbox, qui peuvent être partagées. Elles peuvent avoir un caractère statistique sans lien direct avec un utilisateur individuel, mais n’est-ce pas précisément ce qu’est une donnée d’entraînement ? N’est-ce pas ainsi que cela fonctionne ? Ce n’est pas mentir, c’est jouer sur les mots. Non, c’est un comportement contraire à l’éthique, et c’est devenu la norme pour les grandes entreprises.
  • Je pense que les gens qui ne font pas confiance aux entreprises d’IA ressentent probablement la même chose vis-à-vis d’entreprises d’autres secteurs, d’organisations à but non lucratif et même d’agences gouvernementales.

    • À mes yeux, il y a un problème de confiance bien plus large, qui dépasse les entreprises basées sur l’IA. Du coup, voir ce secteur particulier tenter de lutter contre cette défiance venant de toutes parts ressemble à une mission impossible qui dépasse le champ de ces entreprises. Je ne sais pas quelle est la réponse à ce problème, s’il y a vraiment une solution, ni vers quoi nous nous dirigeons si ce cynisme généralisé continue à se propager à tout et à tout le monde. Peut-être sommes-nous simplement condamnés à vivre une époque intéressante.