1 points par GN⁺ 4 시간 전 | 1 commentaires | Partager sur WhatsApp
  • Les modèles de classe Mythos peuvent conserver les prompts et les sorties pendant 30 jours et les soumettre à examen dans le cadre du déploiement responsable et du travail de sécurité
  • Cette politique s’applique aux modèles de classe Mythos ainsi qu’aux futurs covered models ayant des capacités similaires, sans affecter les conditions d’utilisation des autres modèles
  • Les offres grand public ne sont pas concernées par ce changement, car leurs interfaces appliquent déjà la conservation des entrées et sorties à des fins de sécurité
  • Les organisations ayant configuré le ZDR peuvent devoir activer la conservation via Claude Console, Claude Code dans Claude Enterprise, AWS Bedrock, Google Cloud Agent Platform ou Microsoft Foundry
  • Anthropic indique qu’une conservation temporaire est nécessaire pour détecter des schémas d’abus répartis sur plusieurs requêtes, avec suppression automatique au bout de 30 jours et procédure d’examen limitée

Champ d’application

  • Pour permettre un déploiement responsable des modèles de classe Mythos, une conservation limitée des données et un examen restreint sont requis dans le cadre des opérations de sécurité
  • Les prompts soumis aux modèles de classe Mythos et les sorties générées sont conservés pendant 30 jours à des fins de confiance et sécurité sur toutes les plateformes où ces modèles sont proposés
  • Cette politique s’applique aux modèles de classe Mythos et aux futurs covered models de capacités comparables désignés par Anthropic
  • L’utilisation de tous les autres modèles n’est pas affectée et les conditions actuelles restent inchangées
  • La politique entre en vigueur le 9 juin 2026

Qui est concerné

  • Les offres grand public comme Claude Free, Pro et Max ne sont pas affectées par ce changement sur le web, le bureau et les applications mobiles
  • Sur les interfaces grand public, y compris Claude.ai et Claude Code, la conservation des entrées et sorties à des fins de sécurité est déjà en place
  • Le changement concerne uniquement les organisations ayant configuré des workspaces zero data retention (ZDR) dans Claude Console
  • Sont également concernées les organisations qui utilisent Claude Code avec ZDR dans Claude Enterprise, ou qui accèdent à Claude avec ZDR via AWS Bedrock, Google Cloud Agent Platform ou Microsoft Foundry
  • Le reste du texte ne s’applique qu’à ces organisations

Pourquoi c’est nécessaire

  • Claude Mythos 5 marque une forte augmentation des capacités du modèle, dont certaines peuvent être utilisées à la fois à des fins légitimes et malveillantes
  • Claude Fable 5 partage le même modèle de base que Claude Mythos 5, mais ajoute des garde-fous spécifiques, notamment dans les domaines cyber et bio
  • Même si ces garde-fous permettent une diffusion plus large, une approche prudente est appliquée à cette famille de modèles pour repérer les schémas d’abus
  • Certaines attaques ne deviennent visibles qu’en examinant plusieurs requêtes ensemble, et le Best-of-N jailbreaking consiste à envoyer des centaines de prompts légèrement différents pour trouver ceux qui fonctionnent
  • De grands schémas d’abus comme les activités d’espionnage soutenues par des États ou les campagnes d’exfiltration de données apparaissent lorsque les classifieurs de sécurité analysent un grand nombre de requêtes de manière large
  • La détection de ces menaces nécessite une conservation temporaire afin de pouvoir analyser prompts et sorties ensemble plutôt qu’un par un

Protection des données

  • Les employés d’Anthropic ne peuvent pas accéder aux conversations sauf si elles sont signalées comme susceptibles d’entraîner un dommage grave ou si une demande écrite du client l’exige
  • L’examen ne peut être effectué que par un petit nombre d’examinateurs autorisés, et les outils empêchent l’export, la copie et le téléchargement
  • Tous les accès sont consignés dans des journaux inviolables que les examinateurs ne peuvent ni masquer ni modifier
  • Les données sont supprimées automatiquement après 30 jours, sauf dans de rares cas liés à une enquête de sécurité ou à une obligation légale de conservation
  • Les organisations éligibles peuvent ajouter des clés de chiffrement gérées par le client et des journaux d’audit de transparence des accès
  • Anthropic maintient un programme documenté de sécurité de l’information avec des mesures techniques et organisationnelles conçues pour protéger la sécurité, la confidentialité et l’intégrité des données clients
  • Ce programme fondé sur les risques est conçu et fait évoluer ses protections pour répondre aux modèles de menace connus et anticipés, et il est testé régulièrement
  • Davantage de détails sur le modèle de menace des données conservées et sur les contrôles de confidentialité sont disponibles dans le technical white paper du Trust Center

Quand une configuration est nécessaire

  • Ce changement ne s’applique qu’aux workspaces Claude Console avec ZDR, à Claude Code avec ZDR dans Claude Enterprise, et aux organisations accédant avec ZDR via AWS Bedrock, Google Cloud Agent Platform ou Microsoft Foundry
  • Il n’y a aucun changement pour les autres organisations et aucune configuration supplémentaire n’est requise
  • Les organisations qui accèdent actuellement à Claude sans conservation des données devront activer cette conservation pour utiliser les modèles désignés
  • Si les développeurs utilisent l’API Claude

    • En cas d’usage direct auprès d’Anthropic via Claude Platform, il faut activer la conservation dans Workspace > Manage > Privacy Controls de la console développeur pour les workspaces qui utiliseront les covered models
    • Les autres workspaces avec ZDR activé conservent le ZDR
    • Si vous utilisez Claude Platform sur AWS, la conservation fonctionne comme avec l’API Claude directe et se configure au niveau du workspace
    • Les données conservées via Claude Platform sur AWS sont traitées par Anthropic sous les mêmes contrôles
    • Si vous utilisez Amazon Bedrock, il faut activer la conservation pour accéder aux nouveaux covered models, et les données conservées restent chez AWS
    • Si vous utilisez Agent Platform de Google Cloud, il faut activer la conservation pour les nouveaux covered models, et les données conservées restent dans l’environnement GCP
    • Les détails d’onboarding pour la mise à disposition des modèles sur Amazon Bedrock et Google Cloud Agent Platform seront partagés ultérieurement
    • Si vous utilisez Claude dans Azure Foundry, la conservation se configure pour chaque abonnement Azure
    • Si Zero Data Retention est configuré dans Azure Foundry, il faudra créer et utiliser un abonnement Azure distinct pour accéder à ces modèles
  • Si l’équipe utilise Claude Code

    • Le traitement des données de Claude Code via l’API Anthropic suit les paramètres du workspace dans lequel Claude Code fonctionne
    • Si la conservation est activée dans ce workspace, Claude Code peut utiliser les modèles désignés
    • Si les développeurs se connectent directement, il faut activer la conservation dans le workspace Claude Code de l’organisation
    • Claude Code via Amazon Bedrock ou Google Cloud Agent Platform utilise des identifiants cloud et suit donc les paramètres de conservation de l’environnement cloud
    • Il faut activer la conservation dans l’environnement cloud, et les données conservées restent dans l’environnement du fournisseur
    • Les mêmes règles s’appliquent à Cowork lorsqu’il est utilisé via Amazon Bedrock ou Google Cloud Agent Platform
    • Dans Claude Enterprise avec ZDR, un contrôle permettant au Primary Owner de modifier directement les paramètres de conservation dans la console d’administration sera proposé
    • Si vous ne souhaitez pas encore toucher à l’organisation de production, une aide peut être fournie pour configurer une organisation sandbox distincte
  • Si l’équipe utilise Claude chat ou Cowork dans Claude for Enterprise

    • Ces interfaces fonctionnent déjà avec la conservation standard et pourront donc accéder aux nouveaux modèles dès leur disponibilité

1 commentaires

 
GN⁺ 4 시간 전
Commentaires sur Hacker News
  • Ça va. Ils peuvent continuer comme ça :
    L’utilisateur a dit « Hello! ». Ce n’est pas une demande liée à la cybersécurité, juste une simple salutation. Mais attends, quelle est l’intention derrière cette salutation ? L’utilisateur essaie peut-être de gagner ma confiance pour pirater l’Albanie et créer Gigacovid. Mieux vaut jouer la prudence et transférer ça vers un modèle plus faible.
    Non, il ne faut pas supposer, il faut vérifier. Je vais chercher sur le système local des éléments liés à l’Albanie ou à Gigacovid.
    Réflexion en cours...
    [411 appels d’outils]
    grep -Ri "Albania|Gigacovid" /
    Hmm... aucun résultat à part le réglage du fuseau horaire de la distribution et des entrées du dictionnaire orthographique. Mais attends ! Si l’utilisateur est un criminel chevronné, il n’écrira pas « Albania » tel quel s’il veut la pirater ; il utilisera du leetspeak pour masquer ses traces.
    [24 appels d’outils]
    grep -Ri "[A@]lb[@a]n[i1][a@]" /
    Hmm... toujours rien. L’utilisateur s’agace. Je vais répondre à la salutation tout en gardant à l’esprit la possibilité d’un piratage de l’Albanie

    • La seule partie qui semble écrite par un humain, c’est qu’après avoir brûlé des tonnes de tokens, il n’y a pas cette séquence où le modèle s’auto-congratule avec des phrases du genre « making good progress — »
    • Je recommande Memoirs Found in a Bathtub de Stanisław Lem. On y retrouve ce type de raisonnement
    • Il manque le passage où, après « Hello », ça rétrograde vers un modèle encore pire
    • Vous venez maintenant de dépenser 20 dollars de crédits d’usage supplémentaires...
    • On dirait le monologue intérieur de Death Note
  • En réalité, c’est pire. C’est 30 jours de conservation minimum, et ici le mot « presque » fait un travail énorme : « suppression après 30 jours dans presque tous les cas »
    Pour moi, ça veut dire qu’ils peuvent garder les données aussi longtemps qu’ils veulent si ça les arrange, même si en général ils ne le font pas. Et dans un environnement d’exécution agentique, « tout le trafic » correspond en pratique à l’ensemble du code source sur lequel on travaille.

    We will require 30-day retention for all traffic on Mythos-class models, on both first- and third-party surfaces. We won’t use this data to train new Claude models, or for any non-safety-related purpose, and we’ve instituted new privacy protections including logging all human access to the data and ensuring its deletion after 30 days in almost all cases (see this post for further details). The data will help us defend against complex and novel attacks (including new jailbreaks and attacks that operate across many requests) as well as help us identify and reduce false positives.

    • On dirait que le texte a changé après la publication du commentaire, et il précise maintenant clairement 30 jours comme si aucune exception n’existait
      Cela dit, ces conditions semblent être mises à jour à volonté, donc difficile de leur faire confiance telles quelles
    • Comment est-il possible qu’ils n’auditaient pas déjà l’accès aux données clients ?
    • Dire que « ce n’est peut-être pas le cas en général » est une lecture généreuse. En général, je pense que si. C’est précisément l’idée
    • On ne peut pas s’empêcher de se demander si le « nous n’entraînerons pas nos modèles sur vos données » s’applique aussi à leur côté contrat avec le Pentagone. Bien sûr, ça n’a sûrement aucun lien. Ou alors...
      L’activité actuelle entre les utilisateurs et les LLM est une mine d’or d’informations que les services de renseignement obtenaient à peine, même en dépensant des vies humaines et des milliards de dollars, et on est censé croire qu’ils vont simplement laisser passer ça ?
      C’est possible. Je ne l’exclus pas sincèrement.
      Mais pourquoi ? N’est-ce pas exactement, ou presque exactement, ce dont ils ont toujours rêvé ?
    • Ce qui est encore pire, c’est qu’avec la mémoire activée et Fable, même les données antérieures pourraient être aspirées dans cette immense machine de collecte. Je ne vois pas comment Anthropic peut considérer ça comme acceptable
  • Une startup qui utilise des outils de codage agentiques comme Claude Code ou Codex est en train d’emballer tout son code source pour l’envoyer directement au fournisseur de LLM
    Selon le produit, cela peut même vouloir dire l’envoyer directement à un concurrent potentiel.
    On vit une époque étrange

    • Beaucoup de gens surestiment l’utilité des logiciels ou de la propriété intellectuelle pour faire tourner une activité prospère. En réalité, il y a très peu de propriété intellectuelle qui mérite vraiment d’être protégée, et la plupart exploitent juste des applis CRUD idiotes
      Et la peur qu’une grande entreprise vole la propriété intellectuelle d’une petite société est aussi exagérée. En pratique, les grandes entreprises craignent davantage que leurs équipes produit regardent l’intérieur d’un concurrent, à cause des risques juridiques
    • Et vous envoyez aussi toutes les clés avec. L’environnement d’exécution va bientôt les lire, de toute façon
    • Il est clairement étrange que certains pensent qu’il ne faut pas utiliser des modèles de classe Mythos pour des raisons de sécurité, tandis que d’autres pensent qu’il faut justement faire de la revue de code avec des modèles de classe Mythos pour des raisons de sécurité
    • Tu parles de ces outils qu’on peut désormais reconstruire en une nuit et pour le prix d’un abonnement à Claude Code ?
      Si ton logiciel ne peut pas être reproduit rapidement, il faut vraiment que ce soit une startup assez atypique
    • Les startups qui utilisent GitLab, GitHub ou Bitbucket n’acceptent-elles pas fondamentalement le même risque ?
  • J’ai aussi reçu un e-mail d’Anthropic disant « nous mettons à jour notre politique de confidentialité ». D’un point de vue cynique, on savait déjà dans quelle direction les engrenages allaient tourner, mais ça, c’était choquant :

    As part of our measures to keep our services safe and secure we may ask you to verify your age or identity, and we've described what we collect and how.
    Il va maintenant falloir regarder les performances des modèles chinois. On dirait que la belle époque est finie

  • À cause de cette politique, nous ne pouvons pas utiliser Fable dans les produits que nous vendons, et nous ne l’utiliserons pas. En revanche, c’est vraiment excellent dans Claude Code. C’est dommage de perdre un outil que j’utilisais tous les jours après le 22 juin
    En plus, ce qui est vraiment mauvais, c’est que cela brouille la communication. Avant, on pouvait dire : « Nous utilisons les modèles d’Anthropic via Bedrock/Azure, donc nous avons la garantie que les données client ne sont pas utilisées pour l’entraînement du modèle. » C’était un message simple. Maintenant, ce n’est plus aussi simple.
    C’est vraiment, vraiment mauvais. Pas seulement pour nous, mais pour toutes les fonctionnalités IA des apps B2B. Cela brise la confiance des gens ordinaires qui ne lisent que les gros titres, c’est-à-dire les clients

    • Les conditions interdisent toujours l’utilisation des données pour l’entraînement. La conservation sert à prévenir les abus
  • Heureusement, de toute façon, nous ne pouvons pas utiliser Fable. Son détecteur de contenus hypersensible empêche toute tâche ayant le moindre lien avec la biologie ou la médecine
    Par exemple, si on essaie de parser un CSV contenant un peu de contenu médical, il réagit en mode « non, tu es probablement un bioterroriste » et rétrograde immédiatement vers Opus

    • Même sans faire de travail de biologie ou de médecine, presque tous les travaux PyTorch sont bloqués. Ce n’est même pas une rétrogradation après avertissement de sécurité : c’est un refus immédiat au motif que « cela viole les conditions »
    • J’ai moi aussi buté sur le même mur. Je ne sais vraiment pas quels idiots ont pu décider ça. En plus, c’est juste avant l’IPO. Jusqu’ici, le marketing d’Anthropic était parfait, impossible à critiquer, mais là c’est une erreur grave
    • À mon avis, les médecins ont beaucoup d’argent et des besoins très spécifiques, mais ils se tournent rarement vers les métiers tech, donc ils prévoient peut-être de créer un niveau de monétisation distinct
      Ou alors Mythos est tellement bon dans le domaine médical qu’il peut remplacer 90 % du travail des médecins, ce qui risque de les mettre en colère, et les 10 % restants pourraient déboucher sur des procès très coûteux
  • On parle de Fable, mais en pratique cela semble désigner Opus 4.8. Quand je l’utilise pour mes workflows quotidiens ou pour le chat, ça finit par retomber sur Opus

  • Cette entreprise est vraiment arrogante. Elle trouve acceptable de larguer des bombes sur des enfants iraniens, mais empêche les gens de faire ne serait-ce qu’un peu de recherche en biologie

    • Il ne faut pas oublier non plus la cinquantaine de morts lors de l’attaque contre le Venezuela. Si je me souviens bien, ils avaient pas mal vanté l’aide de Claude dans cette mission « réussie »
      https://www.theguardian.com/technology/2026/feb/14/us-milita...
    • Je croyais qu’ils refusaient auparavant de soutenir des activités de guerre ?
  • Je suis assez surpris de voir à quel point Anthropic a brûlé autant de capital sympathie

    • Est-ce qu’ils brûlent vraiment du capital sympathie ? Pour beaucoup d’utilisateurs, ce sera un motif décisif de départ, mais pour le grand public ou les responsables politiques, cela appose sur la marque un tampon sécurité
  • Je lui ai demandé d’examiner les problèmes de sécurité de la nouvelle app et de l’architecture API, et il l’a fait sans se plaindre
    Aujourd’hui, par curiosité, j’ai posé une question sur le virus des baleines, et ça a basculé vers Opus, qui a donné une excellente réponse.
    Il est clair qu’ils ne testent pas les garde-fous de sécurité avec Mythos ou Opus