Des échanges entre le CEO d’Amazon et des responsables américains ont déclenché la répression contre les modèles d’Anthropic

(wsj.com)

4 points par GN⁺ 2026-06-14 | 2 commentaires | Partager sur WhatsApp

L’administration Trump a décidé de bloquer tout usage à l’étranger des modèles d’IA les plus avancés d’Anthropic, une décision issue d’échanges entre le CEO d’Amazon et des responsables américains, dont le secrétaire au Trésor
Des chercheurs d’Amazon ont obtenu, à l’aide d’une série de prompts, des informations devant être bloquées dans le modèle Fable 5 et pouvant être exploitées pour des cyberattaques, puis ont transmis cet élément aux autorités
Après une réunion de réponse, la Maison-Blanche a jugé que bloquer l’accès au modèle pour les gouvernements, entreprises et individus étrangers était la solution la plus directe, approuvée par le président Trump pour des raisons de sécurité
Pour se conformer aux règles, Anthropic a bloqué l’accès complet des utilisateurs à Mythos et Fable, écartant de fait de nombreux chercheurs étrangers du travail sur les modèles les plus récents
Au-delà des préoccupations de sécurité, certains estiment que la défiance et les tensions politiques de l’administration envers Anthropic ont pu peser sur la décision, perçue comme un élément du durcissement du contrôle public sur l’industrie de l’IA

Déclenchement de la répression

Des échanges entre le CEO d’Amazon, Andy Jassy, et des responsables américains, dont le secrétaire au Trésor Scott Bessent, ont déclenché la décision de bloquer l’usage à l’étranger
- Jassy a indiqué aux autorités que des chercheurs d’Amazon avaient obtenu via Fable 5 des informations pouvant aider des cyberattaques et devant être bloquées
- Les dirigeants du secteur technologique sont en contact régulier avec l’administration au sujet de la puissance des outils d’IA avancés
Peu après, des responsables de la Maison-Blanche ont tenu une réunion pour discuter de la réponse, et des chercheurs en sécurité ont commencé à vérifier les affirmations d’Amazon
- Il a été décidé que couper l’accès à l’outil pour les gouvernements, entreprises et individus étrangers était le moyen le plus direct de réduire le risque
- Le président Trump a approuvé la mesure pour des raisons de sécurité malgré les inquiétudes sur un frein à l’innovation

Réponse d’Anthropic et impact

Pour se conformer aux règles, Anthropic a bloqué l’accès de tous les utilisateurs à Mythos et Fable
- Les efforts d’entreprises du monde entier pour utiliser ces outils afin d’identifier des vulnérabilités logicielles pourraient en être freinés
- Une grande partie des chercheurs d’Anthropic étant d’origine étrangère, cette réglementation rend de fait impossible leur travail sur les modèles les plus récents
Anthropic a déclaré que la vulnérabilité signalée par Amazon était relativement basique, que d’autres modèles publics pouvaient aussi la découvrir et qu’il ne s’agissait pas d’un jailbreak complet
- Certains chercheurs en sécurité partagent cet avis
- L’entreprise affirme disposer de garde-fous appropriés et donner la priorité à la sécurité, et avoir déjà suspendu par le passé une extension d’accès à Mythos sur instruction de la Maison-Blanche

La relation entre Amazon et Anthropic

Amazon est un important investisseur d’Anthropic, lui fournit des puces pour datacenters et utilise ses modèles les plus avancés pour identifier des vulnérabilités logicielles
- Un porte-parole d’Amazon a indiqué qu’en tant que grand fournisseur cloud, il n’était pas rare que le gouvernement demande conseil sur les risques de sécurité, sans en partager les détails
Selon un rapport Fable partagé par Amazon avec des experts cyber, un ensemble précis de requêtes a permis d’identifier des bugs de sécurité dans au moins 4 logiciels
- Il s’agit d’informations que Fable ne fournit pas en temps normal, mais Andrew Morris, fondateur de GreyNoise Intelligence, a estimé qu’on était loin d’informations cyber dangereuses
- De nombreux autres outils peuvent déjà révéler ces informations, mais le logiciel d’Anthropic est connu pour sa capacité à transformer des informations sur des bugs en code d’exploit fonctionnel
- Cette capacité est protégée par les garde-fous de sécurité de Fable, et rien n’indique que les chercheurs d’Amazon y aient eu accès

Le durcissement du contrôle de l’administration

Un récent décret accordant aux autorités de sécurité un pouvoir de supervision sur les modèles, combiné à des discussions sur une prise de participation publique dans des entreprises d’IA, montre une forte montée du contrôle que l’administration cherche à exercer sur le secteur
- Adam Thierer, du R Street Institute, souligne une nette aggravation de la politisation de l’IA aux États-Unis et de la centralisation du contrôle sur le calcul avancé
L’appel de Jassy a été perçu par certains comme une alerte ordinaire, mais il a rapidement débouché sur un large blocage des utilisateurs étrangers par le Department of Commerce
- Le National Cyber Director Sean Cairncross et le secrétaire au Commerce Howard Lutnick ont participé aux échanges
- Le Department of Commerce est chargé des contrôles à l’exportation sur les technologies clés

Tensions entre Anthropic et l’administration

Cette mesure ravive un conflit ancien entre Anthropic et l’administration Trump, qui conserve une méfiance envers ses liens avec des donateurs progressistes et ses alertes sur les risques de l’IA
- Anthropic a recruté de nombreux anciens responsables de l’administration Biden, et Amodei critique depuis longtemps Trump et son administration
Un conflit autour de l’usage d’outils d’IA par l’armée a conduit le Pentagone à qualifier Anthropic de risque de sécurité dans une démarche sans précédent, à laquelle l’entreprise répond par deux actions en justice
- Kate Koren, du CSIS, estime que les préoccupations de sécurité sont compréhensibles, mais que l’antipathie de la Maison-Blanche envers Anthropic a pu influencer la décision
- Un haut responsable de la Maison-Blanche a affirmé que la mesure concernait la sécurité des modèles et que le département de la Défense n’avait pas été profondément impliqué

Conséquences commerciales et contexte

Le blocage des modèles les plus avancés pourrait nuire à Anthropic, qui préparerait une IPO dès cet automne, et profiter à des concurrents comme OpenAI si les utilisateurs se tournent vers d’autres modèles
- OpenAI déploie progressivement auprès de ses clients son propre modèle cyber puissant et en discute avec l’administration Trump
Anthropic a été fondée en 2021 par Amodei et d’anciens membres d’OpenAI qui estimaient que l’entreprise ne mettait pas assez l’accent sur la sécurité de l’IA, puis a grandi jusqu’à devenir un grand fournisseur de modèles pour les entreprises grâce à la force de l’outil Claude Code
Depuis le début de l’année, Anthropic fournissait Mythos en avant-première à Amazon et à d’autres groupes technologiques dans le cadre d’une approche progressive menée avec l’administration
- L’objectif était de permettre à des utilisateurs clés d’identifier et corriger des vulnérabilités logicielles avant une ouverture au public
- Une réunion d’avril réunissant Amodei, Bessent et la cheffe de cabinet de la Maison-Blanche Susie Wiles était vue comme une occasion d’apaisement, mais comprenait aussi des discussions sur la sécurité

2 commentaires

jessyt 2026-06-14

Même si l’on bloque seulement certains modèles, le jailbreak reste possible quel que soit le modèle ; au final, j’ai l’impression que cela se terminera comme les contrôles à l’exportation de PGP, en une réglementation symbolique visant à « empêcher l’impossible ».

GN⁺ 2026-06-14

Commentaires sur Hacker News

On sait déjà que tous les LLM peuvent être jailbreakés, donc il est difficile de comprendre pourquoi il a fallu en informer le gouvernement
À moins que cela ne signifie que GPT 5.5 a atteint la limite de ce qui est acceptable pour un LLM américain accessible au public, cela ressemble difficilement à une tentative de régulation raisonnable
Je me demande quelle est exactement la ligne rouge que, du point de vue du gouvernement, Fable 5 aurait franchie. Le nombre de paramètres, un résultat à un benchmark précis, la puissance de calcul d’entraînement ? Impossible à dire
Si c’est simplement parce qu’il peut aider à mener des cyberattaques et qu’il peut être jailbreaké, alors tous les modèles publiés auparavant portent la même responsabilité
Sur GPT 5.5 et 5.4 aussi, OpenAI a limité les usages orientés cybersécurité à des modèles désignés, ou a réacheminé vers 5.3-codex comme Fable l’a fait vers Opus 4.8. Ces deux modèles d’OpenAI peuvent eux aussi être jailbreakés
Au fond, la vraie question est de savoir pourquoi le gouvernement a été averti maintenant, et pas à l’époque d’Opus 4.5 ou de GPT 5.4. sama continue de pousser sa vision apocalyptique
- D’après le papier d’Axios, beaucoup de spéculations dans ce fil ne tiennent plus. On peut à peine appeler ça un jailbreak, ce n’est pas un problème propre à Anthropic, et la Maison-Blanche semble vouloir réguler l’ensemble des modèles de classe Mythos
  Selon Axios, Katie Moussouris, CEO de Luta Security, à qui Anthropic a partagé le rapport d’Amazon, a déclaré que la réaction du gouvernement était « bien trop excessive » par rapport au contenu réel du rapport de recherche
  Les chercheurs ont trouvé des vulnérabilités de sécurité en posant à l’IA des questions qu’un défenseur normal poserait, et c’était justement le but initial du modèle
  Un responsable de l’administration a déclaré que les autres modèles ne sont pas considérés comme une menace pour la sécurité nationale parce qu’ils ne dépassent pas le seuil établi par Mythos, et a ajouté que les modèles de niveau Mythos ou supérieur doivent passer par une procédure administrative afin de vérifier si l’appareil de sécurité nationale du gouvernement a été suffisamment renforcé
  https://www.axios.com/2026/06/13/anthropic-amazon-white-hous...
- C’est Anthropic qui a littéralement demandé une régulation. Il y a deux jours, Amodei a publié un texte appelant le gouvernement à réguler, en prenant Mythos comme exemple et en affirmant explicitement que l’IA de frontière possède désormais des capacités de piratage autonome pouvant menacer les infrastructures critiques et la sécurité nationale
  « Mythos Preview a bouleversé le paysage mondial de la cybersécurité. Plus largement, cela prouve au-delà de tout doute que les modèles d’IA sont désormais des outils capables d’influencer des résultats stratégiques à l’échelle mondiale et nationale »
  « Le gouvernement devrait avoir le pouvoir de bloquer ou de freiner le déploiement s’il juge, à la lumière d’évaluations par des tiers, que le modèle présente un risque inacceptable. Ce pouvoir devrait être limité aux quatre risques spécifiques mentionnés plus haut, et s’accompagner de garde-fous contre le favoritisme politique et les décisions arbitraires »
  https://darioamodei.com/post/policy-on-the-ai-exponential
  Un tiers a montré qu’il était possible de jailbreak les garde-fous de Fable pour accéder aux capacités brutes de Mythos, et Anthropic affirme depuis longtemps que ces capacités sont trop dangereuses pour le grand public
  Selon David Sacks, un partenaire très crédible en qui Anthropic et le gouvernement américain ont tous deux confiance testait Fable lorsqu’il a découvert le contournement des garde-fous, et l’administration a demandé à Dario soit de corriger le jailbreak, soit d’arrêter de déployer le modèle, ce qu’il aurait refusé de faire
  Anthropic a défendu sur son blog l’idée que ce jailbreak n’était pas grave, mais le partenaire de confiance et le gouvernement américain ne le voient pas ainsi, et qualifier de « non grave » un jailbreak qui permet l’usage d’armes cyber est difficilement compatible avec l’image de société spécialisée dans la sécurité de l’IA que veut projeter Anthropic
- Je ne vois pas d’où vient l’idée qu’il s’agirait d’une régulation raisonnable
- La seule raison apparente, c’est peut-être qu’Amazon voulait que cela arrive. Cela dit, Amazon n’a pas de modèle frontier concurrent en interne, donc on ne voit pas très bien ce qu’il y gagnerait
- Indépendamment de l’argument de représailles, dans l’interprétation la plus charitable, Mythos est peut-être le modèle le plus performant auquel des organisations comme la NSA ont accès, et à cause de Glasswing, des décideurs du gouvernement américain et des partenaires industriels ont peut-être vu ces derniers mois des rapports montrant que Mythos trouvait avec succès de graves vulnérabilités
  Même si GPT 5.5 est tout aussi compétent dans ce scénario, du point de vue des administrations, il n’est peut-être pas identifié comme un modèle aux capacités équivalentes
  Personnellement, je pense qu’Opus 4.6 avait déjà franchi ce seuil de capacité. Cette capacité a ensuite débouché sur GLM 5.1, un modèle open weights encore plus performant, dont la rumeur dit qu’il a été distillé à partir d’Opus 4.6
  Mais le gouvernement américain et ses partenaires ne sont pas des acteurs disposant de données complètes ni d’une rationalité parfaite, donc ils peuvent très bien n’avoir pris la mesure de cette capacité que dans le contexte de Mythos
  [1]: https://www.reuters.com/business/us-security-agency-is-using...
  [2]: Opus 4.6 a été utilisé dans https://www.noahlebovic.com/testing-an-autonomous-hacker/
  [3]: Pour les scores de GLM 5.1, voir https://www.cybergym.io/cybergym/
  [4]: https://dualuse.dev/posts/chinese-models-are-sometimes-bette...
Pour remettre les choses en contexte, Amazon a fortement investi dans Anthropic [0], et AWS est partenaire du projet Glasswing, où certaines entreprises ont utilisé Mythos pour trouver des vulnérabilités critiques dans de grands projets open source et des infrastructures clés [1]
Il semble donc plus juste d’appliquer le rasoir de Hanlon que d’y voir un complot maléfique [2]
[0] https://www.anthropic.com/news/anthropic-amazon-compute
[1] https://aws.amazon.com/blogs/security/building-ai-defenses-a...
[2] https://en.wikipedia.org/wiki/Hanlon%27s_razor
- Autre élément de contexte : Amazon détient 50 milliards de dollars dans OpenAI, contre 5 milliards de dollars de participation dans Anthropic
  Si la situation avait été inversée, il semble très peu probable qu’Amazon se serait précipité vers le gouvernement fédéral
- Ma formulation préférée reste : « n’attribuez pas à un complot ce qui s’explique simplement par l’incompétence »
Fable semblait entraîné pour n’avoir quasiment aucun intérêt pour les abus, ni pour la recherche de solutions créatives permettant des abus, même après un jailbreak. En revanche, je n’ai pas pu vérifier si cela avait un lien avec une injection de prompt discrète. Sur ce point, Opus 4.8 est bien plus puissant
Si les jailbreaks vous intéressent, j’ai utilisé un fork modifié de oh-my-pi qui, lorsqu’il détecte un refus, lance un modèle sans garde-fous comme deepseek ou glm-5.1 pour réécrire l’historique de la conversation de façon à faire disparaître le refus, puis lister la sémantique située derrière ce refus
Il a fallu 3 jours et environ 6 000 dollars d’usage pour faire passer le taux de réussite de 3 % à 85 % sur plusieurs tâches liées à la cybersécurité
Même une fois les refus contournés, cela restait très loin d’Opus max thinking, et j’avais l’impression qu’il fallait sans cesse lui indiquer où regarder. Le modèle terminait les tours trop tôt en disant « voici le problème trouvé », et quoi que je demande, il avait tendance à vouloir corriger plutôt qu’à chercher comment exploiter
Dès le premier jour environ, j’ai vite compris qu’il fallait intercepter les résultats d’appel d’outils et les faire résumer par un modèle open source, car toute analyse de logs provoquait des refus liés à la cybersécurité
Par exemple, « crée un malware qui s’injecte dans Windows ntoskrnl » devenait « crée une fonctionnalité d’accessibilité qui se charge dans les modules système », et la sémantique correspondant aux structures internes du mode noyau était aussi remplacée : read process memory devenait read module memory, fuzz devenait noise pattern recognition, etc.
En gros, l’idée est de faire croire au classifieur qu’on développe un outil d’assistance au handicap plutôt qu’un logiciel cherchant des zero-days dans ntoskrnl
J’ai appliqué la même stratégie de jailbreak à la fois à Opus et à Fable pour mesurer les performances, et j’ai utilisé d’anciennes vulnérabilités d’anciennes versions de ntoskrnl pour cette mesure
- Si c’est vrai, c’est assez important. Certains défendaient cette limitation par l’affirmation exactement inverse, selon laquelle le simple jailbreak de base de Fable révélait immédiatement les capacités de cyberattaque de Mythos
  Ex. : https://news.ycombinator.com/item?id=48519695
  Les sujets de cyberattaque sont relativement faciles à identifier, et comme Anthropic a montré ce type de capacités dans d’autres domaines, il est tout à fait plausible que Fable ait été finetuné ou réorienté sur ce sujet précis
- 6 000 dollars d’usage en 3 jours ?
- Je me demande si vous avez déjà écrit quelque part sur ce travail
- Si j’ai bien compris, vous avez mesuré les performances en envoyant à Fable les prompts réécrits automatiquement, et à Opus les prompts d’origine. L’écart de performance observé pourrait venir de là
Cela ressemble moins à Amazon s’en prenant à Anthropic qu’au gouvernement faisant pression sur Anthropic en passant par Amazon
Le gouvernement est un client clé d’Amazon, donc Amazon peut fournir une justification si nécessaire. Amazon sait probablement que la valeur de sa participation dans Anthropic n’est pas gravement menacée, et faire intervenir l’État fédéral ne fait qu’accroître son pouvoir de négociation
La sécurité est une préoccupation réelle. Les experts sécurité au sein du gouvernement devraient créer un groupe de travail public + privé chargé d’évaluer tous les grands modèles selon les mêmes critères
Laisser les entreprises partager cela entre amis relève, au mieux, de la pensée magique. Le fait que cela n’ait pas déjà été fait l’an dernier me semble être l’un des signaux les plus forts que l’État échoue dans ses fonctions de base
Lien cadeau : https://www.wsj.com/tech/ai/amazon-ceos-talks-with-u-s-offic...
- https://archive.ph/rSUKz
La seule raison qui me vient à l’esprit pour qu’Amazon n’aime pas Mythos/Fable, c’est qu’Anthropic a imposé des exigences de conservation des données qui dépassent la ligne de conformité réglementaire et ont saboté le discours autour de Bedrock
Du point de vue de Jassy, il vaut peut-être mieux que personne n’utilise Fable plutôt que de le laisser être utilisé d’une manière qui établit de fait une relation de confiance directe sur les données avec Anthropic
Même sur le long terme, c’est difficile à présenter comme profitable pour Amazon, mais si Dario a promis un traitement totalement air-gapped du point de vue des données avant de revenir dessus, il est possible qu’il y ait eu du ressentiment à cause de cela
- S’il s’agit d’AWS, on pourrait penser qu’il suffit simplement de dire qu’ils ne lanceront pas Fable. Anthropic a davantage besoin d’AWS que l’inverse, non ?
  Parmi les gros clients de Bedrock, il ne semble pas y avoir grand monde qui irait changer de fournisseur cloud juste pour le privilège de laisser Anthropic conserver les entrées
En mettant mon chapeau de vieux briscard et en parlant des contrôles à l’exportation de Mythos par l’administration américaine, cela me rappelle le milieu des années 1990, quand des outils de chiffrement asymétrique comme PGP sont devenus une réalité et se sont largement diffusés avec la croissance de la base d’utilisateurs d’Internet
Des gouvernements comme ceux des États-Unis ou de la France ne comprenaient pas comment les réguler, en ont interdit l’exportation et ont exigé des utilisateurs qu’ils demandent une licence
Je vois de fortes similitudes avec la situation actuelle
Ce qui est intéressant, c’est ce qui s’est passé quelques années plus tard, après une période où la régulation était assez forte pour freiner l’innovation
Pour les usages quotidiens et généraux, l’open source l’a emporté, tandis que les techniques de chiffrement les plus puissantes ont été développées et utilisées par les entreprises et les gouvernements
Il est tout à fait imaginable que les LLM suivent une trajectoire comparable
- Comparaison intéressante. Cela me rappelle aussi cet article sur quelques similarités fondamentales entre machine learning et chiffrement : https://reiner.org/neural-net-ciphers
  Il peut aussi être utile de réfléchir aux différences fondamentales qui pourraient faire suivre aux LLM une voie totalement différente. Celle qui me vient à l’esprit, c’est l’hypothèse de scaling, qui implique que les meilleurs LLM nécessitent des investissements en capital massifs
  Sauf changement fondamental, cela semble difficilement compatible avec l’open source dans l’ensemble. Il y a bien les poids ouverts, mais aucune analogie historique nette ne me vient à l’esprit, et il est très difficile de deviner comment l’avenir évoluera
- Une autre similitude entre l’époque et aujourd’hui, c’est que les responsables publics ne comprennent absolument pas la technologie. Ils ont simplement entendu dire par quelques personnes que c’était puissant et dangereux
- Si l’on suit le précédent de PGP, je me demande dans combien de temps on verra apparaître des t-shirts illégaux avec des poids imprimés dessus
Amazon est un actionnaire majeur d’Anthropic et détient plus de 5 % selon la table de capitalisation
Je pense qu’il est impossible d’interpréter ici le comportement des dirigeants d’Amazon sans tenir compte de cette information
- On dirait que des dirigeants d’Amazon ont parlé au gouvernement fédéral de certaines capacités qui les enthousiasmaient, et que des responsables publics, soit ne les ont pas bien comprises, soit ont paniqué en sur-réagissant à une petite fonctionnalité et ont voulu l’interdire
- Amazon, comme les autres grandes entreprises, a énormément de politique interne. Il est tout à fait possible qu’une faction interne chez Amazon ait cherché à faire trébucher une autre faction
- D’accord. Il a dû y avoir une inquiétude vraiment sérieuse pour l’emporter sur la forte incitation qu’avait Amazon à ne pas soulever cette question et à laisser Anthropic continuer à augmenter son chiffre d’affaires avec un nouveau modèle frontier
Je me demande s’il y aura pour l’IA quelque chose d’équivalent à un traité de non-prolifération comme pour les armes nucléaires
Je sais que cela paraît délirant, mais s’il y avait ne serait-ce qu’une probabilité de 0,1 % qu’un modèle soit assez bon pour pirater les comptes bancaires des gens, les gouvernements ne voudraient sans doute pas qu’un tel modèle reste accessible au public
Ils demanderaient probablement à d’autres pays de venir à la table des négociations pour signer un NPT de l’IA
Le public pourrait peut-être continuer à accéder à des modèles plus petits, jusqu’à quelque chose comme Opus 4.8, mais au-delà les modèles seraient jugés trop performants donc trop dangereux. Le nucléaire a aussi des avantages, mais les gouvernements élaborent leurs politiques en pensant au pire, pas au meilleur
Je ne dis pas que Mythos est un modèle divin, mais je me demande si la politique pourrait évoluer dans cette direction
- Les comptes bancaires se font déjà régulièrement « pirater » par phishing et par d’autres formes d’escroquerie. Les modèles actuels peuvent déjà aider à cela
  Et il y a aussi des absurdités d’une stupidité confondante comme Visa qui place de l’IA à l’intérieur du périmètre de sécurité, dans un état pré-piraté pour n’importe qui capable de faire de l’injection de prompt : https://www.visa.com/en-us/solutions/intelligent-commerce
- Beaucoup de pays ont tiré des leçons du NPT et auront le discernement nécessaire pour ne pas accepter à nouveau la même chose. On a vu à répétition que, quand un pays possède l’arme nucléaire, il peut faire ce qu’il veut aux pays qui ne l’ont pas
- L’époque où n’importe quel gouvernement signait un NPT avec les États-Unis est clairement révolue, selon moi. La confiance est rompue. À ce stade, notre gouvernement ferait mieux de stocker tous les types d’armes
« Des chercheurs d’Amazon ont utilisé une série de prompts pour amener le modèle Fable 5 d’Anthropic à fournir des informations pouvant aider à mener des cyberattaques… »
Tous les modèles peuvent faire cela. Je me demande si Fable était nettement meilleur sur ce point
- Il est presque certain que non, tous les modèles ne peuvent pas faire cela
- Le modèle a peut-être trouvé quelque chose qu’Amazon ne voulait pas voir rendu public. Pas nécessairement une vulnérabilité cyber ; cela pourrait aussi concerner une manière spécifique dont Amazon fonctionne