1 points par GN⁺ 5 시간 전 | 6 commentaires | Partager sur WhatsApp
  • En vertu d’un ordre de contrôle des exportations pris par le gouvernement américain au nom de prérogatives de sécurité nationale, l’accès à Fable 5 et Mythos 5 est bloqué pour tous les ressortissants étrangers, qu’ils se trouvent aux États-Unis ou ailleurs, et le service est immédiatement suspendu pour l’ensemble des clients afin de respecter la réglementation
  • L’ordre a été reçu à 17 h 21, heure de l’Est, et la nature précise des préoccupations de sécurité nationale n’y est pas indiquée
  • Le fondement avancé par le gouvernement semble être sa prise de connaissance de techniques de jailbreaking de Fable 5, mais les vulnérabilités identifiées par ces techniques sont déjà connues et de portée mineure, et peuvent aussi être découvertes sans contournement avec d’autres modèles publics
  • Avant le lancement, Anthropic a mené des milliers d’heures de tests de red teaming avec le gouvernement américain, le UK AISI et des organismes externes, et aucun testeur n’a trouvé de jailbreak universel
  • Anthropic n’est pas d’accord avec l’idée qu’une possibilité de jailbreak de portée limitée justifie le retrait d’un modèle commercial utilisé par des centaines de millions de personnes, et estime que si le même standard était appliqué aux autres fournisseurs de modèles, le déploiement de nouveaux modèles serait de fait interrompu

Contenu de l’ordre et effet immédiat

  • Le gouvernement américain a émis un ordre de contrôle des exportations en invoquant des prérogatives de sécurité nationale, mettant fin à l’accès à Fable 5 et Mythos 5 pour tous les ressortissants étrangers (y compris les employés d’Anthropic de nationalité étrangère), qu’ils se trouvent aux États-Unis ou non
  • En conséquence, afin de se conformer à la réglementation, Anthropic a désactivé brusquement Fable 5 et Mythos 5 pour l’ensemble des clients
    • L’accès à tous les autres modèles d’Anthropic n’est pas affecté
  • L’ordre a été reçu le jour même à 17 h 21, heure de l’Est, et la lettre ne contenait aucun détail précis sur les préoccupations de sécurité nationale

Fondement supposé des inquiétudes du gouvernement

  • Le gouvernement semble avoir pris connaissance de techniques de contournement par jailbreaking visant Fable 5
  • Après examen de la démonstration de cette technique, il apparaît qu’elle servait à identifier un petit nombre de vulnérabilités mineures déjà connues
    • Ces vulnérabilités sont relativement simples et peuvent tout autant être découvertes avec d’autres modèles publics, sans contournement

Position d’Anthropic sur les garde-fous de Fable

  • Anthropic affirme avoir mis en place de solides garde-fous réduisant fortement le risque d’usage abusif, notamment dans des tâches de cybersécurité, au point que de nombreux utilisateurs se sont plaints qu’ils soient trop larges
  • Pendant plusieurs semaines avant le lancement, l’entreprise a mené au total des milliers d’heures de validation par red teaming avec le gouvernement américain, le UK AISI, plusieurs organismes tiers privés et ses équipes internes
  • Selon Anthropic, ces tests ont confirmé que les garde-fous de Fable sont nettement plus efficaces en pratique que ceux de tout autre modèle déjà déployé
  • Aucun testeur n’a trouvé de jailbreak universel (une méthode permettant de contourner largement les garde-fous du modèle pour débloquer diverses capacités cyber)

Limites d’une défense totale contre le jailbreak

  • À l’heure actuelle, Anthropic estime qu’aucun fournisseur ne peut garantir une résistance totale au jailbreak, et que tous les garde-fous du secteur restent vulnérables à des jailbreaks non universels (obtenir, dans certaines situations précises, une partie d’informations cyber)
    • Un jailbreak universel pourrait lui aussi être découvert à l’avenir, ce qui avait été clairement indiqué lors du lancement de Fable 5

Stratégie de defense in depth

  • Face à l’impossibilité d’une défense parfaite, Anthropic adopte une stratégie de defense in depth, visant à limiter le jailbreak à des cas étroits (non universels) ou à le rendre très coûteux (universel), tout en s’appuyant sur une surveillance rigoureuse pour détecter et bloquer rapidement les attaques
    • Dans ce cadre, Anthropic exige pour Fable une conservation des données clients pendant 30 jours ; cela entraîne un coût réel pour les clients, mais rend possibles la recherche et l’atténuation des jailbreaks
  • L’entreprise maintient cette stratégie multicouche, estimant qu’elle réduit le risque à un niveau comparable à celui des modèles déjà déployés dans l’ensemble du secteur
  • Anthropic dit n’avoir reçu aucun signalement de jailbreak non universel préoccupant ayant conduit à des effets nuisibles, et affirme que tous les jailbreaks potentiels qui lui ont été communiqués ont produit soit des réponses inoffensives, soit des constats mineurs sans avantage propre à Mythos

Vérification des éléments présentés par le gouvernement

  • À ce stade, le gouvernement n’a fourni que des éléments oraux, portant sur un jailbreak non universel de portée limitée consistant à demander au modèle de lire une base de code donnée et de corriger des défauts logiciels
  • Anthropic dit n’avoir connaissance que d’un seul jailbreak potentiel partagé avec le gouvernement et, après examen du rapport qui serait à l’origine de l’ordre, affirme avoir confirmé que le niveau de capacité présenté est déjà largement disponible sur d’autres modèles, dont GPT-5.5 d’OpenAI
    • Il s’agit, selon l’entreprise, d’une capacité utilisée chaque jour par les défenseurs chargés de protéger les systèmes
  • Des détails supplémentaires devraient être partagés dans les 24 prochaines heures

Réponse et position d’Anthropic

  • Anthropic a supprimé l’accès à Fable 5 et Mythos 5 pour tous les utilisateurs afin de se conformer à l’ordre légal du gouvernement
  • L’entreprise ne considère toutefois pas qu’un potentiel jailbreak de portée limitée justifie le retrait d’un modèle commercial déployé auprès de centaines de millions de personnes
    • Selon elle, si ce même standard était appliqué à l’ensemble du secteur, le déploiement de nouveaux modèles frontier serait pratiquement à l’arrêt
  • Le gouvernement doit pouvoir empêcher des déploiements dangereux, mais cela devrait relever d’une procédure juridique transparente, équitable, claire et fondée sur des faits techniques, ce qui n’est pas le cas ici selon Anthropic
  • L’entreprise présente ses excuses pour la confusion causée aux clients, considère qu’il s’agit d’un malentendu et dit travailler à rétablir l’accès aussi vite que possible

6 commentaires

 
clumsily 3 시간 전

Même après l’avoir lu plusieurs fois, j’ai l’impression qu’à force de faire tout un tapage en répétant que leur modèle était dangereux, ils se sont finalement tiré une balle dans le pied.
Difficile de savoir si ce sera un succès ou un échec marketing à l’avenir, mais pour l’instant, ça ressemble à un échec.

 
unsure4000 3 시간 전

Vu l’afflux potentiel d’utilisateurs vers Anthropic après l’affaire du Pentagone, je pense qu’à l’approche de l’IPO, il n’y a absolument aucune raison pour qu’Anthropic y perde.
Et pour étouffer des problèmes comme ceux des garde-fous, s’ils arrêtent tout simplement de proposer le modèle comme service, il ne pourra de toute façon plus être vérifié, donc c’est parfait pour eux.

 
kirinonakar 4 시간 전

Les entreprises d’IA n’ont désormais plus aucune raison de développer des modèles plus performants. On dirait bien que l’évolution de l’IA s’arrête ici.

 
lsdcnu 2 시간 전

C'est quoi ce truc... mdr

 
unsure4000 5 시간 전

Y compris les employés d'Anthropic de nationalité étrangère

MDRRRRRRRRRRRRRRRRRRRRRRRR

 
GN⁺ 5 시간 전
Commentaires Hacker News
  • Ils ont passé leur temps à faire du marketing par la peur pour vendre leur modèle comme s’il avait une avance énorme sur les autres, donc on peut dire qu’ils en paient le prix maintenant
    On dirait qu’ils ont enfin trouvé le public adéquat de pigeons prêts à les croire

    • À l’approche de l’IPO, pouvoir tweeter à quel point leur modèle est effrayant et puissant, c’est de la bonne pub pour Anthropic
    • Ce n’est pas un problème propre à Anthropic. C’est une lutte de pouvoir, et tous ceux qui utilisent cette technologie y perdent. Il n’y a pas de quoi se réjouir
    • Quel prix ? C’est le meilleur marketing qu’ils pouvaient espérer
    • À lire tout ça, il semble très probable que l’administration Trump aurait ciblé Anthropic même sans ce « marketing par la peur »

      Jusqu’à présent, tout ce que le gouvernement nous a présenté n’est qu’une preuve orale d’un jailbreak potentiellement étroit et non généralisable, consistant essentiellement à demander au modèle de lire une base de code spécifique et de corriger des défauts logiciels. À notre connaissance, un seul jailbreak potentiel a été partagé avec le gouvernement. Nous avons examiné ce rapport et confirmé que le niveau de capacité qui y apparaît est largement disponible dans d’autres modèles, y compris GPT-5.5 d’OpenAI, et qu’il est utilisé quotidiennement par les défenseurs chargés de la sécurité des systèmes

    • C’est ce type de mesure qu’Anthropic voulait, et ils voulaient qu’elle s’applique à tous les autres fournisseurs de modèles de frontière qui lancent des modèles puissants, eux compris

      Comme nous l’avons déclaré publiquement, nous pensons que le gouvernement devrait pouvoir bloquer les déploiements dangereux dans le cadre d’une procédure judiciaire transparente, équitable, claire et fondée sur des faits techniques. La mesure actuelle ne suit pas ces principes
      Au final, on dirait qu’ils ont obtenu ce qu’ils voulaient

  • On dirait qu’on entend d’innombrables entreprises et utilisateurs miser encore plus sur les modèles chinois
    Que d’autres pays aient accès à de tels modèles peut relever de la sécurité nationale américaine. Mais désormais, la dépendance d’autres pays à l’égard de tels modèles, et plus largement des technologies américaines en général, devient elle aussi un enjeu de sécurité nationale

    • Je me demande de quels modèles on parle. J’aimerais voir des hypothèses plus précises. L’idée, c’est que 20 à 50 % des utilisateurs d’Anthropic basculeraient vers DeepSeek ?
    • Le plus gros Qwen 3.7 n’est-il pas un modèle fermé ? J’ai du mal à croire que la politique chinoise serait moins brutale sur ce point
    • Attendez le jour où télécharger ou utiliser des modèles chinois deviendra illégal, à moitié une blague
  • Logiquement, n’est-on pas forcé de conclure que les États-Unis ont atteint la limite supérieure des capacités de modèle qu’ils autorisent à rendre publiques ? Avec un précédent pareil, pourquoi investir dans des modèles encore plus intelligents ?
    Plus important encore peut-être : si un modèle comme Mythos, qui n’est au mieux qu’une amélioration incrémentale par rapport à Opus, est traité ainsi, comment récupérer le moindre investissement IA fondé sur l’hypothèse d’ASI/AGI/modèles bien meilleurs ?

    • La conclusion la plus plausible me semble plutôt être que l’administration est en colère contre Anthropic et utilise l’outil dont elle dispose pour une mesure de rétorsion
      Si OpenAI ou Grok opéraient au même niveau, je doute qu’ils se prendraient le bâton du gouvernement avec autant de vigueur
    • Je ne le vois pas comme ça. À une époque, même la PlayStation 2 était jugée trop puissante pour être exportée : https://www.pcmag.com/news/20-years-later-how-concerns-about...
      ChatGPT 2 aussi a un temps été considéré comme trop puissant pour être rendu public
      L’IA avance plus vite que la culture et les mentalités. Une fois qu’on se sera habitués à ce que ces modèles peuvent faire, les contraintes se relâcheront un peu, puis l’amélioration incrémentale suivante recommencera tout le cycle. Ça se passe toujours comme ça
    • Je pense qu’à l’avenir, les meilleurs modèles de frontière ne seront proposés que sous une forme contrôlée aux plus riches
    • Cette « technologie » est accessible à quiconque a assez d’argent pour entraîner de nouveaux modèles. Donc, indépendamment du fait que cette bulle éclate bientôt ou non, il suffira d’attendre quelques mois pour qu’un autre acteur propose un modèle comparable
      C’est le résultat du spectacle à l’américaine autour des grands modèles de langage. Cette fois, ça leur revient simplement en boomerang
    • Il y a 95 % de chances que cette mesure soit annulée d’ici lundi matin, donc voilà la réponse
  • Que les modèles soient vraiment dangereux ou non à l’avenir, les affirmations de risque sur les futurs modèles risquent désormais de disparaître
    Si le gouvernement peut ordonner au hasard à tous les étrangers, aux États-Unis comme hors des États-Unis, de cesser d’utiliser un modèle, plus personne n’acceptera de prendre le risque de bâtir quelque chose d’important dessus. À terme, ce ne sera qu’une question de temps avant que des entreprises étrangères rattrapent leur retard et prennent le marché commercial de ces modèles. Sauf que, comme souvent, les États-Unis interdiront probablement les concurrents, de sorte qu’en pratique seuls les backends différeront aux États-Unis

    • On dirait plutôt la fin du boom des semi-conducteurs fondé sur l’hypothèse de la « monétisation de modèles toujours plus gros ». Si le gouvernement américain peut empêcher cette monétisation par des injonctions arbitraires au motif qu’un modèle est devenu « trop bon », toute cette foire s’écroule
      Avec en plus une pénurie mondiale de pétrole, une pénurie d’engrais et des interventions maladroites pour gonfler la bulle, on en vient presque à devoir remercier le fait que le volant soit tenu par un stable genius octogénaire sénile qui méprise l’État de droit et s’entoure de vingt-deux spécialistes
    • À lire le texte, il semble bien plus probable que la prévention des jailbreaks devienne beaucoup plus stricte, avec davantage de faux positifs

      Nous avons reçu l’instruction du gouvernement aujourd’hui à 17 h 21 (heure de l’Est). La lettre ne contenait pas de détails précis sur les préoccupations de sécurité nationale. À notre connaissance, le gouvernement estime avoir découvert un moyen de contourner ou de « jailbreaker » Fable 5. Nous avons examiné une démonstration utilisant cette technique précise pour identifier un petit nombre de vulnérabilités mineures déjà connues. Toutes ces vulnérabilités semblent relativement simples, et nous avons confirmé que d’autres modèles publics peuvent également les découvrir sans contournement

    • Si c’est bien le cas, beaucoup d’Américains accepteront probablement quand même le risque de construire quelque chose d’important dessus
  • Du point de vue des grandes entreprises ou des organisations d’une certaine taille, il est difficile d’assumer la menace de voir le cœur de leur infrastructure soudainement désactivé pour ce genre de raison. La pression en faveur de l’on-premise et de l’accès hors ligne va devenir écrasante, et je pense que quelqu’un finira par répondre à cette demande, que ce soit avec une licence de poids ou avec des environnements restreints comme les TEE/CC

    • Il y a de fortes chances que plusieurs points apparaissent sur la frontière de Pareto
      Certains prendront davantage de risques, gagneront ou perdront, tandis que d’autres avanceront plus prudemment, accumuleront lentement des résultats ou seront éliminés. Sans même parler du risque de laisser ces modèles écrire le code qui fait tourner l’activité d’une entreprise, ou l’exploiter comme des agents. Le modèle peut aussi avoir été entraîné par un acteur — entreprise ou État — dont les intérêts sont exactement opposés aux vôtres
      Il y a désormais beaucoup plus d’éléments à prendre en compte, et c’est une période intéressante pour faire du business
    • Je suis d’accord sur le fait que la demande pour l’on-premise et l’accès hors ligne sera écrasante, mais le problème est que la Big AI a fait en sorte que la plupart d’entre nous ne puissent pas se payer le matériel nécessaire pour faire tourner tout ça. RAM, NVMe, ce genre de choses
    • C’est précisément pour cette raison que, sur le long terme, je pense que les modèles ouverts chinois vont l’emporter. À grande échelle, l’écart de capacités n’est pas spectaculaire, mais le simple fait de pouvoir les exécuter soi-même est un argument commercial énorme
      Même si vous louez un modèle ouvert à une entreprise chinoise, si elle coupe l’accès ou modifie les conditions d’utilisation d’une façon qui ne vous convient pas, vous pouvez basculer en on-premise. Ce sera peut-être pénible, mais pas une menace pour votre survie. En revanche, dépendre d’un modèle fermé puis se faire couper l’accès, là, c’est une vraie douleur
      Le grand enjeu ici, c’est la domination de l’infrastructure. Les modèles chinois vont devenir les modèles que les gens utilisent réellement, et ce faisant ils fixeront les standards. Cela entraînera plus de recherche, plus d’outils et tout un écosystème autour
      Même avant cette agitation, ce mouvement avait déjà commencé, avec les modèles chinois en passe de devenir les plus utilisés au monde. https://www.indiatoday.in/amp/technology/features/story/clau...
  • L’aube de cette époque est visible partout, de l’Iran aux systèmes de vérification d’âge en ligne, et ce n’est qu’un début. Le monde à venir sera technologiquement ultramoderne, voire futuriste, tout en ayant structurellement un parfum médiéval. Ce sera le monde de Frank Herbert. Il ne sera pas organisé en incluant universellement tout le monde dans un espace normatif unique, mais sous la forme de zones superposées de protection, d’exploitation et d’accès contrôlé
    https://turbulence.substack.com/p/the-gated-age

  • Quand on répète pendant longtemps à quel point son produit est dangereux, les gens qui ont le pouvoir d’interdire les produits dangereux sur le marché peuvent finir par vous croire
    C’est d’autant plus vrai si ces gens ne sont pas particulièrement brillants en ce moment et qu’ils sont déjà en colère contre Anthropic parce que l’entreprise ne les aide pas à atteindre leurs objectifs autoritaires par ailleurs
    Je ne pense pas que ce soit une partie d’échecs en 3D de la part d’Anthropic. Contrairement à ce qu’ils voudraient être, ce ne sont pas des génies de la stratégie tirant les ficelles en coulisses. Ceux qui ont réellement utilisé le produit savent que Fable et Mythos ne sont pas des machines de fin du monde, mais des améliorations progressives. J’y vois une mesure punitive d’une administration qui aime punir, et Anthropic a involontairement renforcé son fondement par sa propre rhétorique absurde

  • Il est indiqué que cela s’est produit aujourd’hui à 17 h 21 heure de l’Est
    La page affichait le 11 juin 2026, puis elle a été mise à jour au 12 juin 2026 au cours des dix dernières minutes
    https://imgur.com/a/lx7HCW9
    Google indique que cette page a été explorée il y a quelques jours
    Il suffit de chercher “the us government directive to suspend access to fable”

    3 days ago — The US government has issued an export control directive to suspend all access to Fable 5 and Mythos 5.
    https://imgur.com/a/KQrYPMh

    • C’est le billet de blog de lancement. Google a probablement pris l’extrait dans la section Related Content en bas de page, où figure un article sur la directive du gouvernement américain
    • Ce fil est affiché de la même manière
      https://imgur.com/a/EOWWUbD
    • D’où vient l’information selon laquelle Google l’aurait explorée il y a quelques jours ? Une capture imgur, c’est parmi les preuves les plus faibles. À minima, il faudrait utiliser archive.today, ou capturer la preuve même que Google l’a explorée
  • Nous avons examiné ce rapport et confirmé que le niveau de capacité qu’il révèle est largement disponible dans d’autres modèles, y compris le GPT-5.5 d’OpenAI, et qu’il est utilisé quotidiennement par les défenseurs qui assurent la sécurité des systèmes. Nous partagerons davantage de détails dans les 24 prochaines heures
    Toute la rhétorique affirmant que Mythos surpasserait largement GPT 5.5, notamment en cybersécurité, en prend un coup avec ça. Bien sûr, les benchmarks de l’AISI le montraient déjà, mais il est intéressant de voir Anthropic le dire maintenant que cela les arrange

    • Cela ne veut pas dire que les autres modèles ont globalement le même niveau de capacité. Cela signifie que la capacité spécifique testée par le gouvernement existe aussi dans d’autres modèles
    • Il s’agit de la capacité précise visée par le gouvernement, pas des capacités générales de Fable. D’après mon expérience personnelle cette semaine à utiliser Fable sur des tâches très complexes, il était nettement plus puissant que n’importe quel autre modèle, du moins en ingénierie logicielle
    • Si 5.5 se retrouve interdit à cause de ça, je vais vraiment être furieux
    • La comparaison avec les autres modèles est limitée, dans l’exemple du gouvernement, aux problèmes qu’on leur a fait résoudre via jailbreak ; cela ne concerne pas toutes les vulnérabilités exploitables sans contournement
  • Même si l’on se trouve aux États-Unis ou qu’on est employé d’Anthropic, interdire l’usage à tout ressortissant étranger, quel que soit son pays d’origine, paraît excessivement large et sévère. Et tout ça, en apparence, à cause d’une seule vulnérabilité potentielle de jailbreak assez mineure : il y a sans doute quelque chose de plus derrière

    • On dirait que le périmètre de ceux qui peuvent continuer à l’utiliser est aligné sur d’autres contrôles à l’exportation américains, comme l’ITAR ou l’EAR
    • Oui. Ce gouvernement n’est pas vraiment réputé pour sa finesse…
    • Malheureusement, c’est comme ça que fonctionnent les contrôles à l’exportation. Même dans un laboratoire national, empêcher des chercheurs étrangers d’accéder aux domaines liés à la sécurité nationale est la mesure de sécurité la plus simple à mettre en place
      Cela ne veut pas dire que c’est bon pour les chercheurs ni pour la recherche elle-même. C’est plutôt une forme d’assurance sur l’usage des financements exigée par les États-Unis
    • Il reste aussi du ressentiment entre le DoD et Anthropic. Vu le degré général de maturité au sommet du gouvernement américain, il est assez plausible que Mythos ait servi de bon prétexte à la bande de Hegseth pour se venger