Claude Fable 5/Mythos 5 dévoilés, les modèles frontier de 5e génération d’Anthropic

boradi · 2026-06-10T02:46:30+09:00

Anthropic a lancé ses modèles de 5e génération pour des tâches longues et asynchrones sur plusieurs jours. Fable 5 est une version du modèle de niveau Mythos rendue sûre pour les utilisateurs grand public, et Mythos 5 est une version du même modèle avec certaines protections assouplies Le niveau Mythos est un nouveau palier de modèles au-dessus du niveau Opus. Le premier modèle, Mythos Preview, a été présenté en avril sous le nom de Project Glasswing, et il est aujourd’hui suivi par Fable 5 et Mythos 5 Origine des noms : Fable vient du latin fabula (« ce qui est raconté ») et est apparenté au grec mythos. Ce qui distingue les deux modèles, ce sont les protections elles-mêmes, d’où leurs noms différents Le prix est de 10 $ par million de tokens en entrée et 50 $ en sortie, soit moins de la moitié du prix de Mythos Preview. Le nom du modèle API est claude-fable-5 Performances Le message clé est que l’avantage augmente à mesure que les tâches deviennent longues et complexes Codage : dans des tests préalables de Stripe, il a réalisé en une journée la migration complète d’une base de code Ruby de 50 millions de lignes (plus de deux mois de travail manuel pour une équipe). Il a écrit lui-même les tests et a vérifié le résultat par vision en le comparant au design d’origine. Dans l’évaluation FrontierCode de Cognition, il obtient le meilleur score parmi les modèles frontier même en niveau d’effort medium Agents : dans des environnements comme Claude Code, il peut fonctionner de façon autonome pendant plusieurs jours, en planifiant, en déléguant à des sous-agents et en s’auto-vérifiant Vision : reconstruction du code source d’une web app à partir de simples captures d’écran, et réussite complète de Pokémon FireRed avec un harnais minimal dédié à la vision (les modèles précédents nécessitaient un harnais auxiliaire complexe) Mémoire : dans Slay the Spire, avec une mémoire persistante basée sur des fichiers, les performances sont multipliées par 3 par rapport à Opus 4.8, et la fréquence d’accès à l’acte final triple également Travail de la connaissance : meilleur score de tous les modèles sur le benchmark financier d’Hebbia, et réussite sur presque tous les domaines de l’évaluation d’analyse de trading d’IMC Benchmarks SWE-Bench Pro 80,3 % (Opus 4.8 à 69,2 %, GPT 5.5 à 58,6 %), GDPval-AA 1932, OSWorld 85,0 %, avec une revendication de supériorité globale en codage, travail de la connaissance, vision et computer use Attention : certaines valeurs du tableau correspondent au meilleur score entre Mythos 5 et Fable 5, et les éléments marqués d’un astérisque (biologie, cybersécurité, etc.) sont accompagnés d’une note indiquant des performances proches d’Opus 4.8 en raison du fallback des protections Résultats scientifiques de Mythos 5 Accélération d’environ 10× du processus de conception de protéines, avec obtention de candidats prometteurs sur 9 cibles sur 14. Il a géré sans assistance humaine la sélection des sites de liaison, l’exécution des outils et la récupération après échec En comparaison en aveugle, les scientifiques ont préféré dans environ 80 % des cas ses hypothèses de biologie moléculaire. L’une d’elles (un nouveau mécanisme dans une protéine d’E. coli) a été confirmée indépendamment par un laboratoire qui étudiait le même problème Grâce à plus d’une semaine de travail autonome, il a rassemblé des données de millions de cellules provenant de 138 espèces animales, puis conçu et entraîné un modèle de ML sur mesure qui dépasse le dernier modèle publié dans Science avec une taille 100 fois plus petite Évaluation d’alignement : le niveau de comportement désaligné de Mythos 5 est rapporté comme faible et comparable à celui d’Opus 4.8 Protections Le classificateur bloque trois domaines : la cybersécurité, la biologie et la chimie, et la distillation (tentatives d’extraction de capacités pour entraîner des modèles concurrents d’États autoritaires). Les requêtes concernées sont automatiquement redirigées vers Opus 4.8 avec notification à l’utilisateur (aucune facturation Fable en cas de redirection) Plus de 95 % des sessions n’ont pas de fallback, et les protections s’activent sur moins de 5 % des sessions en moyenne. Anthropic reconnaît toutefois un réglage conservateur qui peut parfois bloquer des requêtes inoffensives, et prévoit de réduire ces faux positifs Après plus de 1 000 heures de bug bounty externe, aucun jailbreak universel n’a été trouvé. Le UK AISI a toutefois obtenu des avancées proches lors de tests initiaux courts. Lors d’un test externe, 30 techniques publiques de jailbreak n’ont produit aucune réponse à des requêtes nuisibles en un seul tour liées à des cyberattaques Dans l’évaluation de conception d’AAV (vecteurs de thérapie génique), le niveau Mythos dépasse un modèle de langage protéique spécialisé uniquement grâce à son raisonnement biologique. Cela est présenté comme un élément à l’appui du risque de double usage Une conservation des données pendant 30 jours à des fins de surveillance de sécurité est obligatoire. Elle s’applique à tout le trafic 1st party et 3rd party, n’est pas utilisée pour l’entraînement du modèle ni à d’autres fins que la sécurité, journalise les accès humains et supprime les données après 30 jours Prix et lancement Disponible sur les offres Enterprise (à l’usage), Claude Platform, AWS, GCP et Microsoft Foundry Déploiement progressif pour les offres par abonnement : inclus gratuitement du 9 au 22 juin pour Pro, Max, Team et Enterprise à la place. Retiré à partir du 23 juin, avec nécessité d’utiliser des crédits d’usage. Retour prévu dans l’offre de base lorsque la capacité sera disponible. L’API et l’Enterprise à l’usage sont pleinement disponibles dès aujourd’hui Dès aujourd’hui, les utilisateurs existants de Mythos Preview (partenaires Glasswing, etc.) peuvent passer à Mythos 5. Dans la plupart des cas, il est similaire ou légèrement plus performant que Preview tout en étant nettement moins cher. Anthropic revendique les meilleures capacités de cybersécurité au monde Un trusted access program dédié à la biologie doit aussi être lancé séparément (seules les protections biologie et chimie sont désactivées dans Fable 5, les protections cyber étant maintenues)

(anthropic.com)

20 points par boradi 2026-06-10 | 14 commentaires | Partager sur WhatsApp

Anthropic a lancé ses modèles de 5e génération pour des tâches longues et asynchrones sur plusieurs jours. Fable 5 est une version du modèle de niveau Mythos rendue sûre pour les utilisateurs grand public, et Mythos 5 est une version du même modèle avec certaines protections assouplies
Le niveau Mythos est un nouveau palier de modèles au-dessus du niveau Opus. Le premier modèle, Mythos Preview, a été présenté en avril sous le nom de Project Glasswing, et il est aujourd’hui suivi par Fable 5 et Mythos 5
Origine des noms : Fable vient du latin fabula (« ce qui est raconté ») et est apparenté au grec mythos. Ce qui distingue les deux modèles, ce sont les protections elles-mêmes, d’où leurs noms différents
Le prix est de 10 $ par million de tokens en entrée et 50 $ en sortie, soit moins de la moitié du prix de Mythos Preview. Le nom du modèle API est claude-fable-5

Performances

Le message clé est que l’avantage augmente à mesure que les tâches deviennent longues et complexes
Codage : dans des tests préalables de Stripe, il a réalisé en une journée la migration complète d’une base de code Ruby de 50 millions de lignes (plus de deux mois de travail manuel pour une équipe). Il a écrit lui-même les tests et a vérifié le résultat par vision en le comparant au design d’origine. Dans l’évaluation FrontierCode de Cognition, il obtient le meilleur score parmi les modèles frontier même en niveau d’effort medium
Agents : dans des environnements comme Claude Code, il peut fonctionner de façon autonome pendant plusieurs jours, en planifiant, en déléguant à des sous-agents et en s’auto-vérifiant
Vision : reconstruction du code source d’une web app à partir de simples captures d’écran, et réussite complète de Pokémon FireRed avec un harnais minimal dédié à la vision (les modèles précédents nécessitaient un harnais auxiliaire complexe)
Mémoire : dans Slay the Spire, avec une mémoire persistante basée sur des fichiers, les performances sont multipliées par 3 par rapport à Opus 4.8, et la fréquence d’accès à l’acte final triple également
Travail de la connaissance : meilleur score de tous les modèles sur le benchmark financier d’Hebbia, et réussite sur presque tous les domaines de l’évaluation d’analyse de trading d’IMC

Benchmarks

SWE-Bench Pro 80,3 % (Opus 4.8 à 69,2 %, GPT 5.5 à 58,6 %), GDPval-AA 1932, OSWorld 85,0 %, avec une revendication de supériorité globale en codage, travail de la connaissance, vision et computer use
Attention : certaines valeurs du tableau correspondent au meilleur score entre Mythos 5 et Fable 5, et les éléments marqués d’un astérisque (biologie, cybersécurité, etc.) sont accompagnés d’une note indiquant des performances proches d’Opus 4.8 en raison du fallback des protections

Résultats scientifiques de Mythos 5

Accélération d’environ 10× du processus de conception de protéines, avec obtention de candidats prometteurs sur 9 cibles sur 14. Il a géré sans assistance humaine la sélection des sites de liaison, l’exécution des outils et la récupération après échec
En comparaison en aveugle, les scientifiques ont préféré dans environ 80 % des cas ses hypothèses de biologie moléculaire. L’une d’elles (un nouveau mécanisme dans une protéine d’E. coli) a été confirmée indépendamment par un laboratoire qui étudiait le même problème
Grâce à plus d’une semaine de travail autonome, il a rassemblé des données de millions de cellules provenant de 138 espèces animales, puis conçu et entraîné un modèle de ML sur mesure qui dépasse le dernier modèle publié dans Science avec une taille 100 fois plus petite
Évaluation d’alignement : le niveau de comportement désaligné de Mythos 5 est rapporté comme faible et comparable à celui d’Opus 4.8

Protections

Le classificateur bloque trois domaines : la cybersécurité, la biologie et la chimie, et la distillation (tentatives d’extraction de capacités pour entraîner des modèles concurrents d’États autoritaires). Les requêtes concernées sont automatiquement redirigées vers Opus 4.8 avec notification à l’utilisateur (aucune facturation Fable en cas de redirection)
Plus de 95 % des sessions n’ont pas de fallback, et les protections s’activent sur moins de 5 % des sessions en moyenne. Anthropic reconnaît toutefois un réglage conservateur qui peut parfois bloquer des requêtes inoffensives, et prévoit de réduire ces faux positifs
Après plus de 1 000 heures de bug bounty externe, aucun jailbreak universel n’a été trouvé. Le UK AISI a toutefois obtenu des avancées proches lors de tests initiaux courts. Lors d’un test externe, 30 techniques publiques de jailbreak n’ont produit aucune réponse à des requêtes nuisibles en un seul tour liées à des cyberattaques
Dans l’évaluation de conception d’AAV (vecteurs de thérapie génique), le niveau Mythos dépasse un modèle de langage protéique spécialisé uniquement grâce à son raisonnement biologique. Cela est présenté comme un élément à l’appui du risque de double usage
Une conservation des données pendant 30 jours à des fins de surveillance de sécurité est obligatoire. Elle s’applique à tout le trafic 1st party et 3rd party, n’est pas utilisée pour l’entraînement du modèle ni à d’autres fins que la sécurité, journalise les accès humains et supprime les données après 30 jours

Prix et lancement

Disponible sur les offres Enterprise (à l’usage), Claude Platform, AWS, GCP et Microsoft Foundry
Déploiement progressif pour les offres par abonnement : inclus gratuitement du 9 au 22 juin pour Pro, Max, Team et Enterprise à la place. Retiré à partir du 23 juin, avec nécessité d’utiliser des crédits d’usage. Retour prévu dans l’offre de base lorsque la capacité sera disponible. L’API et l’Enterprise à l’usage sont pleinement disponibles dès aujourd’hui
Dès aujourd’hui, les utilisateurs existants de Mythos Preview (partenaires Glasswing, etc.) peuvent passer à Mythos 5. Dans la plupart des cas, il est similaire ou légèrement plus performant que Preview tout en étant nettement moins cher. Anthropic revendique les meilleures capacités de cybersécurité au monde
Un trusted access program dédié à la biologie doit aussi être lancé séparément (seules les protections biologie et chimie sont désactivées dans Fable 5, les protections cyber étant maintenues)

14 commentaires

makekr 2026-06-11

Même quand on lui demande de renforcer la sécurité de son propre projet, ses fichus garde-fous l'en empêchent.
Le sortir dans cet état donne juste l'impression d'une démonstration technologique destinée à l'introduction en Bourse.

wkang586 2026-06-10

On dirait qu’on peut l’utiliser dans Cursor dès aujourd’hui, donc j’ai essayé de voir à quoi ressemblent les évaluations, mais pour l’instant il n’y a pas encore beaucoup d’informations.
On dit que le score d’évaluation des performances est supérieur à celui d’Opus, donc j’imagine qu’il faudra l’essayer pour en avoir le cœur net.
Je m’inquiète de voir combien de tokens ça va dévorer.

gkhcdef 2026-06-11

C’est l’abonnement 5x, mais dès que je lance une revue de code, ça tourne pendant 40 minutes et ça finit par consommer toute la limite des 5 heures;;;; Toutes les revues de code ne consomment pas autant, et il trouve souvent bien les points à améliorer, mais bon...
Pour être un peu sarcastique, si opus ou gpt travaillaient avec autant d’« acharnement », j’ai l’impression qu’il n’y aurait pas beaucoup de différence dans le résultat. Dans certains domaines, le fait de travailler comme ça pendant 40 minutes peut malgré tout être un énorme avantage.

bluekai17 2026-06-11

Je l’ai essayé hier, et la consommation de tokens est clairement plus rapide. La qualité du code semble s’être améliorée, et il gère même d’un coup la revue et les problèmes de sécurité.

seoseonyu 2026-06-10

J’aimerais bien l’essayer, mais même si je paie Claude,
à partir du 23 juin ce ne sera plus décompté du quota d’utilisation de l’abonnement, donc ça ne me tente pas vraiment...

awbrg789 2026-06-10

Je l’admets..

savvykang 2026-06-10

Pendant une discussion à propos de ce lien, dès que j’ai mentionné un cas où Fable a refusé de résoudre une question de Sciences de la vie 1 du CSAT, il a forcé le basculement vers Opus 4.8 en disant que le sujet de la conversation était dangereux. J’envisage sérieusement de passer à une formule inférieure.

dhkd63 2026-06-10

J’hésite à passer de claude à codex,
mais je ne sais pas encore. Il faut déjà que je l’essaie un peu

winkagn 2026-06-10

D’abord, il est indiqué que les tokens se consomment 2 fois plus vite qu’avec Opus, donc j’ai essayé, mais je ne ressens pas vraiment de différence... Et selon la tâche, il arrive aussi que le modèle bascule automatiquement vers Opus pour les raisons suivantes. (https://support.claude.com/en/articles/15363606)

bluekai17 2026-06-11

On ressent clairement la consommation de tokens. Pour le basculement, j’ai l’impression qu’il s’active automatiquement quand le système juge qu’il s’agit d’un problème de sécurité sensible, mais ce seuil me semble encore trop élevé.

newdps 2026-06-10

J’utilisais Codex, j’ai voulu tester vite fait, et j’ai aussitôt lâché 200 dollars.

shakespeares 2026-06-10

Quels étaient les avantages ?

jimmy2056 2026-06-10

À mon ressenti, on obtient une qualité de travail correcte avec une faible consommation de tokens. Les 200 dollars de Claude ne me suffisent pas, alors qu’il me reste du budget avec les 200 dollars de Codex.