L’existence d’un nouveau modèle d’IA en cours de développement chez Anthropic, « Claude Mythos », a été révélée par une fuite de données, et Anthropic l’a officiellement reconnue.
Selon un article de Fortune, en raison d’une erreur de configuration dans le CMS (système de gestion de contenu) externe utilisé par Anthropic, environ 3 000 assets, dont des billets de blog en brouillon non publiés, ont été exposés dans un data store accessible publiquement. Des chercheurs en sécurité IA de LayerX Security et de l’université de Cambridge, qui ont découvert l’exposition, l’ont signalée à Fortune, et Anthropic, contacté par Fortune, a bloqué l’accès public à ces données.
Les principaux éléments des documents brouillons divulgués sont les suivants :
∙ Anthropic prépare un nouveau tier de modèles, « Capybara », au-dessus du niveau Opus existant, et Claude Mythos semble être le premier modèle de ce tier Capybara.
∙ Il est indiqué qu’il a obtenu des « scores dramatiquement plus élevés » que l’actuel meilleur modèle, Claude Opus 4.6, sur des benchmarks de code, de raisonnement académique et de cybersécurité.
∙ Ses capacités en cybersécurité sont décrites comme « très en avance sur tout autre modèle d’IA actuel », et Anthropic considère lui-même cela comme un facteur de risque sérieux.
∙ En raison de son coût élevé et du fait qu’il n’est pas prêt pour une sortie générale, il est pour l’instant testé uniquement auprès d’un petit nombre de clients en early access.
Un porte-parole d’Anthropic a déclaré à Fortune que l’entreprise développait « un modèle généraliste apportant des avancées significatives en raisonnement, en code et en cybersécurité », et qu’elle examinait avec prudence la manière de le lancer compte tenu de l’ampleur de ses capacités. Il a également décrit ce modèle comme un « step change » et comme « le meilleur modèle que nous ayons construit jusqu’à présent ».
Par ailleurs, cette fuite a aussi révélé qu’Anthropic prévoyait au Royaume-Uni une retraite privée réunissant des CEO de grandes entreprises européennes. Cet événement de deux jours, auquel Dario Amodei doit participer en personne, inclurait également des démonstrations de fonctionnalités Claude non encore lancées.
15 commentaires
L’IA a progressé, mais elle n’a visiblement pas réussi à empêcher une erreur de configuration du CMS :)
purée..
Je ne suis pas un expert en IA, mais tout le monde dit qu’il y a eu un bond quantique à la fin de l’année dernière et au début de cette année — du moins pour le développement.
Si on a un bond quantique tous les six mois, alors il ne nous reste vraiment plus beaucoup de temps.
Du lourd arrive..
Ils sont sur le point d’entrer en Bourse, mais avec un marché plombé par la guerre, on dirait qu’ils attisent volontairement l’engouement en poussant une ambiance d’ouverture…
Pitié... je suis déjà en train d’essayer de suivre, donc allez-y doucement ;
Maintenant, ça fait vraiment trop peur...
À chaque nouvelle version, les entreprises d’IA disent toujours la même chose : « un modèle supérieur au précédent ». N’est-ce pas finalement évident qu’un nouveau modèle, produit ou version doit être meilleur ? J’ai surtout envie de lire les retours de personnes qui l’auront réellement utilisé pendant un ou deux mois après sa sortie.
Claude a toujours montré des résultats surprenants à chaque sortie d’une nouvelle version, donc j’ai encore plus hâte cette fois-ci.
On sent tout de suite qu’Opus était complètement dingue dès son jour de sortie.
Je suis d’accord. Mais Codex est similaire aussi.
Du lourd arrive.
Mais qu’est-ce qui est encore en train de se passer ?
oh là là
waouh