- Alors que la restriction d’accès à Mythos et Fable 5 imposée par le gouvernement américain se prolonge, la japonaise Sakana AI et la chinoise 360 visent chacune le vide ainsi créé avec Fugu et Tulongfeng/Yitianzhen
- Fugu de Sakana AI est présenté comme un modèle capable de rivaliser avec Fable 5 et Mythos Preview, conçu pour les agents qui orchestrent plusieurs API de modèles
- Tulongfeng de 360 se concentre sur la découverte automatique de vulnérabilités logicielles, tandis que Yitianzhen vise l’automatisation de la cyberdéfense et de la réponse aux incidents
- Sakana AI affirme que la date de lancement relève du hasard, mais met en avant une « frontier capability sans risque de contrôle à l’export » et cible les entreprises japonaises ainsi que les organismes publics
- Même si l’importance des modèles américains demeure, les restrictions à l’export accélèrent l’émergence d’alternatives régionales adaptées aux langues et aux contextes locaux chez les entreprises de Tokyo et de Chine
Le vide créé par les restrictions à l’export d’Anthropic
- Reuters rapporte que l’entreprise chinoise de cybersécurité 360 a dévoilé Tulongfeng mercredi
- 360 affirme que Tulongfeng peut rivaliser avec Mythos, le modèle d’IA spécialisé en cybersécurité d’Anthropic
- Mythos et sa version plus restreinte, Fable 5, ne sont actuellement pas proposés aux utilisateurs non américains à la suite d’une mesure de la Trump Administration
- Plus tôt dans la même semaine, Sakana AI, basée à Tokyo, a lancé Fugu, qui signifie poisson-globe en japonais
- Fugu est décrit comme étant « au niveau de modèles de pointe comme Fable 5 et Mythos Preview d’Anthropic »
- Il a été conçu pour les agents et peut orchestrer l’accès API à d’autres modèles
- Les deux produits sont arrivés deux semaines après l’ordre du gouvernement américain visant Anthropic
La stratégie Fugu de Sakana AI
- Un porte-parole de Sakana AI a déclaré que le chevauchement entre le lancement de Fugu et les restrictions à l’export sur Mythos/Fable était « entirely coincidental »
- Le site web de l’entreprise met toutefois en avant une « frontier capability sans risque de contrôle à l’export »
- Sakana AI explique qu’elle développait Fugu depuis l’an dernier et que les recherches associées ont été présentées à l’ICLR ce printemps
- L’entreprise a été cofondée en 2023 par David Ha et Llion Jones, anciens de Google, ainsi que Ren Ito, passé par Mercari et Stability AI
- Elle crée des modèles d’IA générative peu coûteux, efficaces même sur de petits jeux de données, et optimisés pour le japonais et la culture japonaise
- Les clients visés par Fugu sont les entreprises japonaises et organismes publics cherchant à réduire leur exposition à des contrôles à l’export de plus en plus stricts
- Sakana AI ne voit pas pour autant là un mouvement de décrochage permanent de l’Asie vis-à-vis de l’IA américaine
- Son porte-parole a déclaré : « U.S. models remain important to Asia »
- Dans une tribune publiée par Project Syndicate, Ren Ito soutient que la première priorité du gouvernement fédéral américain devrait être de préserver l’accès de ses alliés proches, et que l’IA n’est pas une technologie à stocker mais à développer ensemble
- Sur X, David Ha a écrit : « Orchestration Models are the next frontier, beyond bigger models »
- Selon lui, faire dépendre une infrastructure nationale d’un fournisseur unique est risqué, et les récents contrôles à l’export ont rendu ce risque impossible à ignorer
- Il a écrit : « Access to top models can disappear overnight », présentant l’intelligence collective comme une couverture pragmatique face à la concentration du pouvoir
L’IA de sécurité de 360 et la logique d’actif stratégique
- D’après Reuters et Quartz, 360 a présenté deux outils de sécurité IA
- Tulongfeng : conçu pour découvrir automatiquement des vulnérabilités logicielles
- Yitianzhen : créé pour automatiser la cyberdéfense et la réponse aux incidents
- Selon Reuters, le fondateur de 360, Zhou Hongyi, considère l’IA de détection de vulnérabilités comme un actif stratégique national
- Il a souligné le risque de « one-way transparency », dans lequel seuls certains acteurs ont accès à des capacités avancées de détection de vulnérabilités
- 360 n’a pas répondu à la demande de commentaire de TechCrunch
La croissance d’Anthropic et la montée des alternatives régionales
- Anthropic avait indiqué qu’en mai 2026, son chiffre d’affaires annualisé dépassait 47 milliards de dollars
- L’entreprise n’a pas précisé dans quelle mesure elle dépend des clients entreprises en Asie
- Dans les semaines qui ont suivi l’entrée en vigueur de l’ordre d’exportation, Sakana AI et 360 se sont engouffrées dans l’espace laissé vacant par la limitation d’accès aux modèles d’Anthropic
- Même si les entreprises américaines peuvent regagner la confiance après la fin des interdictions, des alternatives régionales entraînées pour mieux comprendre les langues locales et leurs nuances occupent déjà le terrain
1 commentaires
Avis de Hacker News
J’ai utilisé le modèle Fugu pour de vrais travaux en C# et Unity avec MCP et OpenCode, et une revue du système de thèmes plus un plan de changement de couleurs ont consommé d’un coup toute la limite de 5 heures du forfait à 20 $
Je suis passé au forfait à 100 $ pour voir le résultat de l’implémentation, mais c’était pire qu’Opus et incroyablement lent ; il a aussi épuisé la nouvelle limite de 5 heures et utilisé 35 % de la limite hebdomadaire, tout en restant très loin de ce qu’Opus faisait en beaucoup moins de temps et pour beaucoup moins cher
À vous de juger de cette information, mais ça ressemble à un gaspillage d’argent
Ils affirment qu’en combinant les résultats de plusieurs modèles d’IA puis en produisant le résultat final avec leur propre modèle propriétaire, la qualité est meilleure qu’avec un seul modèle backend, mais je doute que ce modèle maison existe réellement, ou qu’il soit suffisamment compétent
Même si l’affirmation est vraie, cela semble facile à implémenter côté client, comme Claude Code, en générant le résultat final avec un modèle aux performances similaires à celles du modèle en arrière-plan, et ce service sent le louche
Si l’on paie le prix API tel quel et qu’on ne peut pas absorber une subvention d’un facteur 10, c’est ce qui arrive
Comme le site web lui-même avait été créé avec Opus, on peut aussi dire que le résultat était pire qu’Opus
J’ai eu la même expérience avec des modèles américains, donc peut-être que ces modèles asiatiques sont aussi du genre Mythos
J’essaie le MCP officiel, et j’aimerais savoir ce que les autres utilisent
Du côté du célèbre coplay, j’ai eu des conflits de paquets
Il a raté la moitié des éléments, et l’autre moitié était obsolète ou non vérifiée
Fugu Ultra ne semble pas être un modèle à proprement parler, mais plutôt un système de routage entre plusieurs modèles, quelque chose proche d’un harnais cloud, similaire à Fusion d’OpenRouter
« Ce n’est pas un unique modèle géant ; Fugu est un système d’orchestration multi-agents entraîné. C’est un modèle de langage entraîné à router des tâches vers un pool de modèles de base interchangeables et à appeler récursivement ses propres instances. » - https://openrouter.ai/sakana/fugu-ultra
[0] https://sakana.ai/fugu/
[1] https://openrouter.ai/openrouter/fusion
L’expression « Mythos-like » commence à m’agacer
Les utilisateurs ordinaires n’ont aucun moyen de comparer, à part regarder les benchmarks
S’il n’existe pas de benchmarks fiables, la seule chose que ces modèles ont en commun avec Mythos, c’est qu’ils prennent du texte en entrée et produisent du texte en sortie
Quand un nouveau modèle sort, je l’essaie directement sur notre vaste base de code logicielle propriétaire, sur de vrais produits déjà lancés, ou sur des projets qui sortiront peut-être un jour
Il est assez clair quel modèle permet de mieux travailler ou de travailler plus vite, et j’ai la chance d’avoir pour l’instant un budget de tokens suffisant pour en utiliser autant que nécessaire
Je n’ai pas besoin de benchmarks, d’évaluations, de marketing ou de system cards ; sur le web, je ne lis que des astuces, des pratiques de terrain et les annonces de sortie
Je partage mes expériences avec mes collègues, mais tout le reste n’est que du bruit
Ce qui manque sans doute, c’est la scène où le CEO avertit le monde en disant : « Notre modèle est trop dangereux pour être rendu public sur Internet ; quelqu’un doit nous arrêter avant qu’il ne soit trop tard »
La liste des investisseurs est impressionnante : https://sakana.ai/company-info/?lang=en
C’était aussi en une de HN il y a quelques jours, avec plus de 100 commentaires : https://news.ycombinator.com/item?id=48624782
J’ai du mal à croire qu’elles aient soudainement sorti des modèles au niveau de Mythos
DeepSeek, Z.ai et Alibaba/Qwen sont dans le domaine depuis bien plus longtemps et ont publié, ces 18 derniers mois, des modèles dont les performances se sont améliorées régulièrement
Il est difficile de croire que de nouvelles entreprises, sans aucune sortie antérieure, lancent soudainement des modèles du niveau de Mythos
https://techcrunch.com/2025/02/21/sakana-walks-back-claims-t...
Je pense qu’avant la fin de l’année, on verra une interdiction des LLM étrangers au nom de « préoccupations de sécurité »
Cela n’aura rien à voir avec leurs performances réelles
Mais Anthropic a établi une ligne de base pour les systèmes de type Mythos, et tout ce qui correspond à ce critère vaguement défini sera probablement considéré comme dangereux pour le public
Personne n’attendra, et on ne peut pas remettre dans la bouteille un génie qui en est déjà sorti
J’ai l’impression de vivre dans une autre réalité où Claude est le seul à dire des choses intelligentes à ce stade
Presque tout ce qui est écrit par des humains ressemble à des hallucinations et à du baratin performatif
D’un point de vue cynique, tant que le modèle est correct, il est difficile de réfuter l’affirmation selon laquelle il est du niveau de Mythos
Parce qu’on ne peut plus utiliser Mythos maintenant
Je demande par curiosité, en tant que personne qui n’y avait pas accès
Ma première impression, c’est : « sans benchmarks tiers, dégagez »
Personnellement, je n’ai jamais entendu parler de ces deux entreprises
On est censés simplement les croire quand ils disent être au niveau des meilleurs modèles du marché ?
Sakana décrit son modèle comme un « Orchestration Model » ; est-ce que cela veut dire qu’en pratique, ils ont assemblé plusieurs modèles ?
Je pose la question parce que je ne sais vraiment pas
Bien sûr, ce n’est pas une broutille, mais faut-il un savoir secret de niveau mondial pour construire par-dessus des techniques existantes connues ?
J’ai l’impression qu’il reste encore beaucoup de fruits à portée de main à explorer, et que le temps et les ressources sont les facteurs limitants
Ils semblent affirmer qu’il s’agit moins d’un nouveau mélange de modèles que d’une architecture qui applique de la colle à la volée, d’une manière dynamique
Les réactions de l’époque sont également visibles ici : https://news.ycombinator.com/item?id=48624782 (il y a 6 jours, 244 points, 133 commentaires)
Est-ce que tu disais la même chose à l’époque ?
C’est important, certes, mais l’attitude n’est pas la bonne
Je suis quelqu’un de simple : s’il n’y a pas de benchmarks sur https://arena.ai/leaderboard, je considère que c’est à 100 % une arnaque
Comme beaucoup de commentaires ici, j’ai testé Fugu et quelques autres modèles, et c’étaient des modèles assez coûteux
20 $ ne suffisaient pas pour terminer tout le workflow, alors qu’avec Opus, c’était possible
Bien sûr, avec Opus aussi, si l’on veut les meilleurs résultats, il faut peut-être davantage peaufiner le prompt dès le départ, mais jusqu’ici, c’est mon expérience
Mon prochain test se fera avec un système agentique, pour voir les performances