1 points par GN⁺ 4 시간 전 | 1 commentaires | Partager sur WhatsApp
  • Alors que la restriction d’accès à Mythos et Fable 5 imposée par le gouvernement américain se prolonge, la japonaise Sakana AI et la chinoise 360 visent chacune le vide ainsi créé avec Fugu et Tulongfeng/Yitianzhen
  • Fugu de Sakana AI est présenté comme un modèle capable de rivaliser avec Fable 5 et Mythos Preview, conçu pour les agents qui orchestrent plusieurs API de modèles
  • Tulongfeng de 360 se concentre sur la découverte automatique de vulnérabilités logicielles, tandis que Yitianzhen vise l’automatisation de la cyberdéfense et de la réponse aux incidents
  • Sakana AI affirme que la date de lancement relève du hasard, mais met en avant une « frontier capability sans risque de contrôle à l’export » et cible les entreprises japonaises ainsi que les organismes publics
  • Même si l’importance des modèles américains demeure, les restrictions à l’export accélèrent l’émergence d’alternatives régionales adaptées aux langues et aux contextes locaux chez les entreprises de Tokyo et de Chine

Le vide créé par les restrictions à l’export d’Anthropic

  • Reuters rapporte que l’entreprise chinoise de cybersécurité 360 a dévoilé Tulongfeng mercredi
    • 360 affirme que Tulongfeng peut rivaliser avec Mythos, le modèle d’IA spécialisé en cybersécurité d’Anthropic
    • Mythos et sa version plus restreinte, Fable 5, ne sont actuellement pas proposés aux utilisateurs non américains à la suite d’une mesure de la Trump Administration
  • Plus tôt dans la même semaine, Sakana AI, basée à Tokyo, a lancé Fugu, qui signifie poisson-globe en japonais
    • Fugu est décrit comme étant « au niveau de modèles de pointe comme Fable 5 et Mythos Preview d’Anthropic »
    • Il a été conçu pour les agents et peut orchestrer l’accès API à d’autres modèles
  • Les deux produits sont arrivés deux semaines après l’ordre du gouvernement américain visant Anthropic

La stratégie Fugu de Sakana AI

  • Un porte-parole de Sakana AI a déclaré que le chevauchement entre le lancement de Fugu et les restrictions à l’export sur Mythos/Fable était « entirely coincidental »
    • Le site web de l’entreprise met toutefois en avant une « frontier capability sans risque de contrôle à l’export »
    • Sakana AI explique qu’elle développait Fugu depuis l’an dernier et que les recherches associées ont été présentées à l’ICLR ce printemps
  • L’entreprise a été cofondée en 2023 par David Ha et Llion Jones, anciens de Google, ainsi que Ren Ito, passé par Mercari et Stability AI
    • Elle crée des modèles d’IA générative peu coûteux, efficaces même sur de petits jeux de données, et optimisés pour le japonais et la culture japonaise
  • Les clients visés par Fugu sont les entreprises japonaises et organismes publics cherchant à réduire leur exposition à des contrôles à l’export de plus en plus stricts
    • Sakana AI ne voit pas pour autant là un mouvement de décrochage permanent de l’Asie vis-à-vis de l’IA américaine
    • Son porte-parole a déclaré : « U.S. models remain important to Asia »
  • Dans une tribune publiée par Project Syndicate, Ren Ito soutient que la première priorité du gouvernement fédéral américain devrait être de préserver l’accès de ses alliés proches, et que l’IA n’est pas une technologie à stocker mais à développer ensemble
  • Sur X, David Ha a écrit : « Orchestration Models are the next frontier, beyond bigger models »
    • Selon lui, faire dépendre une infrastructure nationale d’un fournisseur unique est risqué, et les récents contrôles à l’export ont rendu ce risque impossible à ignorer
    • Il a écrit : « Access to top models can disappear overnight », présentant l’intelligence collective comme une couverture pragmatique face à la concentration du pouvoir

L’IA de sécurité de 360 et la logique d’actif stratégique

  • D’après Reuters et Quartz, 360 a présenté deux outils de sécurité IA
    • Tulongfeng : conçu pour découvrir automatiquement des vulnérabilités logicielles
    • Yitianzhen : créé pour automatiser la cyberdéfense et la réponse aux incidents
  • Selon Reuters, le fondateur de 360, Zhou Hongyi, considère l’IA de détection de vulnérabilités comme un actif stratégique national
    • Il a souligné le risque de « one-way transparency », dans lequel seuls certains acteurs ont accès à des capacités avancées de détection de vulnérabilités
  • 360 n’a pas répondu à la demande de commentaire de TechCrunch

La croissance d’Anthropic et la montée des alternatives régionales

  • Anthropic avait indiqué qu’en mai 2026, son chiffre d’affaires annualisé dépassait 47 milliards de dollars
    • L’entreprise n’a pas précisé dans quelle mesure elle dépend des clients entreprises en Asie
  • Dans les semaines qui ont suivi l’entrée en vigueur de l’ordre d’exportation, Sakana AI et 360 se sont engouffrées dans l’espace laissé vacant par la limitation d’accès aux modèles d’Anthropic
  • Même si les entreprises américaines peuvent regagner la confiance après la fin des interdictions, des alternatives régionales entraînées pour mieux comprendre les langues locales et leurs nuances occupent déjà le terrain

1 commentaires

 
GN⁺ 4 시간 전
Avis de Hacker News
  • J’ai utilisé le modèle Fugu pour de vrais travaux en C# et Unity avec MCP et OpenCode, et une revue du système de thèmes plus un plan de changement de couleurs ont consommé d’un coup toute la limite de 5 heures du forfait à 20 $
    Je suis passé au forfait à 100 $ pour voir le résultat de l’implémentation, mais c’était pire qu’Opus et incroyablement lent ; il a aussi épuisé la nouvelle limite de 5 heures et utilisé 35 % de la limite hebdomadaire, tout en restant très loin de ce qu’Opus faisait en beaucoup moins de temps et pour beaucoup moins cher
    À vous de juger de cette information, mais ça ressemble à un gaspillage d’argent

    • Fugu n’est pas un modèle indépendant : il appelle en arrière-plan plusieurs modèles SaaS existants, comme OpenAI ou Anthropic, puis agrège les réponses pour produire un résultat
      Ils affirment qu’en combinant les résultats de plusieurs modèles d’IA puis en produisant le résultat final avec leur propre modèle propriétaire, la qualité est meilleure qu’avec un seul modèle backend, mais je doute que ce modèle maison existe réellement, ou qu’il soit suffisamment compétent
      Même si l’affirmation est vraie, cela semble facile à implémenter côté client, comme Claude Code, en générant le résultat final avec un modèle aux performances similaires à celles du modèle en arrière-plan, et ce service sent le louche
    • En tant que fournisseur d’un service similaire pour Godot plutôt que Unity, il est plausible qu’un forfait à 20 $ soit consommé par un seul prompt si l’on utilise des modèles haut de gamme comme Opus
      Si l’on paie le prix API tel quel et qu’on ne peut pas absorber une subvention d’un facteur 10, c’est ce qui arrive
    • J’ai testé Fable dans Cursor : je lui ai demandé des idées pour que le site web de données que j’avais créé ait moins l’air « fait avec Claude », et en 10 minutes il a dépensé 40 $ pour sortir le style CSS le plus inutile et le plus typiquement Claude possible
      Comme le site web lui-même avait été créé avec Opus, on peut aussi dire que le résultat était pire qu’Opus
      J’ai eu la même expérience avec des modèles américains, donc peut-être que ces modèles asiatiques sont aussi du genre Mythos
    • Je me demande quel Unity MCP est utilisé
      J’essaie le MCP officiel, et j’aimerais savoir ce que les autres utilisent
      Du côté du célèbre coplay, j’ai eu des conflits de paquets
    • C’était pareil pour la recherche/l’investigation web, et c’était mauvais par rapport à Opus
      Il a raté la moitié des éléments, et l’autre moitié était obsolète ou non vérifiée
  • Fugu Ultra ne semble pas être un modèle à proprement parler, mais plutôt un système de routage entre plusieurs modèles, quelque chose proche d’un harnais cloud, similaire à Fusion d’OpenRouter
    « Ce n’est pas un unique modèle géant ; Fugu est un système d’orchestration multi-agents entraîné. C’est un modèle de langage entraîné à router des tâches vers un pool de modèles de base interchangeables et à appeler récursivement ses propres instances. » - https://openrouter.ai/sakana/fugu-ultra
    [0] https://sakana.ai/fugu/
    [1] https://openrouter.ai/openrouter/fusion

  • L’expression « Mythos-like » commence à m’agacer
    Les utilisateurs ordinaires n’ont aucun moyen de comparer, à part regarder les benchmarks

    • « Mythos-like » veut simplement dire survendu par la rumeur, et ici l’expression est correctement employée
    • Les startups IA asiatiques font elles aussi des affirmations audacieuses sans réel moyen de comparer, et on peut considérer que le cœur de l’intervention de Trump était d’empêcher la distillation de Faible
    • Il n’y a même pas de benchmarks publics, non ?
  • S’il n’existe pas de benchmarks fiables, la seule chose que ces modèles ont en commun avec Mythos, c’est qu’ils prennent du texte en entrée et produisent du texte en sortie

    • Je ne regarde presque plus les benchmarks
      Quand un nouveau modèle sort, je l’essaie directement sur notre vaste base de code logicielle propriétaire, sur de vrais produits déjà lancés, ou sur des projets qui sortiront peut-être un jour
      Il est assez clair quel modèle permet de mieux travailler ou de travailler plus vite, et j’ai la chance d’avoir pour l’instant un budget de tokens suffisant pour en utiliser autant que nécessaire
      Je n’ai pas besoin de benchmarks, d’évaluations, de marketing ou de system cards ; sur le web, je ne lis que des astuces, des pratiques de terrain et les annonces de sortie
      Je partage mes expériences avec mes collègues, mais tout le reste n’est que du bruit
    • Si c’était survendu comme Mythos, on peut aussi l’ajouter à la liste des choses « Mythos-like »
      Ce qui manque sans doute, c’est la scène où le CEO avertit le monde en disant : « Notre modèle est trop dangereux pour être rendu public sur Internet ; quelqu’un doit nous arrêter avant qu’il ne soit trop tard »
    • Il y a des benchmarks dans l’article : https://arxiv.org/abs/2606.21228
  • La liste des investisseurs est impressionnante : https://sakana.ai/company-info/?lang=en
    C’était aussi en une de HN il y a quelques jours, avec plus de 100 commentaires : https://news.ycombinator.com/item?id=48624782

    • Ces entreprises avaient-elles déjà sorti des modèles auparavant ?
      J’ai du mal à croire qu’elles aient soudainement sorti des modèles au niveau de Mythos
      DeepSeek, Z.ai et Alibaba/Qwen sont dans le domaine depuis bien plus longtemps et ont publié, ces 18 derniers mois, des modèles dont les performances se sont améliorées régulièrement
      Il est difficile de croire que de nouvelles entreprises, sans aucune sortie antérieure, lancent soudainement des modèles du niveau de Mythos
    • Il y a aussi eu une rétractation assez humiliante l’an dernier
      https://techcrunch.com/2025/02/21/sakana-walks-back-claims-t...
  • Je pense qu’avant la fin de l’année, on verra une interdiction des LLM étrangers au nom de « préoccupations de sécurité »
    Cela n’aura rien à voir avec leurs performances réelles
    Mais Anthropic a établi une ligne de base pour les systèmes de type Mythos, et tout ce qui correspond à ce critère vaguement défini sera probablement considéré comme dangereux pour le public

    • Concrètement, comment cela pourrait-il fonctionner ?
    • Dans ce cas, adieu la technologie américaine et bienvenue à la Chine
      Personne n’attendra, et on ne peut pas remettre dans la bouteille un génie qui en est déjà sorti
    • Faire comme si les modèles ne présentaient aucun risque réel même en progressant est absurde
      J’ai l’impression de vivre dans une autre réalité où Claude est le seul à dire des choses intelligentes à ce stade
      Presque tout ce qui est écrit par des humains ressemble à des hallucinations et à du baratin performatif
  • D’un point de vue cynique, tant que le modèle est correct, il est difficile de réfuter l’affirmation selon laquelle il est du niveau de Mythos
    Parce qu’on ne peut plus utiliser Mythos maintenant

    • C’était quoi, quelque chose comme Mythos ?
      Je demande par curiosité, en tant que personne qui n’y avait pas accès
  • Ma première impression, c’est : « sans benchmarks tiers, dégagez »
    Personnellement, je n’ai jamais entendu parler de ces deux entreprises
    On est censés simplement les croire quand ils disent être au niveau des meilleurs modèles du marché ?
    Sakana décrit son modèle comme un « Orchestration Model » ; est-ce que cela veut dire qu’en pratique, ils ont assemblé plusieurs modèles ?

    • Est-ce vraiment si difficile de créer un bon modèle, ou bien est-ce surtout l’échelle des ressources investies dans l’entraînement qui compte ?
      Je pose la question parce que je ne sais vraiment pas
      Bien sûr, ce n’est pas une broutille, mais faut-il un savoir secret de niveau mondial pour construire par-dessus des techniques existantes connues ?
      J’ai l’impression qu’il reste encore beaucoup de fruits à portée de main à explorer, et que le temps et les ressources sont les facteurs limitants
    • Dans les commentaires du billet de lancement récemment publié sur HN, l’ambiance était plutôt que cela ressemble à OpenRouter plutôt qu’à un vrai modèle
    • C’est aussi mon impression
      Ils semblent affirmer qu’il s’agit moins d’un nouveau mélange de modèles que d’une architecture qui applique de la colle à la volée, d’une manière dynamique
      Les réactions de l’époque sont également visibles ici : https://news.ycombinator.com/item?id=48624782 (il y a 6 jours, 244 points, 133 commentaires)
    • Anthropic a-t-il fourni des benchmarks tiers ?
      Est-ce que tu disais la même chose à l’époque ?
      C’est important, certes, mais l’attitude n’est pas la bonne
  • Je suis quelqu’un de simple : s’il n’y a pas de benchmarks sur https://arena.ai/leaderboard, je considère que c’est à 100 % une arnaque

    • Et par rapport à ARC AGI, ça donne quoi ?
  • Comme beaucoup de commentaires ici, j’ai testé Fugu et quelques autres modèles, et c’étaient des modèles assez coûteux
    20 $ ne suffisaient pas pour terminer tout le workflow, alors qu’avec Opus, c’était possible
    Bien sûr, avec Opus aussi, si l’on veut les meilleurs résultats, il faut peut-être davantage peaufiner le prompt dès le départ, mais jusqu’ici, c’est mon expérience
    Mon prochain test se fera avec un système agentique, pour voir les performances