1 points par recast7838 3 시간 전 | 2 commentaires | Partager sur WhatsApp

La startup chinoise d’IA MiniMax a lancé en fanfare « M3 », un grand modèle de langage multimodal à poids ouverts qui dépasse GPT-5.5 et Gemini 3.1 Pro, pour un coût radicalement réduit à seulement 5 à 10 % de celui des modèles commerciaux américains existants.


Traduction intégrale

La startup chinoise d’IA MiniMax a lancé en fanfare « M3 », un grand modèle de langage multimodal doté de performances de codage de niveau frontier et d’une fenêtre de contexte de 1 million de tokens, provoquant de fortes secousses sur le marché mondial de l’IA d’entreprise. M3 sera distribué dans les 10 prochains jours via Hugging Face et GitHub sous une licence open source à « poids ouverts (Open Weights) », afin de permettre aux entreprises de le télécharger en local sur leurs propres serveurs et d’effectuer des optimisations personnalisées. Il est actuellement proposé à un tarif de lancement de 0,3 dollar par million de tokens en entrée et 1,20 dollar par million de tokens en sortie (coût total 1,50 dollar {b:4}), et même après application du tarif normal, il ne représentera que 8 à 20 % {p:14} du coût des principaux modèles commerciaux américains, dominant ainsi Google, OpenAI et Anthropic sur le terrain des coûts.

Le secret clé qui permet à M3 de réaliser une réduction de coût aussi spectaculaire réside dans l’architecture « MiniMax Sparse Attention (MSA) », qui résout le problème d’explosion des coûts de calcul à croissance quadratique des transformeurs traditionnels. La technologie MSA divise les données en blocs à haute précision et n’associe dynamiquement que les requêtes nécessaires, maximisant ainsi l’efficacité matérielle ; lors du traitement de 1 million de tokens, elle réduit les besoins de calcul à un vingtième {p:5} du niveau habituel et augmente la vitesse de décodage d’un facteur 15. Grâce à cette innovation structurelle, M3 a enregistré 59,0 % {p:59} sur SWE-Bench Pro, qui évalue les capacités d’ingénierie logicielle autonome, dépassant ainsi les modèles fermés GPT-5.5 et Gemini 3.1 Pro, et a aussi surpassé le précédent score de Claude Opus 4.7 en navigation web et recherche d’information (BrowseComp 83,5 % {p:84}).

Comparé à Claude Opus 4.8, le modèle fermé le plus performant récemment lancé (SWE-Bench Pro 69,2 % {b:59,69}), il existe encore un écart de performance dans certains domaines de raisonnement ultra-complexe, mais M3 fournit une référence solide pour l’automatisation locale sans nécessiter d’énormes frais d’abonnement API. En outre, MiniMax a également présenté une gamme d’agents « MiniMax Code » propulsés par M3, capables d’écrire eux-mêmes du code, d’exécuter des boucles de vérification indépendantes et de s’auto-corriger, avec une tarification agressive à partir de 20 dollars par mois (Plus). Dans les environnements d’entreprise où une confidentialité stricte des données et la conformité réglementaire sont indispensables, la disponibilité de M3 en poids ouverts devrait éliminer à la source les risques de fuite de données vers le cloud et offrir le meilleur rapport performances-prix pour internaliser les actifs clés propres à chaque entreprise.

Le mot de l’auteur

Je vais essayer de l’utiliser sur le cloud d’ollama.

2 commentaires

 
b8g6pn 3 시간 전

Le critère selon lequel ce modèle rivaliserait avec les autres est sans doute un peu exagéré, mais le prix est vraiment choquant.

 
recast7838 3 시간 전

Je l’utilise en ce moment, et contrairement à d’autres modèles chinois, il n’a pas le problème de se mettre à sortir du chinois en plein milieu de la rédaction. Il semble aussi bien gérer les tool calls.