MiniMax-M3 fait ses débuts, dépasse GPT-5.5 et Gemini 3.1 Pro sur des benchmarks clés pour seulement 5 à 10 % du coût

(venturebeat.com)

12 points par recast7838 2026-06-02 | 6 commentaires | Partager sur WhatsApp

La startup chinoise d’IA MiniMax a lancé en fanfare « M3 », un grand modèle de langage multimodal à poids ouverts qui dépasse GPT-5.5 et Gemini 3.1 Pro, pour un coût radicalement réduit à seulement 5 à 10 % de celui des modèles commerciaux américains existants.

Traduction intégrale

La startup chinoise d’IA MiniMax a lancé en fanfare « M3 », un grand modèle de langage multimodal doté de performances de codage de niveau frontier et d’une fenêtre de contexte de 1 million de tokens, provoquant de fortes secousses sur le marché mondial de l’IA d’entreprise. M3 sera distribué dans les 10 prochains jours via Hugging Face et GitHub sous une licence open source à « poids ouverts (Open Weights) », afin de permettre aux entreprises de le télécharger en local sur leurs propres serveurs et d’effectuer des optimisations personnalisées. Il est actuellement proposé à un tarif de lancement de 0,3 dollar par million de tokens en entrée et 1,20 dollar par million de tokens en sortie (coût total 1,50 dollar {b:4}), et même après application du tarif normal, il ne représentera que 8 à 20 % {p:14} du coût des principaux modèles commerciaux américains, dominant ainsi Google, OpenAI et Anthropic sur le terrain des coûts.

Le secret clé qui permet à M3 de réaliser une réduction de coût aussi spectaculaire réside dans l’architecture « MiniMax Sparse Attention (MSA) », qui résout le problème d’explosion des coûts de calcul à croissance quadratique des transformeurs traditionnels. La technologie MSA divise les données en blocs à haute précision et n’associe dynamiquement que les requêtes nécessaires, maximisant ainsi l’efficacité matérielle ; lors du traitement de 1 million de tokens, elle réduit les besoins de calcul à un vingtième {p:5} du niveau habituel et augmente la vitesse de décodage d’un facteur 15. Grâce à cette innovation structurelle, M3 a enregistré 59,0 % {p:59} sur SWE-Bench Pro, qui évalue les capacités d’ingénierie logicielle autonome, dépassant ainsi les modèles fermés GPT-5.5 et Gemini 3.1 Pro, et a aussi surpassé le précédent score de Claude Opus 4.7 en navigation web et recherche d’information (BrowseComp 83,5 % {p:84}).

Comparé à Claude Opus 4.8, le modèle fermé le plus performant récemment lancé (SWE-Bench Pro 69,2 % {b:59,69}), il existe encore un écart de performance dans certains domaines de raisonnement ultra-complexe, mais M3 fournit une référence solide pour l’automatisation locale sans nécessiter d’énormes frais d’abonnement API. En outre, MiniMax a également présenté une gamme d’agents « MiniMax Code » propulsés par M3, capables d’écrire eux-mêmes du code, d’exécuter des boucles de vérification indépendantes et de s’auto-corriger, avec une tarification agressive à partir de 20 dollars par mois (Plus). Dans les environnements d’entreprise où une confidentialité stricte des données et la conformité réglementaire sont indispensables, la disponibilité de M3 en poids ouverts devrait éliminer à la source les risques de fuite de données vers le cloud et offrir le meilleur rapport performances-prix pour internaliser les actifs clés propres à chaque entreprise.

Le mot de l’auteur

Je vais essayer de l’utiliser sur le cloud d’ollama.

6 commentaires

jimmy2056 2026-06-03

Comme c’est un modèle chinois, l’utiliser via une API me gêne un peu, donc ce serait bien de pouvoir le faire tourner en local.

recast7838 2026-06-02

Je l’utilise en ce moment, et contrairement à d’autres modèles chinois, il n’a pas le problème de se mettre à sortir du chinois en plein milieu de la rédaction. Il semble aussi bien gérer les tool calls.

somang04 2026-06-08

J’utilise le modèle d’abonnement de minimax, et pour 100 dollars par an… on peut l’utiliser plus qu’abondamment. En plus, il permet même de produire jusqu’à 100 morceaux par jour. (Même s’il arrive parfois qu’une chanson de style country sorte, de façon absurde, en chinois…) Ça me paraît être une sorte de version mineure de suno ou flow, et c’est plutôt bien pour créer du BGM.

Je ne l’ai pas encore utilisé pour le code ou les agents. Il faudrait que je le teste en le comparant aux API de gemini / open ai / anthropic.

vndk2234 2026-06-03

Comment ils arrivent à sortir un prix au niveau de GPT Nano...
À moins d’être du genre à téléverser sa propre carte d’identité quand on utilise une IA, utiliser un service chinois ne devrait pas poser de gros problème.

runableapp 2026-06-03

Comme il s’agit d’un modèle chinois, j’hésite encore un peu à l’utiliser, mais je me dis aussi que sans ce type de services chinois, jusqu’où les entreprises américaines auraient-elles augmenté leurs prix ? Je me demande aussi s’il n’y a pas un lien avec le fait que Trump ait mis en place ce genre de politiques.

b8g6pn 2026-06-02

Le critère selon lequel ce modèle rivaliserait avec les autres est sans doute un peu exagéré, mais le prix est vraiment choquant.

MiniMax-M3 fait ses débuts, dépasse GPT-5.5 et Gemini 3.1 Pro sur des benchmarks clés pour seulement 5 à 10 % du coût

Traduction intégrale

Le mot de l’auteur

À lire aussi

6 commentaires