← AI War Room
Intelligence artificielle

MiniMax M3 : le modèle chinois qui facture dix fois moins que GPT et affiche des benchmarks supérieurs

Tech4B2B · · 5 min (mis à jour le )
Illustration : MiniMax M3 : le modèle chinois qui facture dix fois moins que GPT et affiche des benchmarks supérieurs
  • Sujet: MiniMax M3 : le modèle chinois qui facture dix fois moins que GPT et affiche des benchmarks supérieurs
  • Date:
MiniMax a lancé M3 le 1er juin, un modèle multimodal à fenêtre d'un million de tokens qu'il dit capable de battre GPT-5.5 et Gemini 3.1 Pro sur SWE-Bench Pro, pour une fraction du prix des frontier fermés. Le chiffre qui retient l'attention des DSI n'est pas un score de benchmark, c'est le prix : 0,60 dollar le million de tokens en entrée, soit un quinzième à un vingt-cinquième de ce que facturent Opus ou GPT-5.5. L'architecture MSA divise par vingt le coût de calcul par token sur les longs contextes. Mais tous les chiffres sont mesurés par MiniMax sur sa propre infrastructure, les poids ouverts n'ont pas encore été publiés, et l'entreprise shanghaïenne tombe sous la loi chinoise de 2017 sur le renseignement. Quatre mois plus tôt, le même MiniMax fermait ses poids.

MiniMax a publié M3 dimanche soir, le 1er juin. Premier modèle à poids ouverts à combiner, selon l'entreprise, du codage de niveau frontier, une fenêtre de contexte d'un million de tokens et une compréhension multimodale native dans un seul système. L'API est disponible immédiatement, les poids promis sous dix jours.

Le score qui fait parler : 59,0% sur SWE-Bench Pro, un benchmark d'agent autonome sur des tâches d'ingénierie logicielle réelles. Devant GPT-5.5 (58,6%) et Gemini 3.1 Pro (54,2%). Derrière Claude Opus 4.8, qui affiche 69,2% sur le même test.

Le chiffre que les DSI regardent vraiment est ailleurs. À 0,60 dollar le million de tokens en entrée et 2,40 dollars en sortie — moitié prix la première semaine — M3 se situe à environ un quinzième du tarif d'Opus 4.7 et un vingt-cinquième de celui de GPT-5.5. Pour des workloads agentiques qui consomment du token au kilomètre, l'écart se compose vite.

L'architecture s'appelle MiniMax Sparse Attention. Elle ne traite que les blocs de données pertinents, ce qui ramène le coût de calcul par token, à un million de contexte, à un vingtième de la génération précédente — avec un préremplissage plus de neuf fois plus rapide et un décodage plus de quinze fois plus rapide. C'est ce qui rend la fenêtre d'un million de tokens économiquement praticable, pas seulement techniquement annoncée.

Tous ces chiffres ont été produits par MiniMax. Sur son infrastructure, avec ses baselines, parfois en utilisant Claude Code comme échafaudage d'agent. Les scores indépendants d'Artificial Analysis et de LMArena n'étaient pas publiés au moment du lancement. Un modèle qui brille sur un leaderboard peut se comporter autrement dans un dépôt interne mal rangé.

Sur PostTrainBench, M3 marque 0,37, derrière Opus 4.7 (0,42) et GPT-5.5 (0,39). Sur ARC-AGI-2, les modèles chinois restent en retrait des labos américains. La victoire n'est pas un grand chelem.

Shanghai

MiniMax a son siège à Shanghai. La loi chinoise sur le renseignement national, promulguée en 2017, oblige toute entreprise chinoise à « soutenir, assister et coopérer » avec le travail de renseignement de l'État. L'obligation est continue, ne dépend d'aucune requête préalable, et n'offre aucune voie de refus. Pour une charge de travail agentique qui fait transiter du code propriétaire ou des données client par l'endpoint API de MiniMax, la donnée tombe sous juridiction chinoise, quel que soit l'emplacement des serveurs.

L'American Enterprise Institute nommait MiniMax en avril, écrivant que les utilisateurs partageant code, contrats et documents stratégiques avec ces systèmes les déposent « de fait, dans une base de données accessible au gouvernement chinois ». Le 29 avril, deux commissions de la Chambre des représentants américaine ont annoncé une enquête conjointe visant MiniMax aux côtés de Moonshot, Alibaba et DeepSeek. Aucun backdoor confirmé sur M3, aucun incident documenté de partage de données. L'obligation légale, elle, est structurelle.

Les poids ouverts changent l'équation pour ceux qui peuvent déployer en local : un CISO qui fait tourner M3 sur site n'envoie rien à l'endpoint API. Sauf que les poids n'ont pas encore été publiés à l'heure du lancement, et qu'ils sont promis pour dans dix jours.

Il y a quatre mois, MiniMax faisait le chemin inverse. M2, sorti en octobre 2025 sous licence MIT, dominait le classement des systèmes open-source sur l'Artificial Analysis Intelligence Index. M2.5 a suivi en février, ouvert lui aussi. M2.7 a fermé ses poids. L'entreprise s'est introduite à la bourse de Hong Kong le 9 janvier 2026, levant environ 620 millions de dollars, avec Alibaba et le fonds souverain d'Abu Dhabi parmi les investisseurs cornerstone. Plus de 70% de son chiffre d'affaires est réalisé hors de Chine.

Les équipes qui avaient bâti des workflows de production sur M2 et M2.5 ont dû réévaluer leur risque fournisseur quand les poids se sont refermés. M3 rouvre. La promotion à moitié prix expire au bout d'une semaine.

TL;DR

MiniMax met du frontier agentique à un quinzième du prix d'Opus, avec une loi chinoise sur le renseignement attachée au contrat.

  • M3 revendique 59,0% sur SWE-Bench Pro, devant GPT-5.5 et Gemini 3.1 Pro, à 0,60 dollar le million de tokens en entrée — tous les benchmarks mesurés par MiniMax, scores indépendants pas encore publiés.
  • L'architecture MSA divise par vingt le coût de calcul sur un contexte d'un million de tokens, rendant la fenêtre longue économiquement utilisable.
  • Siège à Shanghai, loi de 2017 sur le renseignement, enquête du Congrès américain en cours, et poids ouverts annoncés mais pas encore livrés.

Questions fréquentes

Les scores de benchmark sont-ils fiables ?

Ils proviennent tous de MiniMax, mesurés sur son infrastructure avec ses propres baselines. Les vérificateurs indépendants comme Artificial Analysis n'avaient rien publié au lancement.

Le risque juridictionnel chinois disparaît-il avec les poids ouverts ?

En déploiement local, rien ne transite par l'API de MiniMax, donc l'exposition baisse fortement. Mais les poids n'étaient pas encore publiés au lancement, et l'usage via API reste sous loi chinoise.

Le prix annoncé est-il celui qu'on paiera réellement ?

Non : 0,30 dollar en entrée est une promotion d'une semaine. Le tarif standard à modéliser est 0,60 dollar en entrée et 2,40 dollars en sortie, qui reste très en dessous des frontier fermés.

Le brief tech qui compte
Chaque matin à 7h, les 5 signaux tech B2B à ne pas manquer.