MiniMax发布M3模型，AI大模型竞争转向长上下文与智能体能力

国内大模型赛道再迎重磅产品发布。6月1日，国产大模型公司MiniMax正式发布新一代通用模型MiniMax M3。M3采用全新的自研稀疏注意力架构MiniMax Sparse Attention（MSA），在编程及智能体能力、超长上下文及原生多模态等多个关键方向，均实现代际突破。据悉，M3是国内首个同时具备“前沿 Coding 能力、1M超长上下文、原生多模态”三项核心能力的大模型，也是目前全球唯一具备完整能力组合的开源选项。

核心突破：从底层注意力机制重写百万上下文

支撑M3 三大能力合一的，是其自研的稀疏注意力架构MSA（MiniMax Sparse Attention）。相较传统全注意力机制，MSA能够显著降低长上下文下的计算成本，并将上下文窗口提升至100万token。这意味着模型在处理长文档、复杂代码仓库、多轮任务协作等场景时，能够在一次推理中保留更完整的信息链路。MiniMax披露，在100万上下文规模下，M3单token计算量仅为上一代模型的约1/20，推理效率显著提升。

在业内看来，这也是全球大模型竞赛的重要新变量。随着Agent任务复杂度不断提高，“更长上下文、更稳定记忆、更低成本推理”正在成为决定产品可用性的关键能力。

M3在Coding&Agentic 能力明显提升，在涵盖软件工程、终端执行、效率与协议理解等多个维度的国际权威评测中，均达到国际领先水平：在衡量Coding能力的SWE-Bench Pro上，MiniMax M3超过GPT-5.5 和Gemini 3.1 Pro，接近Opus 4.7。在综合评估SVG生成性能的基准SVG-Bench上，MiniMax M3超过Opus4.7。

原生多模态：训练数据规模推至100 万亿 Token 量级

MiniMax表示，M3从训练起点便采用文本、图片、视频等多模态混合训练，并在数据规模和训练管线上进一步扩展。模型不仅支持图像与视频理解，也具备桌面操作能力，可在复杂跨应用环境中执行Computer Use任务。值得注意的是，MiniMax 已可以将训练数据 Token 规模提升至100 万亿的量级。

这意味着模型能力正在从语言理解进一步向真实数字环境延伸。无论是办公自动化、企业软件操作，还是更复杂的生产力场景，AI进入实际执行层的速度正在明显加快。

业内人士认为，随着M3发布，MiniMax在全球AI竞赛中的定位正在进一步清晰：它以“开源、多能力合一”的前沿模型为差异化定位，填补国内AI生态在这一维度的空白。

AI产业仍处于高速演进阶段，随着模型能力持续逼近真实工作场景，围绕Agent的下一轮竞争，已经提前打响。

文/广州日报新花城记者：张露

广州日报新花城编辑：杨维玲