MiniMax-M3颠覆AI市场：低成本高性能碾压GPT-5.5

企业AI领域周末传来重大消息，中国人工智能初创公司MiniMax于美东时间周日晚上发布了备受期待的M3大语言模型。这款模型前沿级的编程与智能体性能结合100万token的上下文窗口和原生多模态能力，而成本仅为领先专有模型的零头，其新的订阅代币计划起价仅为每月20美元。

革命性定价策略

公司领导层还宣布，计划在未来10天内以开源许可形式提供该模型，包括”开源权重”，允许企业免费完整下载和定制化使用。

目前，MiniMax-M3可通过MiniMax API获取，优惠价为每100万输入token 0.3美元，每100万输出token（新鲜缓存）1.20美元，为期一周。在成本方面，轻松击败Google、OpenAI和Anthropic等美国科技巨头，同时在选定基准测试上超越了前两者的最新模型性能。

即使按每100万输入/输出token 0.6/2.40美元的全价计算，MiniMax-M3的成本仅为领先美国专有模型的8-20%。

长期以来，大语言模型开发遵循着一个既定矩阵：开发者要么通过受限API访问顶级的闭源智能系统，要么部署敏捷、经济实惠的开源模型，但这些模型在多步推理、密集编码任务和大规模数据序列方面表现欠佳。MiniMax-M3从根本上颠覆了这一范式。

通过统一这两个历史上分离的前沿能力，M3引入了全面效用水平，这种水平此前仅限于昂贵的闭源生态系统，同时有效降低了执行复杂开发循环所需的计算资源消耗，重新定义了开源权重系统的基准。

在当前AI模型市场中，MiniMax-M3凭借其卓越的性价比脱颖而出。对比主流模型：

相比之下，GPT-5.5的总成本高达35美元/百万，Gemini 3.1 Pro Preview的总成本为22美元/百万，而MiniMax-M3仅为它们的5-10%。

该模型高效性的核心在于对传统Transformer网络架构的革新。标准注意力机制计算复杂度呈二次方增长（O(N²)），意味着随着文本输入长度增加，计算和财务成本会急剧上升。

为了对抗这种”固有缺陷”，工程团队实现了MiniMax稀疏注意力（MSA），这是一种简洁、可扩展的稀疏注意力架构。

若将这一创新可视化，传统全注意力机制就像编辑每次需要验证一个句子时都要从头阅读整个图书馆。而MSA则扮演智能索引员的角色，通过预过滤阶段将Key-Value（KV）矩阵划分为高度精确的区块。

在操作层面，MSA采用”KV外部收集Q”方法。系统将KV块视为外部循环，仅动态聚合命中它们的特定查询。由于每个数据块仅读取一次且内存访问保持严格连续，硬件利用率大幅提升。

内部测试显示，MSA的运行速度比Flash-Sparse-Attention或flash-moba等替代开源解决方案快4倍以上。

MiniMax并非采用预训练文本网络与独立视觉模型融合的方式，而是从”零步”开始将M3设计为原生多模态系统。

公司重构了其数据摄取机制，以自然混合的文本、图像和视觉组件序列，将整个预训练语料库扩展到超过100万亿token。

这种深度数据对齐使模型能够将复杂的视觉几何结构（如编程图表或坐标地图）转化为精确的文本表示，从而在多模态任务中展现出前所未有的理解力。

MiniMax-M3的发布不仅标志着中国AI技术的重大突破，更预示着高性能AI模型将不再局限于少数科技巨头，开源与闭源之间的界限正在被重新定义。

关注微信号：智享开源 ，及时了解更新信息。

0 0