MiniMax发布M1模型：AI大模型领域的新突破

网络 2025-06-17 23:04:42

2025-06-17 23:04:42 阅读

总部位于上海的人工智能独角兽企业MiniMax突然放了个大招。6月17日，MiniMax正式发布其自主研发的MiniMax-M1（以下简称M1）系列模型。M1被定义为“全球首个开源的大规模混合架构推理模型”。技术报告显示：M1模型在处理百万Token级长文本的能力方面实现了重大突破，成为上下文最长的推理模型；其RL（强化训练）成本下降一个量级，成本仅53万美金，推理效率则数倍于竞争对手。

今年开年以来，DeepSeek持续冲击着大模型行业的格局。如今，MiniMax推出号称具备“全球最长上下文”的M1模型，有可能后来者居上吗？当前上下文最长的推理模型价格还主打性价比。MiniMax不仅开源了模型权重，还提供了API（应用程序编程接口）服务，价格主打性价比。

其定价策略为：在0~3.2万（含）Token范围，输入时0.8元/百万Token，输出时8元/百万Token；在3.2万~12.8万（含）Token范围，输入时1.2元/百万Token，输出时16元/百万Token；在12.8万~100万Token范围，输入时2.4元/百万Token，输出时在24元/百万Token。此外，MiniMax宣布，在其自有的App（应用程序）和Web（网络）端，M1模型将保持不限量免费使用。

在长文本能力上，M1模型原生支持高达100万Token的上下文窗口，这一数字与谷歌最新的Gemini 2.5 Pro持平，是DeepSeek-R1（12.8万Token）的近8倍。同时，它还支持业内最长的8万Token推理输出。

图片来源：开源技术报告截图

MiniMax方面表示，实现这一突破的关键在于独创的“Lightning Attention”混合构架。M1的混合架构，特别是注意力机制，能够显著优化长下文输入的计算效率。就这一模型，知名数字经济学者、工信部信息通信经济专家委员会委员盘和林表示，MiniMax通过“CISPO”对“PPO/GRPO”裁剪方式的缺陷进行了一些优化，其目的还是为了降低训练成本和推理成本。

据记者了解，MiniMax此次提出的CISPO算法是另辟蹊径，它没有采用传统算法中调整Token的更新方式，而是通过裁剪重要性采样权重来提升、强化学习的效率、稳定性。“这是进步，但这个进步是否能够转化为商业价值暂时还不清楚。要看具体工具在应用层面的反馈。”盘和林说。

值得一提的是，今年4月，阿里巴巴开源新一代通义千问模型Qwen3，参数量仅为DeepSeek-R1的1/3，成本大幅下降，据称性能全面超越DeepSeek-R1、OpenAI o1等全球顶尖模型。3月16日，百度正式发布“文心大模型4.5”“文心大模型X1”。

大模型还有优化空间，谁找对方向就是下一科技巨头。在DeepSeek的冲击之下，大模型创业公司今年一开年就面对着战略方向的转折点：是做技术还是做产品？今年1月，MiniMax创始人兼CEO闫俊杰表示，现在MiniMax最重要的目标不是增长，也不是收入，是“加速技术迭代”。同样在1月，MiniMax发布并开源新一代“01系列”模型。到了3月，MiniMax对品牌进行了更清晰的拆分。5月，MiniMax发布新一代语音大模型“Speech-02”。

虽说在重要性上让步于技术攻坚，但在商业化上，MiniMax在B端（商业端）和C端（消费者端）上皆有布局。此外，在今年1月发布并开源新一代01系列模型时，MiniMax方面便提及，2025年，AI将迎来至关重要的发展节点，AI Agent（智能体）有望成为新一年最重要的产品形态。

国泰海通证券在近期的研报中提及，大模型在多模态理解和复杂推理上的突破，为AI Agent的发展提供了核心技术支撑。AI应用虽尚处于落地初期，但未来发展路径明晰，当前处于B端萌芽期，未来C端有望大规模爆发，最终将实现B端与C端并行发展，全面推动AI产业繁荣。

MiniMax刚刚推出的M1是否能助力其在AI Agent这一方向上的发展？对此，盘和林肯定其“有帮助”，但认为还没有到革命性的程度，属于渐进性算法优化。早在今年1月接受采访时，闫俊杰就明确了技术和产品的关系，他表示，更好的模型可以导向更好的应用，但更好的应用和更多用户并不会导向更好的模型。

在DeepSeek火爆全网时，MiniMax坚持将目标定为“加速技术迭代”。半年后，MiniMax终于来到了自己的“主场时刻”。据记者了解，M1的发布仅仅是拉开了MiniMax“开源周”的序幕。在接下来的4个工作日里，MiniMax计划每天发布一项新技术或产品更新。

就MiniMax坚持技术攻坚的前景，盘和林表示，他看好加码大模型的创业公司。在盘和林看来，大模型一定还有优化空间，谁找对了大模型算法优化的方向，谁就是下一个科技巨头。“DeepSeek向前走了一步，但还不够。”盘和林说。

（文章来源：每日经济新闻）

MiniMax M1模型 AI大模型推理效率

声明：

风险提示：以上内容仅来自互联网，文中内容或观点仅作为原作者或者原网站的观点，不代表本站的任何立场，不构成与本站相关的任何投资建议。在作出任何投资决定前，投资者应根据自身情况考虑投资产品相关的风险因素，并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性，对此本站不做任何保证和承诺。

本站认真尊重知识产权及您的合法权益，如发现本站内容或相关标识侵犯了您的权益，请您与我们联系删除。

MiniMax发布M1模型：AI大模型领域的新突破

推荐文章：

习近平会见乌总统，中东局势影响期货市场走向

航运期货工具助力企业应对海运费波动风险

以色列伊朗冲突升级，油价影响成市场焦点

白银期货大幅拉涨，创下近一年来新高

伊以冲突升级，原油期货价格波动加剧

伊拉克“真主旅”威胁袭击美国中东利益，局势紧张升级

全球“超级央行周”来袭，中东局势突变加剧金融市场动荡

习近平文章强调中长期规划指导经济社会发展

以伊冲突升级，能源市场动荡，霍尔木兹海峡关闭风险引油价飙升

中东局势升级引发原油期货剧烈波动

美联储议息在即美元走势与多国货币动态解析

2025世界人形机器人运动会8月北京启幕

2024-2025跨境电商：规模新高与增长预期

金融领域生成式AI应用：风险与应对策略

6·18白酒电商变革：即时零售冲击与渠道融合趋势

全球“超级央行周”来袭，中东局势突变加剧金融市场动荡