MiniMax发布M1模型:AI大模型领域的新突破

网络 2025-06-17 23:04:42
期货学院 2025-06-17 23:04:42 阅读

总部位于上海的人工智能独角兽企业MiniMax突然放了个大招。6月17日,MiniMax正式发布其自主研发的MiniMax-M1(以下简称M1)系列模型。M1被定义为“全球首个开源的大规模混合架构推理模型”。技术报告显示:M1模型在处理百万Token级长文本的能力方面实现了重大突破,成为上下文最长的推理模型;其RL(强化训练)成本下降一个量级,成本仅53万美金,推理效率则数倍于竞争对手。

今年开年以来,DeepSeek持续冲击着大模型行业的格局。如今,MiniMax推出号称具备“全球最长上下文”的M1模型,有可能后来者居上吗?当前上下文最长的推理模型价格还主打性价比。MiniMax不仅开源了模型权重,还提供了API(应用程序编程接口)服务,价格主打性价比。

其定价策略为:在0~3.2万(含)Token范围,输入时0.8元/百万Token,输出时8元/百万Token;在3.2万~12.8万(含)Token范围,输入时1.2元/百万Token,输出时16元/百万Token;在12.8万~100万Token范围,输入时2.4元/百万Token,输出时在24元/百万Token。此外,MiniMax宣布,在其自有的App(应用程序)和Web(网络)端,M1模型将保持不限量免费使用。

在长文本能力上,M1模型原生支持高达100万Token的上下文窗口,这一数字与谷歌最新的Gemini 2.5 Pro持平,是DeepSeek-R1(12.8万Token)的近8倍。同时,它还支持业内最长的8万Token推理输出。

图片来源:开源技术报告截图

MiniMax方面表示,实现这一突破的关键在于独创的“Lightning Attention”混合构架。M1的混合架构,特别是注意力机制,能够显著优化长下文输入的计算效率。就这一模型,知名数字经济学者、工信部信息通信经济专家委员会委员盘和林表示,MiniMax通过“CISPO”对“PPO/GRPO”裁剪方式的缺陷进行了一些优化,其目的还是为了降低训练成本和推理成本。

据记者了解,MiniMax此次提出的CISPO算法是另辟蹊径,它没有采用传统算法中调整Token的更新方式,而是通过裁剪重要性采样权重来提升、强化学习的效率、稳定性。“这是进步,但这个进步是否能够转化为商业价值暂时还不清楚。要看具体工具在应用层面的反馈。”盘和林说。

值得一提的是,今年4月,阿里巴巴开源新一代通义千问模型Qwen3,参数量仅为DeepSeek-R1的1/3,成本大幅下降,据称性能全面超越DeepSeek-R1、OpenAI o1等全球顶尖模型。3月16日,百度正式发布“文心大模型4.5”“文心大模型X1”。

大模型还有优化空间,谁找对方向就是下一科技巨头。在DeepSeek的冲击之下,大模型创业公司今年一开年就面对着战略方向的转折点:是做技术还是做产品?今年1月,MiniMax创始人兼CEO闫俊杰表示,现在MiniMax最重要的目标不是增长,也不是收入,是“加速技术迭代”。同样在1月,MiniMax发布并开源新一代“01系列”模型。到了3月,MiniMax对品牌进行了更清晰的拆分。5月,MiniMax发布新一代语音大模型“Speech-02”。

虽说在重要性上让步于技术攻坚,但在商业化上,MiniMax在B端(商业端)和C端(消费者端)上皆有布局。此外,在今年1月发布并开源新一代01系列模型时,MiniMax方面便提及,2025年,AI将迎来至关重要的发展节点,AI Agent(智能体)有望成为新一年最重要的产品形态。

国泰海通证券在近期的研报中提及,大模型在多模态理解和复杂推理上的突破,为AI Agent的发展提供了核心技术支撑。AI应用虽尚处于落地初期,但未来发展路径明晰,当前处于B端萌芽期,未来C端有望大规模爆发,最终将实现B端与C端并行发展,全面推动AI产业繁荣。

MiniMax刚刚推出的M1是否能助力其在AI Agent这一方向上的发展?对此,盘和林肯定其“有帮助”,但认为还没有到革命性的程度,属于渐进性算法优化。早在今年1月接受采访时,闫俊杰就明确了技术和产品的关系,他表示,更好的模型可以导向更好的应用,但更好的应用和更多用户并不会导向更好的模型。

在DeepSeek火爆全网时,MiniMax坚持将目标定为“加速技术迭代”。半年后,MiniMax终于来到了自己的“主场时刻”。据记者了解,M1的发布仅仅是拉开了MiniMax“开源周”的序幕。在接下来的4个工作日里,MiniMax计划每天发布一项新技术或产品更新。

就MiniMax坚持技术攻坚的前景,盘和林表示,他看好加码大模型的创业公司。在盘和林看来,大模型一定还有优化空间,谁找对了大模型算法优化的方向,谁就是下一个科技巨头。“DeepSeek向前走了一步,但还不够。”盘和林说。

(文章来源:每日经济新闻)

声明:
  1. 风险提示:以上内容仅来自互联网,文中内容或观点仅作为原作者或者原网站的观点,不代表本站的任何立场,不构成与本站相关的任何投资建议。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性,对此本站不做任何保证和承诺。
  2. 本站认真尊重知识产权及您的合法权益,如发现本站内容或相关标识侵犯了您的权益,请您与我们联系删除。
最新发布
为您推荐