中国MiniMax公司称其新型AI推理模型超越深度求索——彭博社

bloomberg

2025-06-17

中国AI新秀MiniMax发布了一款新的大型语言模型，加入了一众国内同行的行列，这些公司都受到启发，希望在推理AI领域超越DeepSeek。

这家总部位于上海的公司吹捧其新模型MiniMax-M1在处理复杂生产力任务方面的效率，声称它超越了所有中国闭源竞争对手在一份声明中。在MiniMax提供的多项基准测试中，M1的得分也高于DeepSeek最新的R1-0528模型。

#MiniMaxWeek的第1/5天：#MiniMaxWeek：我们开源了MiniMax-M1，这是我们最新的LLM——在长上下文推理方面设定了新标准。- 全球最长的上下文窗口：100万token输入，8万token输出- 开源模型中最佳的代理使用体验- 无与伦比的强化学习效率：… pic.twitter.com/bGfDlZA54n

— MiniMax (官方) (@MiniMax__AI) 2025年6月16日

M1支持百万级tokens的上下文长度，是深度求索R1的八倍。上下文长度有助于AI系统同时处理更多信息。该公司表示，在某些情况下，MiniMax的模型仅需消耗深度求索约30%的资源。彭博社尚未独立验证MiniMax的声明。

该公司声明称，其采用大规模强化学习训练M1模型，动用了512块英伟达H800 GPU，租赁成本达534,700美元。

MiniMax获得中国互联网巨头腾讯控股与阿里巴巴集团支持，属于国内六家顶尖AI初创企业"小龙"之列。过去一年间，这些企业共筹集数十亿美元风投资金——但随着深度求索的崛起，该团体中多数公司已缩减或终止基础研究，转而聚焦应用开发。

MiniMax表示将在未来几天公布更多进展。该公司其他产品包括视频生成工具及AI伴侣应用。