中国MiniMax公司称其新型AI推理模型超越深度求索——彭博社
bloomberg
中国AI新秀MiniMax发布了一款新的大型语言模型,加入了一众国内同行的行列,这些公司都受到启发,希望在推理AI领域超越DeepSeek。
这家总部位于上海的公司吹捧其新模型MiniMax-M1在处理复杂生产力任务方面的效率,声称它超越了所有中国闭源竞争对手在一份声明中。在MiniMax提供的多项基准测试中,M1的得分也高于DeepSeek最新的R1-0528模型。
#MiniMaxWeek的第1/5天:#MiniMaxWeek:我们开源了MiniMax-M1,这是我们最新的LLM——在长上下文推理方面设定了新标准。- 全球最长的上下文窗口:100万token输入,8万token输出- 开源模型中最佳的代理使用体验- 无与伦比的强化学习效率:… pic.twitter.com/bGfDlZA54n
— MiniMax (官方) (@MiniMax__AI) 2025年6月16日
M1支持百万级tokens的上下文长度,是深度求索R1的八倍。上下文长度有助于AI系统同时处理更多信息。该公司表示,在某些情况下,MiniMax的模型仅需消耗深度求索约30%的资源。彭博社尚未独立验证MiniMax的声明。
该公司声明称,其采用大规模强化学习训练M1模型,动用了512块英伟达H800 GPU,租赁成本达534,700美元。
MiniMax获得中国互联网巨头腾讯控股与阿里巴巴集团支持,属于国内六家顶尖AI初创企业"小龙"之列。过去一年间,这些企业共筹集数十亿美元风投资金——但随着深度求索的崛起,该团体中多数公司已缩减或终止基础研究,转而聚焦应用开发。
MiniMax表示将在未来几天公布更多进展。该公司其他产品包括视频生成工具及AI伴侣应用。