DeepSeek的Prover解题模型引发对下一代R2进展的猜测 | 南华早报

Xinmei Shen

2025-05-02

深度求索新升级的数学专用人工智能（AI）模型，点燃了公众对这家中国初创公司即将推出的R2推理模型的期待。尽管中国各大科技公司近期纷纷发布自家大语言模型加剧竞争，但R2的细节仍笼罩在神秘面纱中。周三，深度求索悄然开源了名为Prover-V2的新AI模型，该模型拥有6710亿参数，是其专攻数学证明模型的升级版。基于V3基础模型的这次渐进式更新，彰显了深度求索在获取英伟达最先进AI芯片受限的情况下，仍能开发强大而相对精简模型的能力。此次发布引发网络关注，人们一直密切关注这家明星初创的动态，但这并非许多人期待中的代际跨越。

就在发布前一天，阿里巴巴集团（本刊母公司）刚推出Qwen3系列AI模型，这家科技巨头宣称其多项指标超越深度求索R1推理模型。今年1月发布的DeepSeek-R1曾以高效资源利用率震惊全球AI界，仅用极低训练成本就达到OpenAI o1模型的性能表现。两周前OpenAI发布的o3和o4-mini被其称为"迄今最智能、最强大的模型"。

深度求索尚未公布R2的发布时间表或详细信息。然而，这家总部位于杭州的公司推出的新型Prover模型已获得人工智能和数学界的高度赞誉。一位X平台用户自称"作为一名数学奥赛学生感到震撼"。