DeepSeek的Prover解题模型引发对下一代R2进展的猜测 | 南华早报
Xinmei Shen
深度求索新升级的数学专用人工智能(AI)模型,点燃了公众对这家中国初创公司即将推出的R2推理模型的期待。尽管中国各大科技公司近期纷纷发布自家大语言模型加剧竞争,但R2的细节仍笼罩在神秘面纱中。周三,深度求索悄然开源了名为Prover-V2的新AI模型,该模型拥有6710亿参数,是其专攻数学证明模型的升级版。基于V3基础模型的这次渐进式更新,彰显了深度求索在获取英伟达最先进AI芯片受限的情况下,仍能开发强大而相对精简模型的能力。此次发布引发网络关注,人们一直密切关注这家明星初创的动态,但这并非许多人期待中的代际跨越。
就在发布前一天,阿里巴巴集团(本刊母公司)刚推出Qwen3系列AI模型,这家科技巨头宣称其多项指标超越深度求索R1推理模型。今年1月发布的DeepSeek-R1曾以高效资源利用率震惊全球AI界,仅用极低训练成本就达到OpenAI o1模型的性能表现。两周前OpenAI发布的o3和o4-mini被其称为"迄今最智能、最强大的模型"。
深度求索尚未公布R2的发布时间表或详细信息。然而,这家总部位于杭州的公司推出的新型Prover模型已获得人工智能和数学界的高度赞誉。一位X平台用户自称"作为一名数学奥赛学生感到震撼"。