《南华早报》:深度求索悄然更新开源模型,可处理数学证明
Ben Jiang
中国初创企业深度求索(DeepSeek)于周三悄然开源了一款新的专业人工智能(AI)模型,就在阿里巴巴发布其通义千问家族第三代产品的次日。随着生成式AI能力竞赛的白热化,这场角逐正持续升温。总部位于杭州的深度求索将最新开源模型Prover-V2上传至全球最大AI开源社区Hugging Face,但未在其官方社交媒体渠道发布任何公告。此举正值业界对其即将推出的R2推理模型充满期待之际。
深度求索的Prover系列是专为解决数学相关问题设计的垂直领域模型。
该公司尚未在Hugging Face页面提供该模型的具体细节。南华早报查看的上传文件显示,该模型基于拥有6710亿参数的DeepSeek V3模型构建,采用专家混合架构以实现高性价比的训练与运行。
这款专注于数学能力的模型有望增强通用基础模型的数学技能,这引发了业界对深度求索即将推出更多新模型的猜测。
截至周三发稿,深度求索尚未就置评请求作出回应。