中国深度求索公司逼近美国对手OpenAI,升级模型超越阿里巴巴 | 南华早报
Ben Jiang
中国人工智能(AI)初创企业深度求索(DeepSeek)表示,其1月首次发布的R1推理模型迎来首个重大升级版本R1-0528,性能已匹敌包括OpenAI和谷歌在内的全球顶尖竞争对手。在周四晚间发布的声明中,深度求索重点介绍了新模型在推理和创意写作能力上的提升,使其更擅长撰写议论文、小说和散文,文风可高度模拟人类作者。编程能力也得到增强。
该公司称最新版本将"幻觉"(AI生成缺乏事实依据的误导性信息)发生率降低了50%。
深度求索表示,这些升级是通过在后训练阶段投入额外算力实现的。后训练指开发者在模型完成主要训练流程后,对其进行最终调优与强化的过程,通常用于提升效率、加强内容安全性与准确性。
“升级后的R1模型在数学、编程和通用逻辑等多项基准测试中表现优于国内其他AI模型,与[OpenAI的]O3、[谷歌的]Gemini2.5-Pro等国际顶级模型持平。“深度求索称。
深度求索引用的基准结果显示,R1-0528性能超越阿里巴巴的通义千问3模型。图片来源:Shutterstock
此次更新源于原R1模型在四月底被阿里巴巴集团旗舰模型Qwen3超越,失去LiveBench开源AI系统排行榜榜首位置。这一变动凸显出中国科技企业在推进AI能力方面的激烈竞争。