中国深度求索公司逼近美国对手OpenAI，升级模型超越阿里巴巴 | 南华早报

Ben Jiang

2025-05-31

中国人工智能（AI）初创企业深度求索（DeepSeek）表示，其1月首次发布的R1推理模型迎来首个重大升级版本R1-0528，性能已匹敌包括OpenAI和谷歌在内的全球顶尖竞争对手。在周四晚间发布的声明中，深度求索重点介绍了新模型在推理和创意写作能力上的提升，使其更擅长撰写议论文、小说和散文，文风可高度模拟人类作者。编程能力也得到增强。

该公司称最新版本将"幻觉"（AI生成缺乏事实依据的误导性信息）发生率降低了50%。

深度求索表示，这些升级是通过在后训练阶段投入额外算力实现的。后训练指开发者在模型完成主要训练流程后，对其进行最终调优与强化的过程，通常用于提升效率、加强内容安全性与准确性。

“升级后的R1模型在数学、编程和通用逻辑等多项基准测试中表现优于国内其他AI模型，与[OpenAI的]O3、[谷歌的]Gemini2.5-Pro等国际顶级模型持平。“深度求索称。

深度求索引用的基准结果显示，R1-0528性能超越阿里巴巴的通义千问3模型。图片来源：Shutterstock

此次更新源于原R1模型在四月底被阿里巴巴集团旗舰模型Qwen3超越，失去LiveBench开源AI系统排行榜榜首位置。这一变动凸显出中国科技企业在推进AI能力方面的激烈竞争。