DeepSeek通过R1模型更新向美国竞争对手施压 | 路透社
Brenda Goh,Eduardo Baptista
5月29日 - 中国人工智能初创公司深度求索(DeepSeek)于本周四凌晨发布了其推理模型R1的首个升级版本,加剧了与OpenAI等美国竞争对手的较量。
深度求索通过开发者平台Hugging Face表示,R1-0528是R1的一个小版本更新,但显著提升了其推理深度和推断能力,包括更好地处理复杂任务,使其性能接近OpenAI的o3推理模型和谷歌(GOOGL.O)的新标签页。1月份R1的发布在全球引发轰动,导致中国境外科技股暴跌,并挑战了"AI需要强大算力和巨额投资"的传统认知。自R1发布以来,阿里巴巴(9988.HK)的新标签页和腾讯(0700.HK)的新标签页等中国科技巨头也推出了声称超越深度求索的模型。与1月份R1时伴随多作者学术论文、全球AI界争相解读公司策略的盛况不同,本周四的升级公告显得颇为低调。
这家总部位于杭州的公司随后在X平台简短发帖称R1-0528性能有所提升。在微信公众号的长文中,深度求索表示在文本改写和摘要等场景下,“幻觉”(虚假或误导性结果)发生率降低了约45%至50%。
该公司表示,此次升级还支持以创新方式生成散文、小说等文体,并增强了前端代码生成和角色扮演等领域的性能。
深度求索表示:“该模型在数学、编程和通用逻辑等多项基准测试中展现出卓越表现。”
深度求索的成功打破了美国出口管制会阻碍中国AI发展的论调——该公司以极低成本发布的AI模型已达到或超越行业领先的美国模型水平。
这家初创公司周四补充称,其采用R1-0528模型的推理流程对阿里巴巴Qwen3 8B基础模型进行增强(该过程称为"蒸馏"),由此产生的变体性能较原版Qwen3提升超10%。
深度求索强调:“我们相信DeepSeek-R1-0528的思维链技术,无论对推理模型的学术研究还是小型化模型的工业开发都具有重要意义。”
彭博社周三报道了这次更新。报道称深度求索代表在微信群透露已完成"小规模实验性升级",用户可开始测试。
为应对深度求索的竞争,谷歌Gemini推出折扣访问方案,OpenAI则降价并发布算力需求更低的o3 Mini模型。
仍有预期认为Deepseek将推出R1的继任者R2。路透社3月援引消息人士称,R2原计划于5月发布。DeepSeek还在3月对其语言模型V3进行了更新。
(Brenda Goh和Eduardo Baptista报道)
((巴西利亚编辑部翻译))
路透社MCM
- 推荐主题:
- 商业