中国深度求索公司发布其R1推理引擎更新 | 路透社
Reuters
2025年1月29日拍摄的插图中可见Deepseek标识。路透社/Dado Ruvic/插图/档案照片上海,5月29日 - 中国人工智能初创公司深度求索(DeepSeek)于周四凌晨发布了其R1推理模型的更新,加剧了与OpenAI等美国竞争对手的较量。
深度求索在开发者平台Hugging Face上线了R1-0528版本,但尚未正式对外公告。该公司未发布该模型的说明文档及性能对比数据。
路透关税观察日报是您获取全球贸易与关税动态的每日指南。点击此处注册
由加州大学伯克利分校、麻省理工学院和康奈尔大学研究人员开发的LiveCodeBench基准测试显示,在代码生成能力上,深度求索新版R1推理模型略逊于OpenAI的o4 mini和o3推理模型,但优于xAI的Grok 3 mini及阿里巴巴的千问3。
彭博社周三早些报道了此次更新。报道称深度求索代表在微信群中表示已完成"小规模试验性升级",用户可开始测试。
今年早些时候,深度求索发布的AI模型以极低成本达到甚至超越美国行业领先模型水平,打破了"美国出口管制阻碍中国AI发展"的固有认知。
1月R1模型的发布曾导致中国境外科技股暴跌挑战了传统观点即扩展人工智能需要巨大的计算能力和投资。自R1发布以来,阿里巴巴(9988.HK),新开标签页和腾讯(0700.HK),新开标签页等中国科技巨头已发布声称超越深度求索的模型。谷歌(GOOGL.O),新开标签页的Gemini推出了分级折扣访问服务,而OpenAI则降价并发布了依赖较少计算能力的o3 Mini模型。外界普遍预计该公司仍将发布R1的继任者R2。路透社3月援引消息人士报道称,R2原计划于5月发布。深度求索还在3月发布了升级版V3大语言模型。* 推荐主题:
- 人工智能