DeepSeek称升级版模型推理能力更强,幻觉现象减少 - 彭博社
Luz Ding
深度求索(DeepSeek)于本周三宣布了其模型升级。
摄影师:安德烈·鲁达科夫/彭博社中国初创企业深度求索周四表示,其升级后的人工智能模型在数学、编程和通用逻辑方面的表现优于前代版本,同时产生幻觉的情况更少。
该公司在AI模型平台Hugging Face的帖子中介绍,R1模型的升级版具有更强的推理深度。今年1月,这款由中国初创企业以自称"极低成本"开发的模型,其性能已能媲美美国大型开发商的系统,令AI界震惊。
该公司表示:“其整体性能现已接近领先模型水平”,如OpenAI的o3和谷歌的Gemini 2.5 Pro。
这家总部位于杭州的初创企业在1月发布初代R1模型时震撼了全球科技行业,引发了对全球AI计算资源投入热潮的质疑,并推动从阿里巴巴集团到智谱AI等中国厂商纷纷发布AI产品。
阅读更多:深度求索的“科技狂人”正威胁美国在AI领域的主导地位
R1的亮相让深度求索创始人梁文峰成为科技界名人,也象征着中国有能力与硅谷顶尖企业竞争。今年二月,习近平主席邀请梁文峰参加了一场高规格的企业家座谈会。这位年轻创始人坐在阿里巴巴联合创始人马云和腾讯控股有限公司马化腾等业界巨擘之间。
| 快速掌握中国AI模型爆发动态 |
|---|
| 腾讯开源照片转视频AI模型 |
| 小米入局中国AI竞赛 推出首款类深度求索模型 |
| 阿里巴巴在后深度求索时代推出最新旗舰AI模型 |
| 中国百度升级文心AI模型并大幅降价 |
| 中国智谱推出免费AI智能体 回应深度求索与Manus |
深度求索于周三宣布了R1的升级版DeepSeek-R1-0528——就在加州圣克拉拉市AI芯片龙头英伟达公司发布最新财报前数小时,该公司股价在R1发布后曾应声暴跌。随着AI数据中心投资持续强劲增长,这家美国公司已恢复元气,并对本季度给出了稳健预期。