DeepSeek是什么,它为什么会颠覆人工智能行业?| 路透社
Eduardo Baptista
Deepseek 标志和中国国旗在2025年1月27日拍摄的插图中可见。路透社/Dado Ruvic/插图北京,1月27日(路透社)- 中国初创公司 DeepSeek 最新 AI 模型的发布,声称其性能与美国行业领先模型相当或更好,且成本仅为其一小部分,这威胁到技术世界的秩序。
该公司在全球 AI 圈内引起关注,因为上个月在一篇论文中写道,DeepSeek-V3 的训练所需的计算能力不到600万美元,使用的是 Nvidia H800 芯片。
DeepSeek 的 AI 助手,由 DeepSeek-V3 提供支持,已 超越 竞争对手 ChatGPT,成为美国苹果应用商店中评分最高的免费应用。这引发了对一些美国科技公司承诺数十亿美元 AI 投资背后理由的质疑,几家大型科技公司的股票,包括 Nvidia,受到了影响。以下是一些关于这家正在全球范围内震撼 AI 领域的公司的事实。
为什么 DeepSeek 引起了轰动?
2022 年底 OpenAI 的 ChatGPT 发布引发了 中国科技公司之间的争抢,他们急于创建自己的人工智能聊天机器人。但在搜索引擎巨头百度发布第一个中国 ChatGPT 等效产品后(9888.HK),在中国对美国和中国公司之间的人工智能能力差距感到广泛失望。DeepSeek的模型的质量和成本效率彻底改变了这一叙述。这两款受到硅谷高管和美国科技公司工程师一致赞誉的模型,DeepSeek-V3和DeepSeek-R1,已与OpenAI和Meta的最先进模型相媲美,这家中国初创公司表示。
它们的使用成本也更低。根据DeepSeek官方微信账号的一篇帖子,刚刚发布的DeepSeek-R1的使用成本比OpenAI的o1模型便宜20到50倍,具体取决于任务。
但一些人公开对DeepSeek的成功故事表示怀疑。
Scale AI首席执行官Alexandr Wang在周四接受CNBC采访时表示,DeepSeek拥有50,000个Nvidia H100芯片,但没有提供证据,他声称这不会被披露,因为这将违反华盛顿的出口管制,禁止将此类先进的人工智能芯片出售给中国公司。DeepSeek没有立即回应对此指控的评论请求。
伯恩斯坦分析师在周一的研究报告中指出,DeepSeek的V3模型的总训练成本尚不清楚,但远高于这家初创公司所称的用于计算能力的558万美元。分析师还表示,同样备受赞誉的R1模型的训练成本没有披露。
DEEPSEEK背后是谁?
DeepSeek是一家总部位于杭州的初创公司,其控股股东是量化对冲基金High-Flyer的联合创始人梁文峰,根据中国企业记录。
梁的基金在2023年3月通过其官方微信账号宣布“重新开始”,超越交易,集中资源创建一个“新的独立研究小组,以探索AGI的本质”(人工通用智能)。DeepSeek是在同年晚些时候成立的。
ChatGPT的制造商OpenAI将AGI定义为在大多数经济价值任务中超越人类的自主系统。
目前尚不清楚High-Flyer在DeepSeek上投资了多少。根据中国企业记录,High-Flyer的办公室位于与DeepSeek同一栋大楼内,并且还拥有与用于训练AI模型的芯片集群相关的专利。
High-Flyer的AI部门在2022年7月通过其官方微信账号表示,它拥有并运营一个由10,000个A100芯片组成的集群。
北京如何看待DeepSeek?
DeepSeek的成功已经引起了中国最高政治圈的注意。根据国家新闻社新华社的报道,在DeepSeek-R1于1月20日向公众发布的当天,创始人梁出席了由中国总理李强主持的商界人士和专家的闭门座谈会。
梁出席此次会议可能是DeepSeek的成功对北京克服华盛顿出口管制、实现战略产业(如AI)自给自足的政策目标的重要性的一种迹象。
去年类似的座谈会由百度首席执行官李彦宏出席。
路透社日报简报提供您开始一天所需的所有新闻。请在 这里注册。
- 推荐主题:
- 中断