CON O 深度搜索是什么,为什么它正在革新人工智能行业? | 路透社
Eduardo Baptista
北京,1月27日(路透社) - 中国初创公司DeepSeek推出的新型人工智能模型声称与美国行业领导者相当或更好,且成本仅为其一小部分,这威胁到全球技术秩序的改变。
该公司在全球人工智能圈内引起关注,因其在上个月的一篇文章中提到,DeepSeek-V3的训练所需的Nvidia H800芯片计算能力不到600万美元。
基于DeepSeek-V3的DeepSeek人工智能助手已超越其竞争对手ChatGPT,成为美国苹果App Store上评分最高的免费应用。
这一事件引发了对一些美国科技公司投入数十亿美元进行人工智能投资的决策依据的质疑,包括Nvidia在内的多家公司的股票受到影响。
以下是一些关于这家正在全球范围内震撼人工智能行业的公司的数据。
为什么DeepSeek引起了轰动?
OpenAI在2022年底推出的ChatGPT在中国科技公司中引发了轰动,许多公司急于创建自己的基于人工智能的聊天机器人。
然而,在中国搜索引擎巨头百度推出首个中国版ChatGPT后,普遍对中美企业在人工智能能力上的差距感到失望。DeepSeek模型的质量和盈利能力改变了叙事。根据中国公司的说法,DeepSeek-V3和DeepSeek-R1这两个模型受到了硅谷高管和美国科技公司工程师的赞誉,已与OpenAI和Meta的最先进模型相媲美。
此外,它们的使用成本更低。上周发布的DeepSeek-R1的使用成本比OpenAI的o1模型便宜20到50倍,具体取决于任务,DeepSeek在其官方微信账号的帖子中提到。
然而,一些人公开表达了对DeepSeek成功的怀疑。
Scale AI的首席执行官Alexandr Wang在周四接受CNBC采访时表示,DeepSeek拥有50,000个Nvidia H100芯片,但没有提供证据,并称这些信息不会被披露,因为这将违反华盛顿的出口管制,禁止将如此先进的AI芯片出售给中国公司。
DeepSeek没有立即回应关于这一指控的评论请求。
Bernstein的分析师在周一的研究报告中指出,DeepSeek V3模型的总训练成本尚不清楚,但远高于这家初创公司所称的558万美元的计算能力支出。
他们补充说,备受赞誉的R1模型的训练成本也没有被披露。
谁在DeepSeek背后?
DeepSeek是一家总部位于杭州的初创公司,其主要股东是量化对冲基金High-Flyer的联合创始人梁文峰,根据中国的公司注册记录。
梁基金在2023年3月在其官方微信账号上宣布正在“重新开始”,超越商业,集中资源创建一个“新的独立研究小组,以探索AGI(通用人工智能)的本质”。DeepSeek就是在同年成立的。
ChatGPT的创造者OpenAI将AGI定义为在大多数经济上有价值的任务中超越人类的自主系统。
High-Flyer在DeepSeek上的投资金额尚不清楚,该公司在同一栋大楼内设有办公室。根据中国的企业记录,该公司还拥有与用于训练AI模型的芯片集群相关的专利。
High-Flyer的AI部门在2022年7月在其官方微信账号上表示,拥有并运营一个由10,000个A100芯片组成的集群。
北京对DeepSeek的看法是什么?
DeepSeek的成功已经在中国的高层政治圈中显现出来。根据新华社的报道,在DeepSeek-R1于1月20日公开的当天,其创始人梁出席了由中国总理李强组织的企业家和专家闭门研讨会。
梁在会议上的出现可能是DeepSeek的成功对北京在超越华盛顿的出口管制和实现战略性行业如AI的自给自足的政治目标的重要性的一种信号。
去年举行的类似研讨会上,百度的首席执行官李彦宏也出席了。
- 建议主题:
- 商业