美国的人工智能公司寻求反驳DeepSeek的声明 | 路透社
Kenrick Cai,Anna Tong,Jeffrey Dastin
旧金山,1月28日 - 美国主要人工智能公司的开发者赞扬DeepSeek的人工智能模型,同时试图反驳其技术价值数十亿美元的观点,认为它已被一家中国新兴公司的低成本替代品超越。
周一,中国初创公司DeepSeek引发了一波股票抛售,其免费的人工智能助手在苹果App Store中超越了OpenAI的ChatGPT(AAPL.O),这得益于其声称在Nvidia的H800处理器上训练的模型(NVDA.O),该处理器的能力较低,成本不到600万美元。尽管对竞争的担忧在美国股市中回响,但一些人工智能专家对DeepSeek强大的团队和最新的研究表示赞赏,但对其出现保持冷静,四家主要人工智能实验室的知情人士表示,他们因未获授权而拒绝透露身份。
OpenAI的首席执行官Sam Altman在X上写道,DeepSeek在最近几周推出的多个模型之一R1“是一个令人印象深刻的模型,尤其是考虑到他们能够以这个价格提供的内容”。Nvidia在一份声明中表示,DeepSeek的成就证明了对其更多芯片的需求。
软件开发商Snowflake(SNOW.N) 在周一决定将DeepSeek的模型添加到其AI模型市场,因收到大量客户咨询。尽管其员工也称DeepSeek的模型为“惊人”,但这家美国软件供应商在最终决定向客户提供之前,考虑了托管在中国开发的AI技术的潜在风险,Christian Kleinerman,Snowflake的执行副总裁解释道。
“我们决定只要对客户保持透明,我们就不认为支持它有任何问题,”他说。
与此同时,美国的AI开发者们正急于分析DeepSeek的V3模型。去年12月,DeepSeek发布了一份伴随该模型的研究论文,这是其热门应用的基础,但其中并没有回答许多问题,比如总开发成本。
据一位人士透露,中国在与美国开发的最先进AI模型的差距上已从18个月缩短至6个月。然而,DeepSeek的免费发布策略引起了如此大的兴趣,以至于该公司可能很快会面临芯片不足以满足需求的情况,这位人士预测。
DeepSeek的进展不仅仅归功于600万美元的预算,这与分析师估计美国大型云公司今年在AI基础设施上的支出2500亿美元相比,微不足道。研究论文指出,这一成本特指其最终训练测试中使用的芯片,而非总开发成本。
训练过程在总成本方面只是冰山一角,两家主要实验室的高管对路透社表示。确定如何设计该训练周期的成本可能要高得多。
文件称,V3的训练执行使用了2048个Nvidia的H800芯片,这些芯片是为了满足2022年发布的美国出口管制而设计的,专家对路透社表示,这些规定几乎不会减缓中国人工智能的进展。
来自两家人工智能实验室的消息人士表示,他们预计开发的初期阶段将基于更多的芯片。一位人士表示,这样的投资可能超过10亿美元。
一些美国人工智能领导者赞扬DeepSeek将其模型作为开源发布的决定,这意味着其他公司或个人可以自由使用或修改它们。
风险投资家Marc Andreessen在X上的一篇帖子中表示:“DeepSeek R1是我见过的最惊人和令人印象深刻的进展之一,作为开源,它是对世界的深刻馈赠。”
DeepSeek模型的认可强调了开源人工智能技术作为替代昂贵且严格控制的技术(如OpenAI的ChatGPT)的可行性,行业观察人士表示。
华尔街最有价值的公司在过去几年中激增,因市场预期只有它们能够获得开发和扩展新兴人工智能技术所需的巨额资本和计算能力。这些假设将在本周和下周受到新的审查,届时许多美国科技巨头将公布其季度业绩。
- 建议主题:
- 技术