美国人工智能公司试图揭露颠覆性DeepSeek的漏洞 | 路透社
Kenrick Cai,Anna Tong,Jeffrey Dastin
Deepseek 和 ChatGPT 应用图标在2025年1月27日的插图中可见。路透社/Dado Ruvic/插图/档案照片旧金山,1月28日 - 美国领先的人工智能公司的开发者们正在赞扬 DeepSeek 人工智能模型的崛起,同时也试图揭穿其数十亿美元技术被中国新兴低成本替代品超越的说法。
中国初创公司 DeepSeek 周一引发了一场 股票抛售,其免费的人工智能助手 超越 OpenAI 的 ChatGPT,位居美国苹果的 (AAPL.O) 应用商店之上,利用其声称在英伟达的 (NVDA.O) 低能力 H800 处理器芯片上训练的模型,花费不到600万美元。随着对竞争的担忧在美国股市中回响,一些人工智能专家赞扬了 DeepSeek 强大的团队和最新的研究,但对这一发展并未感到不安,四家领先人工智能实验室的知情人士表示,他们因未获授权而拒绝透露身份。
OpenAI 首席执行官 Sam Altman 在 X 上写道,DeepSeek 最近几周发布的多个模型之一 R1 “是一个令人印象深刻的模型,特别是在他们能够以这个价格提供的内容方面。”英伟达在一份 声明 DeepSeek的成就证明了对其芯片需求的增加。软件制造商Snowflake (SNOW.N) 在周一决定将DeepSeek模型添加到其AI模型市场,因收到大量客户咨询。随着员工也称DeepSeek的模型为“惊人”,美国软件销售商在最终决定向客户提供之前,权衡了托管在中国开发的AI技术的潜在风险,Snowflake的产品执行副总裁Christian Kleinerman表示。
“我们决定只要对客户明确,我们就没有支持它的问题,”他说。
与此同时,美国的AI开发者正在加紧分析DeepSeek的V3模型。DeepSeek在12月发布了一篇伴随该模型的研究论文,这是其热门应用的基础,但许多问题,例如总开发成本,在文件中没有得到解答。
一位人士表示,中国现在已经从落后美国最先进AI模型18个月缩短到6个月。然而,随着DeepSeek的免费发布策略引发如此大的兴奋,这家公司可能很快会发现自己没有足够的芯片来满足需求,这位人士预测。
DeepSeek的进展并不仅仅源于600万美元的紧缩预算,这与分析师估计美国大型云公司今年在AI基础设施上的支出2500亿美元相比,微不足道。研究论文指出,这一成本特指其最终训练运行中的芯片使用,而不是整个开发成本。
训练运行只是总成本的冰山一角,两家顶级实验室的高管告诉路透社。他们表示,确定如何设计该训练运行的成本可能要高出几个数量级。
该论文指出,V3的训练运行使用了2048个Nvidia的H800芯片,这些芯片是为了遵守2022年发布的美国出口管制而设计的,专家告诉路透社,这些规则将几乎不会减缓中国的人工智能进展。来自两家人工智能实验室的消息人士表示,他们预计早期开发阶段依赖于更大量的芯片。其中一位人士表示,这样的投资可能超过10亿美元。
一些美国人工智能领导者赞扬DeepSeek决定将其模型作为开源发布,这意味着其他公司或个人可以自由使用或修改它们。
风险投资家马克·安德森在周日的X上发帖称:“DeepSeek R1是我见过的最惊人和令人印象深刻的突破之一——作为开源,这是对世界的深刻馈赠。”
DeepSeek模型所获得的赞誉凸显了开源人工智能技术作为替代昂贵且严格控制的技术(如OpenAI的ChatGPT)的可行性,行业观察人士表示。
华尔街最有价值的公司近年来因预期只有他们能够获得开发和扩展新兴人工智能技术所需的庞大资本和计算能力而激增。这些假设将在本周和下周受到进一步审查,届时许多美国科技巨头将公布季度财报。
路透社每日简报通讯提供您开始一天所需的所有新闻。注册 这里。
- 建议主题:
- 中断