DeepSeek测试Meta在开源人工智能主导地位上的雄心 - 彭博社
Kurt Wagner, Riley Griffin
Meta和扎克伯格一直是科技行业最积极的开源倡导者。
摄影师:Lam Yik/Bloomberg马克·扎克伯格长期以来一直支持Meta Platforms Inc.的开源人工智能软件方法——这使得其他公司可以访问并在其技术基础上进行构建——他说,拥有一个美国模型作为新产品的基础是确保美国在人工智能领域对中国的主导地位的关键。
现在,中国的尖端人工智能模型DeepSeek的出现正在对扎克伯格的战略进行压力测试,并威胁到美国的本土优势。这家中国初创公司表示,其技术使用的成本和计算能力仅为其美国竞争对手的一小部分,并且它正在提供一个开源替代方案,以取代Meta的Llama和其他美国制造的模型。
尽管对其与中国的联系有所犹豫,但在1月初参加乔·罗根的播客时,Meta首席执行官称赞DeepSeek是一个“非常先进的模型”,正在“做着非常好的工作。”这一观点本周得到了OpenAI首席执行官山姆·阿尔特曼的呼应,他表示“有一个新的竞争对手令人振奋”,以及美国总统唐纳德·特朗普,他在周一表示,他将DeepSeek更快、更便宜的方法视为“积极的资产。”
但在赞美的背后,华盛顿、华尔街和硅谷在看待DeepSeek时一致认为它是Meta的Llama的一个关键竞争对手。特朗普在周一补充道,DeepSeek“应该成为我们行业的警钟,我们需要专注于竞争以赢得胜利。”
‘拥有生态系统’
Meta和扎克伯格一直是科技行业最 vocal 的开源倡导者,他们认为让这种先进技术免费提供有助于整个行业更快发展,因为公司可以在彼此的基础上进行构建。他们还警告了中国竞争对手做同样事情的威胁。
“这是一个巨大的地缘政治竞争,中国正在全力以赴,”扎克伯格本月在 The Joe Rogan Experience 上谈到人工智能时表示。“如果应该有一个大家都使用的开源模型,我们希望它是一个美国模型。”
Meta特别希望提供这个模型,因为它是最大的科技公司中开源投资最多的公司,谷歌DeepMind的员工研究员卢克·塞尔瑙表示,他之前在Meta工作。
“他们这样做的部分动机是有机会拥有生态系统,”塞尔瑙说。“DeepSeek对此提出了质疑。”
尽管周一几位华尔街分析师表示DeepSeek的创新表明Meta在人工智能竞赛中落后,但周一Meta的股价上涨了1.9%,即使美国和欧洲的科技股总共损失了近1万亿美元的价值。投资者可能更关注扎克伯格声称他愿意积极投入资金以赢得人工智能竞赛。
1月24日,他宣布公司计划在2025年投资高达 $650亿 用于与人工智能相关的项目,使得今年的预计资本支出是2023年的两倍多。Meta预计将在周三报告第四季度收益时提供更多关于其未来人工智能努力的细节。周二纽约午盘时股价上涨了2.7%。
为了更好地了解竞争,Meta成立了一个内部团队,负责分析DeepSeek,包括它是如何构建的以及它能做什么——根据知情人士的说法,这是一种Meta在与其他主要AI竞争对手(如OpenAI的GPT-4和谷歌的Gemini)时所采用的策略。这些人要求匿名讨论公司的内部工作。他们表示,研究中国模型——该模型使用比美国公司囤积的更便宜和更不强大的芯片进行训练——可能会降低Meta自身的研发成本。
“如果我们对Meta了解的任何事情,那就是它是一个相当不错的模仿者。他们会复制DeepSeek使用的一些技术,从而降低自己的成本,”Morningstar的科技股分析师Ahmed Khan在一次采访中表示。“Meta在发布其新模型时会稍微落后,但在一年内,他们将能够通过利用DeepSeek所做的事情来提高其性能,弥补失去的距离。”
开放还是封闭
DeepSeek的崛起突显了AI行业最大的争论之一:科技公司应该开源他们的技术吗?
“开源模型正在推动行业的重大转变,这将使每个人都能享受到AI的好处,”Meta发言人Jon Carvill在一份电子邮件声明中表示,并补充说Meta希望“美国设定全球AI标准,而不是中国。”虽然Meta和DeepSeek的模型中有一些信息是公开的,但两家公司都没有披露他们用于模型训练的数据集。
反对开放技术的人士认为,这样做可能会使美国的对手,特别是中国,受益,而这种利益并不仅仅是经济上的。风险投资家Vinod Khosla 在去年五月表示,Meta决定开源其Llama模型是一个“国家安全隐患”,因为这可能会被中国科技公司利用。
DeepSeek 可能部分得益于 Meta 和其他人工智能公司已经完成的工作而取得了自己的进展。Meta 的首席人工智能科学家 Yann LeCun 在 1 月 24 日的一篇帖子中暗示了这一点。尽管如此,LeCun 表示,这就是开源技术的目标。
“DeepSeek 从开放研究和开源中获益”,包括来自 Meta,他在公司的社交媒体平台 Threads 上发布道。“他们提出了新想法,并在其他人的工作基础上构建。因为他们的工作是公开和开源的,所有人都可以从中获益。这就是开放研究和开源的力量。”
DeepSeek 没有立即回应关于公司使用其他开源产品(包括 Llama)的评论请求,以寻求澄清。
政策方法
关于开源的问题在政策方面也尚未得到解决,甚至没有正面应对。拜登政府曾试图防范有害的人工智能使用,特别是来自外国对手的使用。它在 10 月警告称,人工智能的意外或故意误用可能会助长全球的专制主义,促进人权侵犯,并削弱美国的竞争优势。特朗普在就职当天废除了拜登的人工智能行政命令,上周呼吁成立一个跨机构小组制定新政策,以确保美国在人工智能领域的主导地位。
Jaime Yassif,非营利组织核威胁倡议的副总裁,表示她对新政府在推进人工智能模型(如 Meta 的开源 Llama)与抵御威胁之间取得平衡持乐观态度。“从开源模型中获得的好处与一些国家安全风险之间存在权衡,”特别是核、化学和生物风险,她说。“这些事情是相互矛盾的。”
扎克伯格本人承认,Meta的开源方法可能会使中国竞争对手受益。该公司正式基于地理位置阻止中国访问Llama,尽管由于技术是公开可用的,完全阻止中国开发者通过其他渠道访问其模型几乎是不可能的。在去年夏天的一次采访中,扎克伯格表示,即使公司试图保持其技术的专有性,Meta也不太可能“阻止他们偷走它”。对他来说,他说,这种权衡是值得的。
“我认为,锁定一切会束缚我们,并使我们更不可能成为领导者,”他说。