DeepSeek和开源人工智能模型如何颠覆大型科技公司 - 彭博社
Rachel Metz, Seth Fiegerman
科技公司和学术界长期以来一直在权衡构建开源软件的风险和回报。但围绕生成性人工智能的狂热为这一辩论赋予了新的意义。
中国人工智能初创公司DeepSeek的崛起只增加了对这一问题的关注。DeepSeek最近发布了一个开源模型,声称其与顶级美国人工智能开发者的软件相媲美——并声称其开发成本仅为一小部分,使用的硬件也不那么强大。
以下是您需要了解的内容。
什么是开源?
一般来说,开源是指源代码可以自由使用或修改的软件。根据位于加利福尼亚的非营利组织开源倡议(OSI),要符合开源标准,软件必须遵循特定的分发和访问条款。
具体来说,要使一个人工智能模型被视为真正的开源,OSI表示其开发者必须提供有关其训练数据的详细信息,并使人们能够出于任何目的研究、使用和修改该系统。
相比之下,闭源是指由开发者控制的软件和模型,无法修改,并且对其技术基础提供的透明度较低。
顶级人工智能开发者是否提供开源软件?
许多科技公司将其人工智能软件标榜为开源;但并不是所有人都认为它们都符合这个定义。
Meta Platforms Inc.、法国初创公司 Mistral 和现在的 DeepSeek 都发布了它们称之为开源的人工智能模型。 (尽管 OpenAI 的名字中有“开放”,但它并没有开源大多数模型。)
但通常这些模型实际上被称为开放权重模型。这意味着除了提供模型,可能还有一些源代码,公司还披露了权重——也就是模型在训练过程中获取和调整的许多数值,这使得开发者能够更好地自定义它——但并不提供关于实际用于训练的数据的详细信息。
例如,Meta 提供了其 Llama 系列人工智能模型的权重和一些源代码,但并未提供其训练数据的详细信息。Meta 还曾因其许可条款中包含对商业用途的某些限制而被 OSI 指责。
同样,在一月份,DeepSeek 表示它发布了最新系统 R1 作为开源模型,但并未提供代码或训练数据。那 引发了关于 该公司究竟使用了什么来构建其模型的问题。
OpenAI 和 DeepSeek 的 AI 应用程序的标志摄影师:安德烈·鲁达科夫/彭博社### 开源的好处是什么?
那些推广开源软件的人通常会宣称它对用户来说更实惠,因为它没有相同的许可费用。更便宜的价格为更广泛的 AI 采用铺平了道路,降低的开发成本促进了创新。支持者还指出,这种方法通过让其他人更好地理解模型的工作原理,提高了开发者创建强大 AI 系统的责任感。
封闭系统存在着使 AI 市场被少数强大公司主导的风险。云存储公司 Box Inc. 的首席执行官亚伦·莱维最近表示:“在非常昂贵和专有的 AI 世界中,AI 的提供者可能会也应该选择将所有经济利益留给自己——基本上挤压了开发者和生态系统的机会。”
对于像 Meta 这样的公司,开源还有一个额外的好处:受欢迎程度。通过允许其他开发者自由访问并在其开源软件上进行构建,Meta 能够在整个 AI 生态系统中扩大其影响力。
开放系统的风险是什么?
开源软件的批评者认为它的安全性较低。在 AI 的情况下,美国的一些人担心使用来自地缘政治对手如中国的模型会对 国家安全构成风险,威胁公民的安全——例如,通过收集大量用户数据,这些数据可能被用于监视目的。而且人们担心,美国公司以不同程度的开放性提供其 AI 模型,可能会给竞争国家提供机会,利用这些模型来超越美国的技术主导地位。
为什么DeepSeek选择了“开放”路线?
通过采用更开放的方法(有一些限制),DeepSeek可能缓解了全球用户对中国对技术严格控制的担忧。该初创公司还可能通过使其他开发者更容易调整基础技术以满足他们的需求,从而扩大了其聊天机器人的在西方市场的影响力。
换句话说,DeepSeek有效地遵循了Meta用来捕获更多AI生态系统的同一策略——这一事实似乎没有被Meta首席执行官马克·扎克伯格忽视。
“这是一个巨大的地缘政治竞争,中国正在全力以赴,”扎克伯格在乔·罗根体验的采访中说道。“如果应该有一个大家都使用的开源模型,我们希望它是一个美国模型。”
那么DeepSeek的模型是如何工作的?
像一些来自顶级美国开发者的最新模型——包括OpenAI和谷歌——DeepSeek的R1旨在模仿人类在思考问题时有时会花时间计算答案,然后再回应用户查询的方式。然而,DeepSeek的版本与其美国同行在效率上有所不同。
其背后的团队进行了创新工作。虽然竞争对手使用了大量高性能计算芯片来构建类似的AI模型,但DeepSeek团队成员似乎找到了一些方法,有效利用他们所能接触到的相对较少的低级芯片,考虑到美国对最先进芯片的出口管制。他们还大量依赖一种称为强化学习的技术,该技术对正确答案给予奖励,对错误答案进行惩罚。
在美国,一些科技和政策领导者承认了这些进展,同时也提出了关于中国公司是否在西方技术的基础上构建其聊天机器人的问题,从而规避了开发大型语言模型(聊天机器人的基础)的一些巨大成本。
OpenAI表示正在审查DeepSeek是否“可能不当提炼了我们的模型”以构建其自己的竞争软件。DeepSeek尚未对这一指控发表评论。
观看:彭博原创节目探讨中国的DeepSeek如何进入大型人工智能领域。
等一下。什么是提炼?
提炼是指使用一家公司的人工智能输出训练一个不同的模型——通常是一个较小、较弱的模型——以具有类似的能力。一些公司,如OpenAI,表示使用其人工智能模型的输出训练竞争模型违反了他们的使用条款。
政府官员对开源有什么看法?
在进行审查后,前总统乔·拜登的政府在2024年得出结论,认为对开放人工智能模型施加限制为时尚早,但也留下了未来可能有理由这样做的可能性。
唐纳德·特朗普总统的政府尚未完全阐明其人工智能政策,但一些接近总统的人——包括埃隆·马斯克和副总统JD·范斯——之前曾强烈支持开源人工智能软件。
然而,在DeepSeek引发的骚动之后,白宫人工智能负责人大卫·萨克斯暗示,私营部门开发者可能会努力保护他们的模型不被提炼。
参考资料
- 阅读关于 DeepSeek 及其低成本AI模型的解释。
- 收听 Big Take 和 这是为什么 关于DeepSeek的播客。
- 观看“中国的DeepSeek如何挑战大型AI”由彭博原创制作。