DeepSeek与开源AI模型如何颠覆科技巨头 - 彭博社
Rachel Metz, Seth Fiegerman
OpenAI与DeepSeek旗下AI应用的标识图片来源:彭博社科技企业与学术界长期在开源软件的利弊之间博弈。而生成式人工智能的热潮为这场辩论注入了新的内涵。
深度求索(DeepSeek)等中国企业近期推出一系列低成本开源模型,足以比肩美国顶尖AI开发商的软件。作为回应,美国AI领军企业OpenAI发布了六年来首个开源模型。特朗普政府正呼吁更多美国科技企业效仿此举。
以下是关键信息解读。
何为开源?
广义而言,开源指将源代码公开供任何人使用或修改的软件。总部位于加利福尼亚的非营利组织开源促进会(OSI)指出,要获得开源认证,软件必须符合特定的分发与获取条款,该组织长期倡导开源工作模式的优势。
OSI强调,要使AI模型被认定为真正开源,开发者必须提供模型训练数据的详细信息,并允许人们出于任何目的研究、使用及修改该系统。
相比之下,闭源软件和模型由开发者掌控,不允许修改,其技术基础也缺乏透明度。
顶级AI开发商是否提供开源软件?
许多科技公司将其AI软件标榜为开源,但并非所有人都认同它们符合这一定义。
Meta Platforms Inc.、法国初创公司Mistral以及如今的深度求索(DeepSeek)都发布了自称开源的AI模型。
但这些模型通常属于所谓的"开放权重模型"。这意味着除了提供模型及部分源代码外,公司会公开权重参数(即模型在训练过程中学习调整的数值集合,便于开发者定制),但不会透露实际训练数据的具体细节。
以Meta为例,该公司公开了Llama系列AI模型的权重和部分源代码,但未提供训练数据的详细信息。此前开源倡议组织(OSI)也曾批评Meta的许可协议包含对商业用途的限制条款。
类似地,深度求索在1月宣称其最新系统R1是开源模型,但未公开代码或训练数据。这引发质疑:该公司究竟使用什么数据构建模型?
尽管名称含"开放",OpenAI并未开源其多数模型。但在深度求索爆红后,OpenAI首席执行官萨姆·奥尔特曼承认ChatGPT开发商需要"制定新的开源战略",并称:“我个人认为我们在这个问题上站错了历史阵营。”
8月,OpenAI发布了两款模型,分别名为GPT-oss-120b和GPT-oss-20b,它们是类似于Llama的开源权重系统。这些模型可在AI软件托管平台Hugging Face上免费获取。这些模型能够模拟人类推理过程,并根据用户提示生成文本(但不包括图像或视频)。
开源的好处是什么?
开源软件的倡导者通常认为它对用户更经济实惠,因为它不需要支付相同的许可费用。更低的价格为更广泛的人工智能应用铺平了道路,而降低的开发成本则促进了创新。支持者还指出,这种方法通过让其他人更好地理解模型的工作原理,增强了开发强大AI系统的开发者的责任感。
封闭系统存在产生由少数强大公司主导的AI市场的风险。云存储公司Box Inc.的首席执行官Aaron Levie表示:“在非常昂贵且专有的AI世界中,AI的提供者可以而且很可能应该选择将所有经济利益留给自己——这基本上会挤占开发者和生态系统中的机会。”
对于Meta这样的公司来说,开源还有一个额外的好处:普及度。通过允许其他开发者自由访问并基于其开源软件进行构建,Meta得以在整个AI生态系统中扩大其影响力。
开放系统存在哪些风险?
开源软件的批评者认为其安全性较低。在人工智能领域,美国一些人担心使用来自竞争对手(如中国)的此类模型会带来国家安全风险,威胁公民安全。例如,收集海量用户数据的模型可能被用于监控目的。还有人担忧,美国企业提供不同开放程度的人工智能模型,可能会给竞争对手国家提供技术赶超的机会。
深度求索为何选择"开放"路线?
通过采取更开放的策略(尽管附带限制条款),深度求索可能缓解了全球用户对中国严格技术管控的担忧。这家初创公司还通过降低其他开发者适配底层技术的门槛,扩大了其聊天机器人在西方市场的覆盖范围。
换言之,深度求索效仿了Meta公司抢占人工智能生态系统的成功策略——这一事实似乎没有逃过Meta首席执行官马克·扎克伯格的眼睛。
“这是场重大的地缘政治竞争,中国正全力以赴,“扎克伯格在接受《乔·罗根体验》采访时表示,“如果必须存在所有人都能使用的开源模型,我们应该确保它是美国开发的模型。”
深度求索的AI模型是如何运作的?
与美国顶尖开发者(包括OpenAI和谷歌)的最新模型类似,深度求索的R1模型旨在模仿人类思考问题的方式——在回应用户查询前会花费时间计算答案。不过,该模型基于近期发布的V3版本构建,其效率与美国同类产品存在差异。
研发团队采用了创新方法。当竞争对手使用大量高性能计算芯片构建类似AI模型时,深度求索团队似乎找到了途径,能够高效利用因美国尖端芯片出口管制而获得的少量相对落后芯片。他们大量运用了强化学习的技术——对系统正确答案给予奖励,错误答案则进行惩罚。
美国部分科技和政策领袖承认这些进展,同时质疑这家中国公司是否依托西方技术开发聊天机器人,从而规避了构建大语言模型(聊天机器人的基础模块)所需的巨额成本。
观看:彭博原创纪录片探索中国深度求索如何进军大模型领域。
政府官员对开源技术有何表态?
经过审查后,2024年时任总统乔·拜登政府得出结论,认为对开放AI模型实施限制为时过早,但也保留了未来可能有必要采取限制的可能性。
唐纳德·特朗普政府在一定程度上支持开源和开放权重模型,这可能是出于对中国AI崛起的担忧。在特朗普7月发布的《AI行动计划》中,白宫鼓励开发开放模型,称其有潜力成为商业和学术研究的“全球标准”。该计划表示:“因此,它们也具有地缘战略价值。”
参考资料
- 阅读关于美中在AI领域的战略竞争、生成式AI是否正在扼杀初级工作岗位、世界大国为何在计算机芯片问题上争执不休,以及深度求索低成本AI模型的解析文章。
- 观看彭博原创视频《中国深度求索如何挑战AI巨头》。