DeepSeek将分享其人工智能模型的部分代码，加大对开源的投入 | 路透社

Reuters

2025-02-21

北京，2月21日（路透社） - 中国的DeepSeek宣布将公开其模型的代码，这家初创公司在周五重申了其对开源人工智能的承诺。

该公司在社交媒体平台X上发布消息称，将在下周开放5个源代码库，称这一举措是“微小但真诚的进展”，将“完全透明”地分享。

“这些我们在线服务的谦逊构建块已经被记录、部署并在生产中经过实战测试，”该发布称。

DeepSeek上个月在全球人工智能行业引起轰动，当时它发布了开源推理模型R1，该模型在性能上与西方系统相媲美，同时开发成本更低。

该公司对开源的承诺使其与大多数中国人工智能公司区分开来，后者与其美国竞争对手一样倾向于闭源模型。DeepSeek的低调创始人梁文峰在去年7月接受中国媒体采访时表示，公司并不优先考虑其人工智能模型的商业化，开源具有软实力。

“让其他人跟随你的创新会带来巨大的成就感，”梁在7月表示。“实际上，开源更多是一种文化行为而非商业行为，贡献于此使我们赢得尊重，”他补充道。

新的开源代码将为DeepSeek已经公开分享的人工智能模型提供支持基础设施，基于现有的开源模型框架。

该公告是在DeepSeek于周二推出了一种名为原生稀疏注意力（NSA）的新算法之后发布的，该算法旨在提高长上下文中的训练和推理效率。

上个月，DeepSeek的用户基础激增。在中国，它是最受欢迎的聊天机器人服务，截至1月11日，活跃用户达2220万，超过了豆瓣的1695万，依据中国的AI产品追踪网站Aicpb.com。