DeepSeek将分享一些AI模型代码，进一步加强开源| 路透社

Reuters

2025-02-21

Deepseek的标志在2025年1月29日的插图中可见。路透社/Dado Ruvic/插图/档案照片北京，2月21日（路透社） - 中国初创公司DeepSeek表示将公开其模型的代码，周五重申了其对开源人工智能的承诺。该公司在社交媒体平台X上发布的一条消息中表示，将在下周开源5个代码库，称这一举措是“微小但真诚的进展”，并将“以完全透明的方式”分享。

“我们在线服务中的这些谦逊构建块已经被记录、部署并在生产中经过实战测试。”该消息称。

DeepSeek 上个月震动了全球人工智能行业，当时它发布了其开源的R1推理模型，该模型在性能上与西方系统相抗衡，同时开发成本更低。该公司对开源的承诺使其与中国大多数人工智能公司区分开来，这些公司与其美国竞争对手一样，倾向于闭源模型。DeepSeek的低调创始人梁文峰在去年7月与一家中国媒体的罕见采访中表示，该公司并不优先考虑商业化其人工智能模型，并且从开源中可以获得软实力。“让他人跟随你的创新会带来很大的成就感，”梁在七月说道。

“事实上，开源更多是一种文化行为，而非商业行为，参与其中让我们赢得了尊重，”他补充道。

新发布的开源代码将提供基础设施，以支持DeepSeek已经公开分享的AI模型，建立在现有的开源模型框架之上。

这一公告是在DeepSeek周二发布了一种名为原生稀疏注意力（NSA）的新算法之后，该算法旨在提高长上下文训练和推理的效率。

自上个月以来，DeepSeek的用户基础激增。在中国，截至1月11日，它是最受欢迎的聊天机器人服务，拥有2220万日活跃用户，超过了豆瓣的1695万用户，依据追踪AI产品的中国网站Aicpb.com的数据。

路透社日报简报提供您开始一天所需的所有新闻。请在这里注册。

推荐主题：
人工智能