DeepSeek将分享AI模型代码,加倍对开源的投入 | 路透社
Reuters
DeepSeek 的标志
27/01/2025
路透社/Dado Ruvic/插图/档案 北京,2月21日(路透社) - 中国初创公司 DeepSeek 周五宣布,将向公众提供其模型的代码,重申其对开源人工智能的承诺。
该公司在社交媒体平台 X 上发布消息称,将在下周开放五个源代码库,称这一举措是“一个小而真诚的进步”,将以“完全透明”的方式分享。
“我们在线服务中的这些谦逊的构建块已经在生产中进行了文档记录、部署和现场测试,”该发布声明称。
上个月,DeepSeek 发布了其开源推理模型 R1,震撼了全球人工智能行业,该模型在性能上与西方系统相媲美,并且开发成本更低。
该公司对开源的承诺使其与中国大多数人工智能公司区分开来,这些公司与美国的竞争对手一样,倾向于封闭源代码模型。DeepSeek 的低调创始人梁文峰在去年七月接受中国媒体的罕见采访时表示,公司并未优先考虑其人工智能模型的商业化,并且开源可以获得软实力。
“让其他人跟随你的创新会带来巨大的成就感,”梁在七月说。
“实际上,开源更多是一种文化行为而非商业行为,为此做出贡献会让我们赢得尊重,”他补充道。
新发布的开源代码将提供基础设施,以支持DeepSeek已经公开分享的AI模型,基于现有的开源代码模型框架。
这一公告是在DeepSeek于周二发布了一种名为原生稀疏注意力(NSA)的新算法之后,该算法旨在使长上下文的训练和推理更加高效。
自上个月以来,DeepSeek的用户基础激增。在中国,它是最受欢迎的聊天机器人服务,截至1月11日,活跃用户达2220万,超过了豆瓣的1695万用户,根据跟踪AI产品的中国网站Aicpb.com的数据。
(报道:Liam Mo,Eduardo Baptista和Brenda Goh)
(翻译:圣保罗编辑部)
路透社
- 建议主题:
- 科技