DeepSeek将分享其人工智能模型的部分代码,加大对开源的投入 | 路透社
Reuters
北京,2月21日(路透社) - 中国的DeepSeek宣布将公开其模型的代码,这家初创公司在周五重申了其对开源人工智能的承诺。
该公司在社交媒体平台X上发布消息称,将在下周开放5个源代码库,称这一举措是“微小但真诚的进展”,将“完全透明”地分享。
“这些我们在线服务的谦逊构建块已经被记录、部署并在生产中经过实战测试,”该发布称。
DeepSeek上个月在全球人工智能行业引起轰动,当时它发布了开源推理模型R1,该模型在性能上与西方系统相媲美,同时开发成本更低。
该公司对开源的承诺使其与大多数中国人工智能公司区分开来,后者与其美国竞争对手一样倾向于闭源模型。DeepSeek的低调创始人梁文峰在去年7月接受中国媒体采访时表示,公司并不优先考虑其人工智能模型的商业化,开源具有软实力。
“让其他人跟随你的创新会带来巨大的成就感,”梁在7月表示。“实际上,开源更多是一种文化行为而非商业行为,贡献于此使我们赢得尊重,”他补充道。
新的开源代码将为DeepSeek已经公开分享的人工智能模型提供支持基础设施,基于现有的开源模型框架。
该公告是在DeepSeek于周二推出了一种名为原生稀疏注意力(NSA)的新算法之后发布的,该算法旨在提高长上下文中的训练和推理效率。
上个月,DeepSeek的用户基础激增。在中国,它是最受欢迎的聊天机器人服务,截至1月11日,活跃用户达2220万,超过了豆瓣的1695万,依据中国的AI产品追踪网站Aicpb.com。
- 建议主题:
- 技术