DeepSeek将分享一些AI模型代码,进一步加强开源| 路透社
Reuters
Deepseek的标志在2025年1月29日的插图中可见。路透社/Dado Ruvic/插图/档案照片北京,2月21日(路透社) - 中国初创公司DeepSeek表示将公开其模型的代码,周五重申了其对开源人工智能的承诺。该公司在社交媒体平台X上发布的一条消息中表示,将在下周开源5个代码库,称这一举措是“微小但真诚的进展”,并将“以完全透明的方式”分享。
“我们在线服务中的这些谦逊构建块已经被记录、部署并在生产中经过实战测试。”该消息称。
DeepSeek 上个月震动了全球人工智能行业,当时它发布了其开源的R1推理模型,该模型在性能上与西方系统相抗衡,同时开发成本更低。该公司对开源的承诺使其与中国大多数人工智能公司区分开来,这些公司与其美国竞争对手一样,倾向于闭源模型。DeepSeek的低调创始人梁文峰在去年7月与一家中国媒体的罕见采访中表示,该公司并不优先考虑商业化其人工智能模型,并且从开源中可以获得软实力。“让他人跟随你的创新会带来很大的成就感,”梁在七月说道。
“事实上,开源更多是一种文化行为,而非商业行为,参与其中让我们赢得了尊重,”他补充道。
新发布的开源代码将提供基础设施,以支持DeepSeek已经公开分享的AI模型,建立在现有的开源模型框架之上。
这一公告是在DeepSeek周二发布了一种名为原生稀疏注意力(NSA)的新算法之后,该算法旨在提高长上下文训练和推理的效率。
自上个月以来,DeepSeek的用户基础激增。在中国,截至1月11日,它是最受欢迎的聊天机器人服务,拥有2220万日活跃用户,超过了豆瓣的1695万用户,依据追踪AI产品的中国网站Aicpb.com的数据。
路透社日报简报提供您开始一天所需的所有新闻。请在 这里注册。
- 推荐主题:
- 人工智能