深度求索公司公开AI技术细节获开源社区赞誉 | 南华早报

Ben Jiang

2025-02-26

中国人工智能初创企业深度求索（DeepSeek）公开了其低成本高性能模型的技术细节，驳斥了关于虚报成本的指控，同时赢得开源社区的喝彩。

这家总部位于杭州的研究机构还兑现了本周将发布五个开源AI基础设施项目的承诺。该公司于周一和周二先后发布了名为FlashMLA和DeepEP的两个项目，均致力于充分挖掘芯片性能以实现高性价比的模型训练与推理任务。

旧金山AI行业解决方案提供商Dragonscale Industries首席技术官Stephen Pimentel在X平台发帖称，通过开源模型训练技术成果，深度求索"有力回击了关于’他们在训练流程上造假’的常见指控"。

开源开发者们为深度求索的新项目欢呼。X平台一位评论者表示：“深度求索再次突破了AI基础设施的潜力边界。”

01:20

中国阿里巴巴发布新AI模型据称性能超越深度求索和OpenAI的GPT-4o

深度求索已发布两款突破性开源AI模型——V3大语言模型和R1推理模型，其性能可媲美微软投资的OpenAI、亚马逊支持的Anthropic等美国AI巨头的最优专有模型。