深度求索公司公开AI技术细节获开源社区赞誉 | 南华早报
Ben Jiang
中国人工智能初创企业深度求索(DeepSeek)公开了其低成本高性能模型的技术细节,驳斥了关于虚报成本的指控,同时赢得开源社区的喝彩。
这家总部位于杭州的研究机构还兑现了本周将发布五个开源AI基础设施项目的承诺。该公司于周一和周二先后发布了名为FlashMLA和DeepEP的两个项目,均致力于充分挖掘芯片性能以实现高性价比的模型训练与推理任务。
旧金山AI行业解决方案提供商Dragonscale Industries首席技术官Stephen Pimentel在X平台发帖称,通过开源模型训练技术成果,深度求索"有力回击了关于’他们在训练流程上造假’的常见指控"。
开源开发者们为深度求索的新项目欢呼。X平台一位评论者表示:“深度求索再次突破了AI基础设施的潜力边界。”
01:20
中国阿里巴巴发布新AI模型 据称性能超越深度求索和OpenAI的GPT-4o
中国阿里巴巴发布新AI模型 据称性能超越深度求索和OpenAI的GPT-4o
深度求索已发布两款突破性开源AI模型——V3大语言模型和R1推理模型,其性能可媲美微软投资的OpenAI、亚马逊支持的Anthropic等美国AI巨头的最优专有模型。