深度求索(DeepSeek)在震惊世界一个月后,仍专注于通用人工智能突破而非快速盈利 | 南华早报
Ben Jiang
中国人工智能(AI)初创企业深度求索(DeepSeek)在发布震惊全球的推理模型后,据消息人士和媒体报道,过去一个月里该公司始终将研究置于快速盈利之上。自R1推理模型登上硅谷和华尔街头条以来,这家由梁文峰创立、脱胎于对冲基金业务的杭州初创企业一直保持低调,除开发者社区外极少与公众沟通。
这位40岁的创始人过去一个月未发表任何公开言论或接受媒体采访。尽管上周中国官方电视台短暂播出了他出席习近平总书记主持的高规格座谈会的画面,但官方媒体发布的会议通稿中未引用他的任何发言。梁文峰近期唯一公开露面的身份是与另外14人合著的论文《原生稀疏注意力:硬件对齐且可原生训练的稀疏注意力》的共同作者。该论文15位作者中至少有12人曾参与R1模型论文工作,表明梁文峰与深度求索的年轻科学家们直接参与了这项研究。
深度求索创始人梁文峰与习近平会面。图片来源:央视新闻
一位不愿透露姓名的公司内部消息人士表示,深度求索并不急于进行更多融资或开展新的商业活动。相反,梁先生正致力于通过以最小资源提升模型效率和能力,来推动通用人工智能(AGI)的发展。AGI指的是一种达到或超越人类认知能力的人工智能。
关于深度求索的关键优先事项,该人士表示:“这是否是一个明智的选择,以及它能持续这项研究多久,只有时间能给出答案。一个核心问题是规模法则依然存在,仅靠算法改进很难保持领先优势。”