深度求索创始人在最新技术研究中透露公司AI发展重点 | 南华早报
Zhou Xin
深度求索在一项新技术研究中明确了其下一阶段发展重点。这项由创始人兼首席执行官梁文峰等15位合著者参与的研究聚焦"原生稀疏注意力"(NSA)系统,该系统被宣称能显著提升人工智能(AI)模型处理海量数据的效率。这项《原生稀疏注意力:硬件对齐且可原生训练的稀疏注意力》研究论文于周日通过科研社区专业平台arXiv发布。就在论文发表前一天,40岁的梁文峰刚在北京参加了由国家主席习近平主持的科技企业家座谈会。据不愿具名的知情人士透露,随着这家杭州初创企业获得全球瞩目,深度求索正全力聚焦科研领域,目前并不急于开展融资或新的商业活动。研究表明,在成功开发突破性开源AI模型后,梁文峰与深度求索的年轻科学家团队正持续推动行业技术边界。这家初创公司的突破性进展…V3和R1,仅需科技巨头开发大语言模型(LLM)项目通常所需成本和算力的零头。研究指出:“通过对现代[计算]硬件的优化设计,NSA在保持性能的同时加速了推理过程并降低了预训练成本。”
推理是指经过训练的AI模型在从未见过的数据中识别出其在训练数据集中学习到的模式。这使得AI模型能够进行类似人类能力的推理和预测。
深度求索创始人兼CEO梁文锋(左二)周一在北京举行的座谈会上与习近平主席交流问候。图片来源:央视新闻