又一家DeepSeek?中国量化基金发布人工智能训练突破性论文 | 南华早报
Ben Jiang
中国一家量化交易基金向全球顶级人工智能(AI)会议提交了一篇研究论文,详细阐述了一种新的训练技术,该基金称该技术可能优于领先AI研究实验室采用的主流方法,此举与深度求索(DeepSeek)的发展路径如出一辙。成立于2015年的上海悟空科技(Goku Technologies)将论文提交至神经信息处理系统大会(NeurIPS)——这个被称为“AI奥运会”的年度盛会汇聚了机器学习与人工智能领域的顶尖科学家。
悟空科技在论文中分析了主流AI训练方法(包括监督微调SFT和强化学习RL)的局限性,并提出了一种名为SASR的渐进式自适应混合训练框架,称其灵感源自人类推理能力的发展方式。
SFT和RL是微软投资的OpenAI及深度求索等公司训练AI模型的核心技术。深度求索此前曾强调SFT和RL对其V3模型性能提升的重要性,该模型于去年12月发布时在全球科技界引发轰动。
深度求索是中国对冲基金高瓴的衍生公司。图片来源:南华早报
“实验结果表明,SASR模型在性能上超越了监督微调(SFT)、强化学习(RL)及静态混合训练方法,”悟空团队在与上海交通大学研究人员及旗下新成立的人工智能子公司上海觉心人工智能科技联合撰写的论文中写道。
以"逻辑与真理是我们唯一遵循的准则"为宗旨的悟空公司,周四未立即回应置评请求。