中国AI颠覆者深度求索押注低调"青年天才"团队 挑战美国巨头 | 南华早报
Ben Jiang
据知情人士和中国媒体报道,以低成本开发出惊艳科技界的强大AI模型的中国人工智能初创企业深度求索(DeepSeek),正押注其"少年天才"的秘密武器,与资金雄厚的美国巨头展开较量。
12月26日,这家杭州公司发布了深度求索V3大语言模型。该模型使用较少资源训练,但在某些领域表现已媲美甚至超越美国大型竞争对手的AI模型,如Facebook母公司Meta Platforms和ChatGPT创造者OpenAI。这一突破意义重大,尽管在先进芯片和资金资源受限的情况下,它可能提供了一条中国在AI能力上超越美国的路径。周五,深度求索未立即回应置评请求。
深度求索标志显示在智能手机上。图片来源:Shutterstock Images
根据对其V3模型技术报告署名作者、职业网站的调查,对前员工的采访以及当地媒体报道,这一突破背后是该公司低调的创始人和一个新兴的研究团队。V3技术报告由150名中国研究人员和工程师组成的团队完成,另有一个31人组成的数据自动化研究团队。
这家初创公司于2023年由对冲基金经理高飞量化分拆成立。深度求索背后的创业者是高飞量化创始人梁文峰,他曾在浙江大学攻读人工智能。梁文峰的名字也出现在技术报告上。在2023年5月接受中国网络媒体36氪采访时,梁文峰表示深度求索大多数开发者要么是应届毕业生,要么是AI职业生涯初期人员,这符合公司招聘新员工时重能力轻经验的偏好。“我们的核心技术岗位主要由应届毕业生或有一两年工作经验的员工担任,“梁文峰说。
在深度求索众多人才中,高华作和曾望鼎被公司特别指出"在MLA架构研究中做出了关键创新”。