天才在投资基金危机中创造了DeepSeek - 彭博社
bloomberg
DeepSeek 应用程序照片:彭博社三年前,量化对冲基金 quant,即量化基金,的梁文峰向投资者道歉,因为在中国股市动荡的时期亏损。
这对浙江高飞资产管理公司来说是一个意外的失误,该公司利用人工智能选择股票,并迅速成为国内最大的 quant 基金之一。在公司经历危机、资产从超过120亿美元的高峰减少超过三分之一的同时,梁在幕后为一家新的人工智能公司 DeepSeek奠定基础。
DeepSeek 现在威胁要颠覆全球人工智能供应链,并挑战美国在尖端技术方面的领导地位。这项技术在创立20个月后突然流行,导致周一美国和欧洲的股市暴跌,近一万亿美元的市场价值被摧毁,涉及芯片巨头英伟达公司及其他类似公司。
这也让人惊讶的是,梁作为一名工程学毕业生,从未在中国大陆以外学习或工作,竟能取得如此成就。他证明了在拥有本地人工智能工程师、受限于最新半导体技术和有限资源的情况下,有可能与该领域的顶尖公司相匹敌,甚至超越他们。
“世界上所有国家都可以启动这样的项目,只要他们能够获得人才并能够在此基础上工作。其他行业将从中学习,”来自旧金山的人工智能初创公司Reken的联合创始人兼首席执行官Shuman Ghosemajumder说道。
现在投资者、企业和政策制定者想知道,开发最新的创新和前沿人工智能模型是否真的需要数千亿美元,以及出口管制是否能够遏制中国的竞争。
现在,梁被拿来与OpenAI的创始人萨姆·阿尔特曼进行比较,但这位中国公民保持着更低的个人形象,鲜少在公众场合发言。“OpenAI不是神,也不总能处于前沿,”梁在2024年7月对中国媒体36Kr说道。
前一年,梁表示,更多的投资并不一定会导致更多的创新。他还评论了中国企业长期以来大多是追随者而非技术创新者的问题。根据他的说法,问题在于“缺乏信心以及不知道如何组织人才密度以实现有效的创新”。
DeepSeek应用程序。摄影师:Lam Yik/Bloomberg### 一个特例
梁于1985年出生在中国南方广东省相对贫穷的城市湛江。他的父亲是一名小学教师。他在著名的浙江大学学习电子工程,并在杭州获得了信息与通信工程的硕士学位。
High-Flyer在中国投资基金行业中是一个特例,就像DeepSeek在全球人工智能行业中一样。
梁和他的两位大学同学在2008年开始投资当地股票。与大多数中国量化基金的创始人不同,他们都没有海外或大型金融公司的经验。
这三人尝试了不同的策略,从自由交易到套利,直到2015年决定采用系统化的方法来实施交易理念,那一年他们创建了High-Flyer。最初,他们创建了一个基于价格和成交量的模型,然后在2016年尝试 机器学习。
这项新工具使公司能够深入寻找新的因素,并识别它们之间的“非线性”连接,首席执行官Simon Lu在2020年的一次采访中表示。创始人在2018年将机器学习整合到High-Flyer的产品中。
人工智能使High-Flyer实现了“许多创新”,并开发了一个多策略和多周期的投资模型,以“积累”来自不同收益来源的回报,根据该公司的2020年宣传册。他们的明星产品使用CSI 500指数作为 基准,并整合了低风险策略,如日内交易,使其在过去三年中总共超过该指标120个百分点。
High-Flyer迅速增加了其资产,因此在2021年达到了超过90000亿元人民币,但在同年稍晚时遇到了困难。
观看:华尔街在本周初面临困难,因为人们担心中国的一种更便宜的人工智能模型可能威胁到美国的技术主导地位。(视频为英语)。
在2021年12月,经历了一些基金的创纪录净流出后,High-Flyer表示其人工智能在寻找某些交易的适当时机时出现了错误,并在股市大幅波动期间表现不佳。“我们感到非常内疚,”它对投资者说。该公司停止接受新投资,并表示将减少其管理资产并调整其策略。
三个月后,其市场总监警告某些对波动敏感的客户必须撤回他们的资金,这是一项非常不寻常的措施。
去年,High-Flyer表示将减少在市场上进行双向押注的产品,并专注于“仅多头”策略,即只在股票上采取看涨头寸。其管理资产已降至约60000亿元人民币。
资助研发
DeepSeek的研究是由High-Flyer的研发预算资助的,梁之前表示。它从量化基金获得了计算资源,该基金在2021年积累了10000个Nvidia GPU,在美国禁止出口更先进的芯片和其他图形处理单元之前。
梁几乎完全从中国招募工程师。许多人刚刚从顶尖大学毕业,是他们博士学习阶段的实习生和奥林匹克奖牌获得者。
“他是个书呆子,但在这个背景下,书呆子并不是负面的,”西北大学的博士生王子涵说,他在2024年在DeepSeek进行了六个月的实习。
王说,梁自己进行了很多实验,DeepSeek的运作方式与研究实验室非常相似。“起初很小,但随着他们取得真正的进展,他们开始感到兴奋,”他说。
这家 初创公司 开始定期发布模型,显然对美国禁止出口最先进的AI加速芯片免疫。
DeepSeek于1月20日发布了其先进的AI推理模型R1,正是唐纳德·特朗普宣誓就任美国第47任总统的同一天。
在那个星期一早些时候,梁参加了在北京举行的由中国总理李强组织的闭门商业研讨会。根据新华社的报道,来自技术、科学、教育和其他领域的专家在会上提供了对政府工作报告草案的意见和建议。YouTube上的视频显示梁坐在李面前交谈,李领导认真地点头。
值得注意的是,DeepSeek将R1做成了开源,这使得研究人员和开发者可以自由使用、修改和商业化该模型。这表明它希望与全球AI社区的其他人合作和创新。
梁在中国企业家中因其非商业目标而脱颖而出,他专注于研究和实现通用人工智能,塔夫茨大学技术政策助理教授托马斯·启通·曹说道。
梁将拥有High-Flyer的51%股份。这将使他的股份估值达到7100万美元,根据彭博亿万富翁指数。如果DeepSeek达到与OpenAI相同的潜力,估值约为15000亿美元,创始人的财富将会大幅增长。
一些人质疑梁的DeepSeek是否如看起来那么有前景。它在管理全球巨大需求和等待试用其服务的流量方面显示出问题,并且在中国一些敏感话题上没有提供信息,例如1989年天安门广场的抗议活动或关于中国领导人习近平的咨询。
专家们也质疑DeepSeek仅使用10000个Nvidia A100芯片的假设。分析师如迪伦·帕特尔推测,DeepSeek至少需要50000个Nvidia H100芯片,这些芯片要强大得多。例如,Meta Platforms Inc运营着相当于600000个Nvidia H100芯片的设备。
尽管如此,梁正在推动全球人工智能生态系统的重新校准。显然,“人工智能的竞赛不会通过创建最复杂的模型来赢得,而是通过将人工智能整合到商业系统中以产生有形的经济价值,”数据分析和人工智能平台Qlik的首席执行官迈克·卡彭说道。
原始备注:中国量化天才在基金崩盘的阴影下建立了DeepSeek