中国量化高手在对冲基金动荡中打造了DeepSeek - 彭博社
bloomberg
DeepSeek 现在威胁要颠覆全球人工智能供应链。
摄影师:安德烈·鲁达科夫/彭博社三年前,梁文峰的量化对冲基金公司因在中国股市动荡期间亏损而向投资者深表歉意。
这对浙江高飞资产管理公司来说是一次令人惊讶的失误,该公司利用人工智能选股,并迅速成长为全国最大的量化基金之一。在公司经历那场 危机,其资产从超过120亿美元的高峰缩水超过三分之一的同时,梁在幕后为一个新的人工智能初创公司 DeepSeek 打下了基础。
DeepSeek 源于高飞,现在威胁要颠覆全球人工智能供应链,并挑战美国在关键前沿人工智能技术方面看似不可动摇的领先地位。这家成立20个月的公司的突破性技术及其同名应用程序的突然 受欢迎程度 引发了周一美国和欧洲股市的巨大抛售,近 $1万亿 的市场价值从芯片巨头 Nvidia Corp. 和其他同行身上蒸发。
这也引起了人们的震惊和敬畏,因为梁是一位工程专业毕业生,从未在中国大陆以外学习或工作,却能完成如此壮举。他证明了在当地人工智能工程师、受限的最新半导体技术和有限资源的情况下,能够与该领域的佼佼者相匹敌,甚至超越他们。
| 了解更多关于DeepSeek的信息: |
|---|
| 关于DeepSeek及其低成本AI模型的所有信息:QuickTake |
| 人工智能推动的股票反弹遭到中国新兴企业的1万亿美元打击 |
| DeepSeek展示了中国如何对美国造成更大冲击的策略 |
| DeepSeek颠覆了硅谷对AI成本的假设 |
“世界上每个国家都可以开展这样的项目,只要他们能够获得人才并能够进行相关工作。当然,其他行业将从中学习,” Shuman Ghosemajumder,位于旧金山的AI初创公司Reken的联合创始人兼首席执行官说。
现在吸引投资者、公司和政策制定者关注的问题是,人工智能是否需要数千亿美元的资本支出才能推出最新的创新和前沿AI模型——以及出口管制是否能够阻止中国的竞争。
## 大视野
DeepSeek的恐慌
17:26
梁被比作OpenAI创始人山姆·阿尔特曼,但这位中国公民保持着更低的个人曝光率,鲜少公开发言。“OpenAI不是神,不能总是处于前沿,”梁在2024年7月对中国媒体36Kr说道。
前一年,梁表示更多的投资不一定会带来更多的创新。他还评论了中国公司长期以来主要是跟随者而非技术创新者的问题。他被引用说:“问题在于缺乏信心,不知道如何组织高密度的人才以实现有效的创新。”
DeepSeek应用程序。摄影师:林奕/Bloomberg### 一个异类
梁于1985年出生在中国南方广东省的一个经济贫困城市湛江。他的父亲是一名小学教师。他在 浙江大学学习电子工程,这是一所位于杭州的著名大学,并在那里获得了信息与通信工程的硕士学位。
高飞者在中国的量化行业中与DeepSeek在全球AI行业中的地位一样,都是一个异类。
梁和他的两位前大学同学在2008年开始涉足国内股票。与大多数中国量化基金的创始人不同,他们都没有海外或机构交易经验。
这三人尝试了从自主交易到套利的不同策略,最终在2015年成立高飞者时决定采用系统化的方法来实施交易理念。他们最初建立了一个基于价格和成交量因素的模型,然后在2016年尝试机器学习。
这项新工具使公司能够更深入地挖掘新因素,并识别因素之间的“非线性”关系,首席执行官Simon Lu在2020年的一次采访中表示。创始人在2018年将机器学习整合到高飞者的产品中。
根据2020年该公司的宣传册,人工智能使高飞者实现了“许多创新”,并开发了一个多策略、多周期的投资模型,以“堆积”来自不同收益来源的回报。其旗舰产品以CSI 500指数为基准,整合了低风险策略,如日内交易,使其在过去三年中以合计120个百分点的优势超越该基准。
因此,高飞者迅速增长资产,2021年资产超过900亿元,但在同年晚些时候遭遇挫折。
2021年12月,在一些基金经历创纪录的回撤后,高飞者表示其人工智能在某些交易时机上出现失误,并在大幅波动期间表现不佳。“我们感到非常内疚,”它告诉投资者。该公司还停止接受新资金流入,并表示将减少其管理资产并调整其策略。
三个月后,其市场负责人警告某些对波动敏感的客户应该 赎回他们的资金——这是一个非常不寻常的举动。
去年,高飞者表示将逐步停止对市场进行双向押注的产品,并 专注于“仅做多”策略,即只对股票采取看涨的立场。其管理的资产已降至约600亿人民币。
研究资金
梁之前表示,DeepSeek的研究由高飞者的研发预算资助。它从量化基金中获取计算资源,该基金在2021年积累了10,000个Nvidia GPU,此前美国对出口先进Nvidia芯片和其他图形处理单元实施了禁令。
梁几乎完全从中国招募工程人才。许多人刚从顶尖大学毕业,正在进行博士研究的最后阶段实习,或是奥林匹克奖牌获得者。
“他是个书呆子,但在这个背景下,书呆子并不是负面的,”西汉·王说,他是 西北大学的博士生,2024年在DeepSeek进行了六个月的实习。
王表示,梁自己进行了许多实验,DeepSeek的运作方式很像一个研究实验室。“它起步较小,但随着他们取得真正的进展,他们开始变得兴奋,”他说。
这家初创公司开始定期发布模型,似乎对美国对尖端AI加速器芯片的出口禁令无动于衷——甚至受到刺激。
DeepSeek于1月20日发布了其R1高级人工智能推理模型,恰逢唐纳德·特朗普宣誓就任美国第47任总统的同一天。
在那个星期一早些时候,梁参加了在北京举行的由中国总理李强主持的闭门商业研讨会。根据官方的新华社报道,来自技术、科学、教育等领域的专家们为政府工作报告草案提供了意见和建议。视频资料显示梁坐在李的对面发言,而中国领导人则专注地点头。
值得注意的是,DeepSeek将其R1开源,允许研究人员和开发者自由使用、修改和商业化该模型。这发出了一个信号,表明它希望与全球人工智能社区的其他人合作和创新。
梁在中国企业家中脱颖而出,因为他有着非商业目标,专注于研究和实现通用人工智能,麻省州梅德福的塔夫茨大学技术政策助理教授托马斯·启通·曹表示。
据彭博亿万富翁指数,梁被认为拥有高飞者51%的股份。这将使他的股份在基于比较分析的情况下价值7100万美元。如果DeepSeek达到与OpenAI相同的潜力,后者的估值约为1500亿美元,那么创始人可能会获得巨额收益。
有人质疑梁的DeepSeek是否如其所表现的那样有前景。短板包括初创公司的基础设施是否能够处理全球流量,等待尝试其服务,或者该应用程序对敏感话题的处理,例如1989年天安门广场的抗议活动和关于中国领导人习近平的查询。
专家们也质疑了DeepSeek正在使用10,000个A100 Nvidia芯片的假设,分析师如Dylan Patel推测DeepSeek需要至少50,000个Nvidia更强大的H100芯片。例如,Meta Platforms Inc.运营着相当于600,000个Nvidia H100的设备。
尽管如此,Liang正在推动全球AI生态系统的重新思考和重新校准。显而易见的是,“AI竞赛不会通过创建最复杂的模型来获胜;而是通过将AI嵌入商业系统中以产生实际的经济价值来获胜,”数据分析和人工智能平台Qlik的首席执行官Mike Capone说道。