High-Flyer,背后是中国DeepSeek的量化人工智能基金 | 路透社
Eduardo Baptista
北京,1月29日(路透社) - 量化对冲基金High-Flyer积累了10000亿人民币(137.9亿美元)的投资组合,利用人工智能模型做出投资决策,但在2023年决定改变方向,专注于更前沿的人工智能开发。
在其官方微信账号上,杭州欢方科技有限公司(公司正式名称)表示,将致力于寻求通用人工智能(AGI)。
“High-Flyer将集中其资源和力量,全心全意服务于造福全人类的人工智能技术,创建一个新的独立研究小组,探索AGI的本质,”该公司表示。
由微软支持并开发了ChatGPT的OpenAI将AGI定义为在大多数经济上有价值的任务中超越人类的自主系统。
这是下一代人工智能模型,上周在X上的一篇帖子中,OpenAI首席执行官山姆·阿尔特曼表示,该公司尚未达到这一里程碑。
High-Flyer计划的独立研究小组是DeepSeek,其模型在过去几周震撼了全球科技行业。High-Flyer的创始人和主要股东梁文峰也是DeepSeek的领导者。
DeepSeek模型的复杂性得到了硅谷竞争对手的广泛赞誉,这是中国人工智能模型的首次,但该初创公司声称其使用的计算能力仅为美国主要公司用于自身模型的一小部分,这导致全球科技股下跌。
尚不清楚DeepSeek在开发IAG模型方面的进展程度。
尽管DeepSeek的成功似乎几乎是一夜之间发生的,但High-Flyer展示了这一迅猛崛起是如何在十多年间逐步形成的。
在梁的领导下,该基金花费多年时间在海外研究和实验AI模型,将这项技术应用于其业务,并投资数千万美元购买高端Nvidia芯片,以提供支持这一以AI为中心的战略所需的计算能力,根据路透社对High-Flyer官方网站和微信账户的审查。
超级计算机集群
这项投资包括建设两个完全由Nvidia强大A100芯片组成的AI超级计算集群,华盛顿在2022年9月禁止将其出口到中国。
High-Flyer的A100集群在出口管制宣布之前就已建成并投入使用。其第一个集群由1100个A100芯片组成,耗资2亿人民币,并于2020年投入使用,而其第二个集群由约10000个A100芯片组成,耗资10亿人民币,并于一年后完成,根据该公司的官方网站和多篇微信文章。
在2022年,High-Flyer的AI研究人员在Nvidia的一次会议上展示了该公司为最大化第二个集群在训练AI模型时效率而开发的策略。
目前尚不清楚High-Flyer在DeepSeek上投资了多少。High-Flyer与DeepSeek在同一栋大楼内设有办公室,并且还拥有与用于训练AI模型的芯片集群相关的专利。
根据中国的公司注册记录,Liang在私人公司High-Flyer中拥有55%的股份,并拥有99%的投票权。其余股份由基金的其他高管持有。
到目前为止,DeepSeek表示它使用的是Nvidia的H800和H20芯片,这些芯片的性能远不如用于训练其DeepSeek-V3模型及其前身DeepSeek-V2的芯片,后者在去年五月上市时引发了中国AI模型的价格战。
然而,一些科技高管公开声称DeepSeek拥有更强大的计算能力。
Scale AI的首席执行官Alexandr Wang在周四接受CNBC采访时表示,DeepSeek拥有50,000个Nvidia H100芯片,但没有提供证据。他称这些信息未被披露是因为这违反了华盛顿的出口管制,华盛顿禁止将H100芯片出口到中国,和性能较低的A100芯片一样。
DeepSeek没有回应关于这一指控的评论请求。Nvidia也没有立即回复要求评论的电子邮件。
但Liang在谈到DeepSeek的未来时对计算能力的担忧,反映了他量子基金在AI集群上的大规模投资。在七月份接受中国媒体Waves采访时,Liang回答了High-Flyer是否计划将DeepSeek从公司中分离并上市的问题。
“我们没有短期内筹集资金的计划,我们面临的问题从来不是钱,而是高端芯片的禁运”
(1美元 = 7.2507人民币)
- 建议主题:
- 商业