量化AI基金High-Flyer支持中国的DeepSeek | 路透社
Eduardo Baptista
北京,1月29日(路透社) - 量化对冲基金High-Flyer构建了一个价值1000亿人民币(137.9亿美元)的投资组合,利用人工智能模型做出投资决策,但在2023年决定改变方向,专注于更先进的人工智能开发。
在其官方微信账号上,杭州环方科技有限公司——该公司的正式名称——表示将专注于追求通用人工智能(AGI)。
“High-Flyer将集中其资源和力量,完全致力于服务于造福全人类的人工智能技术,创建一个新的独立研究小组,探索AGI的本质,”该公司表示。
由微软支持的OpenAI开发了ChatGPT,定义AGI为在大多数经济上有价值的任务中超越人类的自主系统。
这是下一代人工智能模型,上周在X上的一篇帖子中,OpenAI的首席执行官萨姆·阿尔特曼表示,他们的公司尚未达到这一里程碑。
High-Flyer预期的独立研究小组是DeepSeek,其模型在过去几周震撼了全球科技行业。High-Flyer的创始人和控股股东梁文峰也是DeepSeek的低调领导者。
DeepSeek模型的复杂性受到硅谷竞争对手的广泛赞誉,这对中国的人工智能模型来说是一个新鲜事物,但该初创公司声称其使用的计算能力仅为美国主要公司用于其模型的一小部分,这引发了全球科技股的抛售。
目前尚不清楚DeepSeek距离开发AGI模型有多近。
尽管DeepSeek的成功似乎几乎是一夜之间发生的,但High-Flyer展示了这种迅猛崛起是如何经过十多年才实现的。
在梁的领导下,该基金花费了多年时间在海外研究和实验AI模型,将这项技术应用于其业务,并投资数千万美元购买尖端的Nvidia芯片,以提供支持这一以AI为中心的战略所需的计算能力,根据路透社对High-Flyer网站和官方微信账户的分析。
超级计算集群
该战略包括建设两个完全由Nvidia强大A100芯片组成的AI超级计算集群,其出口到中国在2022年9月被华盛顿禁止。
High-Flyer的A100集群在出口管制宣布之前就已经建成并投入运营。第一个集群由1100个A100芯片组成,耗资2亿人民币,并于2020年投入运营,而第二个集群由约1万个A100芯片组成,于一年后完成,耗资10亿人民币,根据该公司的官方网站和多条微信帖子。
在2022年,High-Flyer AI的研究人员在Nvidia的一次会议上展示了一项该公司开发的策略,以最大化第二个集群在训练AI模型时的效率。
目前尚不清楚High-Flyer在DeepSeek上投资了多少。High-Flyer在与DeepSeek同一栋大楼内设有办公室,并拥有与用于训练AI模型的芯片集群相关的专利。
梁在高飞者(High-Flyer)这家私营公司的持股比例为55%,并根据中国的公司记录,拥有99%的投票权。其余的股份由基金的其他高管持有。
到目前为止,DeepSeek仅声称使用Nvidia的H800和H20这两款性能远不如的芯片来训练其DeepSeek-V3模型及其前身DeepSeek-V2,这在去年五月发布时引发了中国的AI模型价格战。
然而,一些科技高管公开表示,DeepSeek拥有更多的计算能力。
Scale AI的首席执行官亚历山大·王(Alexandr Wang)在周四接受CNBC采访时表示,DeepSeek拥有50,000个Nvidia H100芯片,他声称这些芯片没有被披露是因为会违反华盛顿的出口管制。美国在禁止出口H100芯片到中国的同时,也禁止了性能较低的A100芯片。
DeepSeek没有回应关于这一指控的评论请求。Nvidia也没有立即回复请求评论的电子邮件。
但梁在讨论DeepSeek的未来时对计算能力的担忧,反映了他量化基金在AI集群上的大规模投资。在去年七月接受中国《波浪》杂志采访时,被问及高飞者是否计划将DeepSeek与公司分开并上市时,梁回答:
“我们没有短期内筹集资金的计划。我们面临的问题从来不是资金,而是对尖端芯片的禁运。”
(埃杜阿多·巴普蒂斯塔的报道)
((圣保罗编辑部翻译))
路透社 FDC
- 建议主题:
- 科技