高飞者,中国DeepSeek背后的人工智能量化基金 | 路透社
Eduardo Baptista
Deepseek 应用图标在2025年1月27日的插图中可见。路透社/Dado Ruvic/插图/档案照片北京,1月29日(路透社)- 量化对冲基金 High-Flyer 利用人工智能模型构建了一个价值1000亿人民币(137.9亿美元)的投资组合,但在2023年决定改变方向,专注于开发最前沿的人工智能。
在其官方微信账号上的一篇帖子中,杭州欢方科技有限公司(公司正式名称)表示,将专注于追求人工通用智能(AGI)。
“High-Flyer 将集中资源和力量,全心全意服务于造福全人类的人工智能技术,创建一个新的独立研究小组,探索 AGI 的本质,”该公司表示。
微软支持的 OpenAI 开发了 ChatGPT,将 AGI 定义为在大多数经济价值任务中超越人类的自主系统。
这是下一代人工智能模型,上周在 X 上的帖子中,OpenAI 首席执行官萨姆·阿尔特曼表示,他的公司尚未达到这一里程碑。
High-Flyer 设想的独立研究小组是 DeepSeek,其模型在最近几周震撼了全球科技行业。High-Flyer 的创始人和控股股东梁文峰同时也是 DeepSeek 的低调领导者。DeepSeek 模型的复杂性得到了硅谷竞争对手的广泛赞誉,这是中国人工智能模型的首次,但该初创公司声称其使用的计算能力仅为领先美国公司用于其自身模型的一小部分,这引发了 全球科技股抛售。目前尚不清楚DeepSeek距离开发AGI模型还有多近。
尽管DeepSeek的成功似乎几乎是一夜之间发生的,但High-Flyer展示了这一迅猛崛起是经过十多年积累的结果。
根据路透社对High-Flyer网站和官方微信账号的审查,在梁的领导下,该基金花费多年研究和实验海外AI模型,将这项技术应用于其业务,并投资数千万美元购买高端Nvidia芯片,以提供支持这一以AI为中心的战略所需的计算能力。
超级计算集群
这包括建立两个完全由Nvidia强大的A100芯片构成的AI超级计算集群,而华盛顿在2022年9月禁止将其出口到中国。
High-Flyer的A100集群在出口管制宣布之前就已建成并投入运营。其第一个集群由1100个A100芯片组成,耗资2亿人民币,并于2020年投入运营,而第二个集群由约10000个A100芯片组成,耗资10亿人民币,并于一年后完成,具体信息来自该公司的官方网站和几篇微信帖子。
在2022年,High-Flyer的AI研究人员在Nvidia会议上提出了一项策略,旨在最大化第二个集群在训练AI模型时的效率。
目前尚不清楚High-Flyer在DeepSeek上投资了多少。High-Flyer的办公室位于与DeepSeek同一栋大楼内,并且还拥有与用于训练AI模型的芯片集群相关的专利。
梁在私营公司High-Flyer中拥有55%的股份,并根据中国企业记录持有99%的投票权。其余股份由基金中的其他高管持有。
DeepSeek迄今仅声称使用Nvidia的H800和H20芯片来训练其DeepSeek-V3模型及其前身DeepSeek-V2,这在去年五月发布时引发了中国的AI模型价格战。然而,一些科技高管公开声称DeepSeek拥有更强大的计算能力。
Scale AI首席执行官亚历山大·王在周四接受CNBC采访时表示,DeepSeek拥有50,000个Nvidia H100芯片,但没有提供证据,他声称这些信息未被披露是因为这将违反华盛顿的出口管制,该管制禁止在与较不强大的A100同时向中国出口H100芯片。
DeepSeek没有回应关于这一指控的评论请求。Nvidia也没有立即回应询问评论的电子邮件。
但梁在讨论DeepSeek的未来时对计算能力的关注与他量化基金在AI集群上的巨大投资相呼应。去年七月在接受中国媒体Waves采访时被问及High-Flyer是否计划将DeepSeek从公司分拆并上市时,梁回答:
“我们没有短期内筹集资金的计划,我们面临的问题从来不是资金,而是对高端芯片的禁运。”
($1 = 7.2507人民币)
路透社每日简报提供您开始一天所需的所有新闻。请在这里注册。
- 建议主题:
- 人工智能