AI支出热潮从训练模型转向运行模型 - 彭博社
Dina Bass
弗吉尼亚州的一座数据中心。
摄影师:Nathan Howard/Bloomberg大型云计算公司正在重新思考如何投资人工智能开发。但首先…
需要了解的三件事:
• OpenAI将收购谷歌Chrome浏览器,ChatGPT负责人表示• 马斯克的DOGE大幅削减资金以对抗深度伪造和虚假信息• 特朗普签署行政命令加强AI教育和劳动力培训
减少对AI训练的专注
过去两年的大部分时间里,科技公司高管们一直夸耀他们囤积了多少顶级Nvidia芯片来构建AI系统,就像一些亿万富翁炫耀他们的游艇和火箭的规模一样。
例如,去年10月,Meta首席执行官马克·扎克伯格表示,公司下一代Llama AI模型将在超过10万块Nvidia H100图形处理单元(GPU)的集群上进行训练,“规模比我见过的任何其他公司报告的都要大。”次月,埃隆·马斯克称他的AI初创公司很快将在一栋建筑内拥有“20万块H100/H200训练集群”。
如今,该行业的焦点正开始转变。尽管顶尖科技公司仍在投入巨资,基于海量网络数据构建更庞大的人工智能模型,但它们正将更多资源转向推理环节——即AI系统训练完成后的运行过程。这一转变可能重塑AI生态系统及其背后庞大的数据中心与芯片支撑网络。
深度求索加速了这一进程。这家中国新锐企业今年1月震撼硅谷,在未获得大量先进芯片的情况下发布了性能卓越的AI推理模型,证明竞争未必需要最庞大的训练超级计算机。但这一趋势其实早有端倪。
OpenAI和谷歌等美国领先开发商数月来持续推进能模拟人类推理过程的AI模型,更多企业正纷纷效仿。与早期生成式AI相比,推理系统更依赖推断环节,因为它们需花费更多时间计算复杂用户查询的响应。这种方式让AI企业能将更多成本从开发阶段转移到模型部署后,从而减轻初期投资压力。
彭博行业研究3月指出,预计AI模型制造商将大幅放缓训练成本支出。“与之相反,随着大语言模型提供商转向推理和AI智能体开发,推理计算增长可能加速”,分析师曼迪普·辛格在报告中写道。
微软预测,其资本支出(大部分用于数据中心建设)将在始于7月1日的新财年放缓。在一月份财报电话会议上被问及未来几年投资计划时,首席财务官艾米·胡德表示,公司希望数据中心容量具备"可替代性"以满足其他需求,但将推理视为主要用途。与此同时,亚马逊云服务CEO马特·加曼将推理称为这家云巨头的下一个关键构建模块。
彭博行业研究数据显示,目前训练环节占顶级云计算公司数据中心成本的60%。分析师预计到2032年,这一比例将逐渐降至20%。所有AI开发者最终都需要通过推理来处理用户请求,无论是通过聊天机器人、副驾驶还是AI代理。随着AI应用持续扩大,推理需求也将同步增长。相比之下,大多数企业并不需要扎克伯格和马斯克吹嘘的那种用于构建大型语言模型的训练专用库存芯片。
数据中心公司Equinix首席商务官乔纳森·林表示:“最终需要数千GPU核心训练环境的企业数量微乎其微。”
对推理的日益重视可能引发AI基础设施的重大变革。当前云服务商可以将大型训练超级计算机部署在任何土地廉价、电力供应充足且具备水冷条件的地方。但推理的核心在于速度——客户从AI模型获取答案或研究报告的响应时间。这意味着云服务需要广泛分布在靠近客户的区域,就像早期支持互联网服务的数据中心布局模式。
数据中心内部也可能配备不同的计算芯片。虽然英伟达在训练芯片市场占据主导地位,但争论点在于推理工作负载可以通过更多样化的芯片模型来处理。越来越多的初创企业及大型科技公司,包括亚马逊、谷歌和OpenAI,正在开发专用于推理的芯片,这可能会削弱英伟达对市场的控制。
尽管如此,英伟达也在关注推理领域的机遇,不会轻易放弃其领先地位。英伟达首席执行官黄仁勋在2月告诉投资者,推理实际上"占据了我们当前计算任务的绝大部分",并且还在增长。
“我们正处于推理型AI和推理时间扩展的起步阶段,“他说,“我们才刚刚进入AI时代。” ——迪娜·巴斯
本周人类语录
“问题的核心在于拟议的重组是推进还是威胁了OpenAI的慈善宗旨。”
前OpenAI员工
包括AI"教父"杰弗里·辛顿在内的一群OpenAI前员工和学者联署了公开信,反对这家ChatGPT制造商转型为营利性公司的计划。该信件已递交给正在审查此项企业重组方案的加州和特拉华州总检察长。### 值得关注
人工智能电力需求或将很快冲击全球供应
深度解析
- 加拿大选举前,AI生成大量奇怪政治书籍涌入亚马逊平台
- 山姆·奥特曼将卸任核能开发商Oklo董事长职务
- 借助AI技术,修复老化计算机系统的竞赛愈演愈烈
- 台积电警告其AI芯片流入中国的管控能力存在局限
- 据证人称,谷歌阻止摩托罗拉使用Perplexity AI技术
更多彭博资讯
订阅《科技内参》及更多彭博科技简报:
- 《网络公报》——揭秘黑客与网络间谍的暗黑世界
- 《游戏进行时》——深入电子游戏产业内幕
- 《开机启动》——获取苹果独家消息、消费科技新闻等
- 《银幕时间》——直击好莱坞与硅谷的碰撞现场
- 《声音片段》——追踪播客、音乐产业及音频趋势