Meta开始测试首个内部AI训练芯片 | 路透社
Katie Paul,Krystal Hu
纽约,3月11日(路透社) - Facebook的母公司Meta (META.O)正在测试其首个内部芯片,用于训练人工智能系统,这是一个重要的里程碑,因为它希望减少对外部供应商如Nvidia (NVDA.O)的依赖,两位消息人士对路透社表示。这家全球最大的社交媒体公司已开始小规模部署该芯片,并计划在测试成功后增加生产,以便大规模使用,消息人士表示。
开发内部芯片的努力是Meta长期计划的一部分,旨在降低其巨大的基础设施成本,因为该公司在人工智能工具上进行高额投资。
Meta还拥有Instagram和WhatsApp,预计到2025年总支出将达到1140亿至1190亿美元,其中包括高达650亿美元的资本支出,主要由人工智能基础设施支出推动。
其中一位消息人士表示,Meta的新训练芯片是一个专用加速器,这意味着它被设计用于处理特定的人工智能任务。这可能使其在能效方面比通常用于人工智能工作负载的集成图形处理单元(GPU)更高效。
Meta正在与总部位于台湾的芯片制造商TSMC (2330.TW)合作生产该芯片,该消息人士表示。测试的实施在Meta完成其芯片的第一次“流片”后开始——这是硅开发工作成功的重要标志,涉及将初步设计发送给芯片制造厂,另一位消息人士表示。
一次典型的流片成本数千万美元,完成需要三到六个月,且没有保证测试会成功。如果失败,Meta将需要诊断问题并重复流片步骤。
Meta和台积电不愿对此发表评论。
该芯片是公司Meta训练和推理加速器(MTIA)系列中的最新产品。该项目起初不稳定,并在类似的开发阶段中曾放弃过一个芯片。
然而,去年,Meta开始使用MTIA芯片进行推理——这是在用户与系统互动时执行AI系统所涉及的过程——用于决定Facebook和Instagram新闻推送中出现哪些内容的推荐系统。
Meta的高管表示,他们希望在2026年前开始使用自己的芯片进行训练,即为AI系统提供大量数据以“教会”它执行其功能的计算密集型过程。
与推理芯片一样,训练芯片的目标是从推荐系统开始,然后转向生成性AI产品,如Meta AI聊天机器人,高管们表示。
“我们正在研究如何为推荐系统进行训练,并最终考虑如何为生成性AI进行训练和推理,”Meta的产品总监Chris Cox在摩根士丹利的科技、媒体和电信会议上表示。
Cox 描述了 Meta 芯片开发的努力为“走路、爬行和奔跑的一种情况”,但表示高管们认为第一代推荐推理芯片是一个“重大成功”。
此前,Meta 在一次小规模测试部署中放弃了一个定制的内部推理芯片,因为它未能成功,类似于现在正在进行的训练芯片测试。
自那时以来,这家社交媒体公司仍然是 Nvidia 最大的客户之一,积累了大量 GPU 来训练其模型,包括推荐系统、广告系统和其 Llama 系列模型。这些单元还为每天使用其应用程序的超过 30 亿人进行推理。
今年,这些 GPU 的价值受到质疑,因为 AI 研究人员越来越多地对通过不断“扩展”大型语言模型来添加更多数据和计算能力能取得多少进展表示怀疑。
这些疑虑在 1 月底中国初创公司 DeepSeek 发布新的低成本模型时得到了加强,这些模型通过更多依赖推理来优化计算效率,而不是大多数传统模型。
(纽约的 Katie Paul 和旧金山的 Krystal Hu 报道)
((翻译:圣保罗编辑部))
路透社 FDC
- 建议主题:
- 技术