人工智能芯片市场变化将如何影响英伟达的未来——《华尔街日报》
Asa Fitch
英伟达主导的AI芯片战局已转向一个规模更大但竞争更激烈的新战场。
英伟达通过提供训练人工智能模型所需的关键芯片,成长为两万亿美元市值的公司。随着行业快速发展,更大的机遇将来自销售运行已训练模型的芯片——为快速增长的使用生成式AI工具的企业和个人实时生成文本图像。
目前这一转型正助推英伟达创纪录的销售额。首席财务官科莱特·克雷斯上周透露,过去一年数据中心业务中超40%收入(总营收超470亿美元)来自AI系统部署而非训练,这是转型启动的首个重要信号。
克雷斯的表态缓解了部分担忧:用于AI系统部署(即"推理"工作)的芯片可能威胁英伟达地位,因这类工作可使用比训练芯片更廉价、性能要求更低的芯片完成。
“有一种观点认为,英伟达在推理领域的市场份额将低于训练领域,”Melius Research分析师本·雷茨斯在给客户的报告中写道,“这一披露有助于阐明其从即将到来的推理爆炸中获益的能力。”
随着推理芯片变得越来越重要,许多竞争对手认为他们在人工智能市场上更有机会。
英特尔生产用于数据中心的中央处理器,认为其芯片将越来越有吸引力,因为客户专注于降低运行人工智能模型的成本。英特尔专长的芯片类型已经广泛用于推理,在执行该任务时,并不像使用英伟达尖端且更昂贵的H100人工智能芯片那样关键。
“推理的经济性在于,我不会搭建耗电过多、需要新的管理和安全模型以及新IT基础设施的4万美元H100环境,”英特尔首席执行官帕特·盖尔辛格在12月的一次采访中表示,“如果我能用标准[英特尔芯片]运行这些模型,那根本不需要考虑。”
美国银行分析师维韦克·阿亚表示,转向推理可能是周三英伟达季度财报中最重大的新闻,该财报超出华尔街预期,并推动其股价本周上涨8.5%,使公司估值达到约2万亿美元。
阿亚表示,随着在训练人工智能模型的大量投资之后,焦点转向从人工智能模型中产生收入,推理将会增加。与英伟达占主导地位的人工智能训练相比,这可能更具竞争性。
英伟达用于训练人工智能系统的芯片预计在可预见的未来仍将保持高需求。图片来源:Michaela Vatcheva/彭博新闻推理需求的增长速度可能比此前预期的更快。今年早些时候,瑞银分析师估计90%的芯片需求来自训练阶段,而到明年推理将仅推动20%的市场。分析师在一份报告中表示,英伟达约40%的数据中心收入来自推理,“这个数字比我们预期的要大”。
事实上,英伟达周三公布的财务业绩表明,其在AI芯片市场超过80%的份额尚未受到实质性挑战。预计在可预见的未来,英伟达用于训练AI系统的芯片仍将保持高需求。
在训练AI系统时,企业会通过模型运行海量数据,以教会它们预测语言,从而实现类人表达。这项工作需要巨大的计算能力,非常适合英伟达的图形处理单元(GPU)。
推理工作则是要求这些模型处理新的信息片段并做出响应——这是一个相对较轻的任务。
除了英特尔和超微半导体等英伟达的老牌竞争对手外,随着推理成为焦点,许多AI芯片初创公司也可能获得发展动力。
“我们正目睹推理应用场景的爆发式增长,”SambaNova公司首席执行官罗德里戈·梁表示。这家初创企业专注于研发能同时处理推理和训练任务的人工智能芯片与软件组合系统。他补充道:“人们开始意识到超过80%的成本将集中在推理环节,因此我必须寻找替代解决方案。”
由前谷歌AI芯片工程师乔纳森·罗斯创立的Groq公司,近期也因官网演示其推理芯片从大语言模型生成响应的惊人速度而引发市场热潮。罗斯透露,公司原计划今年部署4.2万枚芯片,明年达百万规模,但现正考虑将目标提升至今年22万枚、明年150万枚。
罗斯指出,推动这一转变的关键因素在于:当前最先进的AI系统正通过参数优化(无需重新训练)来提升响应质量,这使更多计算负载转移至推理环节。他强调,Groq的专用芯片在运行效率与成本控制上显著优于英伟达及其他芯片厂商的产品。
“就推理而言,实际部署规模完全取决于成本,”他解释道,“谷歌训练过的模型中虽有可行方案,但约80%最终未能投产,原因就在于部署成本过高。”
包括Meta、微软、Alphabet旗下谷歌及亚马逊在内的科技巨头已着手自主研发推理芯片,这些企业预见到行业转型趋势,并认识到降低推理成本将带来的战略优势。
例如,亚马逊自2018年起就拥有推理芯片,该公司云计算部门数据与机器学习副总裁Swami Sivasubramanian去年表示,推理计算占其智能助手Alexa总运算成本的40%。
就英伟达而言,随着行业向推理计算转型,该公司正努力保持领先地位。其即将推出的芯片在去年一项关键AI推理基准测试中取得了行业领先成绩,延续了该公司在该领域长达数年的统治地位。
去年12月,在AMD发布号称推理性能优于英伟达的新AI芯片后,英伟达通过博客文章反驳这一说法。英伟达称AMD在性能宣传中未使用优化软件,若经优化,英伟达芯片速度可达AMD的两倍。
联系记者Asa Fitch请致信[email protected]