英伟达的Hopper和Blackwell AI芯片领跑市场英特尔、AMD能否与之抗衡?——彭博社
Ian King
英伟达H100芯片图片来源:Marlena Sloss在经历股价狂飙一度成为全球市值最高企业后,投资者对继续注资这家芯片制造商变得更为谨慎。人们意识到,人工智能计算的普及之路并非坦途,且不会仅依赖英伟达的技术。
目前英伟达仍是AI淘金热中最卓越的"卖铲人"。其营收持续飙升,Hopper芯片系列及下一代Blackwell架构的订单量极为可观。
其持续成功的关键在于微软、谷歌等科技巨头能否为AI找到足够多的商业应用场景,以从其巨额芯片投资中获利。即便实现盈利,市场对该公司最强力且利润丰厚的芯片需求量仍存疑:今年1月,中国初创企业深度求索发布的AI模型宣称性能媲美美国大厂产品,但开发所需资源大幅减少。
当深度求索公布详述新模型性能及研发过程的论文后,英伟达市值单日蒸发5890亿美元,创历史最大跌幅。截至五月中旬,其股价已收复大部分失地。
下文将解析推动英伟达惊人增长的动力与未来挑战。
英伟达最受欢迎的AI芯片有哪些?
目前的盈利主力是Hopper H100芯片,其命名致敬了计算机科学先驱格蕾丝·霍珀。这款图形处理器是源自游戏玩家个人电脑的加强版。Hopper系列现正被以数学家戴维·布莱克威尔命名的Blackwell系列取代旗舰地位。
Hopper和Blackwell均采用能将多台搭载英伟达芯片的计算机集群整合为单一单元的技术,可高速处理海量数据并进行计算。这使它们完美契合训练神经网络的算力密集型任务——这些网络正是支撑新一代AI产品的核心。
成立于1993年的英伟达早在十多年前就押注并行计算能力终将使芯片在游戏之外的领域大放异彩,由此开创了这一市场。
这家总部位于加州圣克拉拉的公司将提供多种Blackwell产品组合,包括GB200超级芯片方案——该方案将两个Blackwell GPU与一个通用中央处理器Grace CPU相结合(Grace CPU同样以格蕾丝·霍珀命名)。
英伟达AI芯片为何独特?
所谓生成式AI平台通过消化海量现有资料来学习文本翻译、报告摘要和图像合成等任务——接触的数据越多,表现越出色。这类平台通过试错法发展,需进行数十亿次尝试才能达到精通水平,整个过程消耗着巨大的算力。
据英伟达称,Blackwell在AI训练中的性能是Hopper的2.5倍。新设计拥有如此多的晶体管——这些赋予半导体信息处理能力的微型开关——以至于无法以传统方式作为单一单元生产。该公司表示,实际上这是通过特殊连接技术融合的两枚芯片,确保它们能无缝协同工作。
对于急于训练AI平台执行新任务的客户而言,Hopper和Blackwell芯片提供的性能优势至关重要。这些组件被视为AI发展的关键要素,以至于已被限制向中国销售。
英伟达如何成为AI领域领导者?
英伟达早已是图形芯片(生成计算机屏幕图像的组件)领域的王者。最强大的图形芯片配备数千个处理核心,可同步执行多重计算线程,从而能生成包含阴影和反射等复杂3D渲染效果——这正是现代电子游戏的标志性特征。
21世纪初,英伟达工程师意识到可以改造这些图形加速器用于其他领域。与此同时,AI研究人员发现使用这类芯片终于能让他们的研究实现实用化。
英伟达的竞争对手在做什么?
市场研究机构IDC数据显示,英伟达占据数据中心GPU市场约90%份额。主导云计算服务的巨头——包括亚马逊AWS、谷歌云和微软Azure等英伟达主要客户,以及竞争对手超微半导体与英特尔都在自主研发芯片。
在5月台湾举行的Computex展会上,英伟达表示愿意配合部分客户自主生产关键组件的举措。首席执行官黄仁勋宣布,英伟达的NVLink服务器骨干网——一组作为计算机主芯片间高速连接的核心技术——将向其他公司的产品开放。此前该技术仅限用于英伟达自家处理器和加速芯片。
不过目前,这些替代芯片的开发尚未对英伟达的市场主导地位构成实质性冲击。
英伟达如何保持竞争优势?
英伟达以其他企业难以企及的速度持续更新产品体系,包括配套硬件支持的软件方案。该公司还设计了集群系统,帮助客户批量采购H100芯片并快速部署。虽然英特尔至强处理器能处理复杂数据运算,但其核心数较少,在处理训练AI软件所需的海量数据时速度较慢。这家曾主导数据中心组件市场的企业,仍难以推出能让客户放弃英伟达设备的加速器产品。
黄仁勋摄影:Annabelle Chih/Bloomberg### AI芯片需求现状如何?
黄仁勋及其团队多次强调,公司现有订单已超出产能负荷,即便是旧款芯片也供不应求。
微软、亚马逊、Meta Platforms Inc.和谷歌已宣布计划共同投入数千亿美元发展人工智能及支持其运行的数据中心。但近期有迹象表明,AI数据中心建设热潮可能正在降温。微软已暂缓全球多个数据中心项目,引发外界对其是否过度布局AI算力基础设施的担忧。
为何中国初创企业深度求索引发强烈关注?
深度求索开源AI模型R1的发布令竞争对手震惊——该模型以极低资源消耗达到了与美国同行媲美的性能表现。
该公司采用"推理优化"方法,通过现实数据微调模型,相比其他企业的人工训练方案更省时耗。就连潜在利益受损方英伟达也承认这是"卓越的AI进步",且未违反美国技术出口管制。
虽然美国禁令限制英伟达向中国出售最先进GPU,但该公司的表态消除了部分行业分析师对中国初创企业技术突破真实性的质疑。
英伟达强调,即便AI建模方式变革,其芯片仍将发挥关键作用:“推理过程需要大量英伟达GPU及高性能网络支持。”
AMD与英特尔在AI芯片领域如何与英伟达竞争?
全球第二大显卡制造商AMD于2023年发布了针对英伟达主导市场的Instinct系列新品。性能提升35倍的升级版MI350芯片将于年中向客户交付,首席执行官苏姿丰表示其表现将远超前代产品。
虽然业界普遍认为AMD最有可能撼动英伟达的领先地位,但有迹象表明其发展势头受阻。该公司预测2025年前半年营收将与2024年后半年持平。AMD每年从AI模型开发加速器芯片中获得超50亿美元收入,而英伟达同类产品年销售额突破千亿美元。
英特尔管理层向分析师坦言"未实质性参与云端AI数据中心市场竞争"。由于未获潜在客户积极反馈,该公司于1月决定放弃代号"猎鹰海岸"的新AI芯片上市计划,仅将其用于内部测试。
目前尚无竞争对手能企及英伟达宣称Blackwell架构将带来的技术飞跃。该公司的优势不仅在于硬件性能,其发明的CUDA编程语言使显卡能处理AI应用底层运算,这一软件的广泛使用形成了行业对英伟达硬件的深度依赖。
参考书架
- 通过我们的人工智能术语表填补知识空白。
- 这就是为什么新型AI模型对芯片和能源有着永不满足的需求。
- 英国艾伦·图灵研究所探讨人工智能伦理与安全。
- 彭博商业周刊深挖了黄仁勋对AI的豪赌背后的故事。
- 随着对科技巨头支出的疑虑消退,英伟达股价在五月强势反弹。