马云支持的蚂蚁集团利用国产芯片实现AI技术突破——彭博社

Lulu Yilun Chen

2025-03-24

由马云支持的蚂蚁集团采用国产芯片开发AI模型训练技术，据知情人士透露，此举可降低20%成本。

知情人士称，蚂蚁运用包括阿里巴巴集团和华为技术有限公司在内的国产芯片，通过"专家混合"机器学习方法训练模型。其效果与英伟达H800芯片相当。因信息未公开，这些人士要求匿名。一位人士表示，蚂蚁虽仍使用英伟达进行AI开发，但在最新模型中已转向超威半导体及国产芯片替代方案。

此举标志着蚂蚁加入中美企业竞赛。自深度求索公司证明无需像OpenAI和谷歌投入数十亿美元也能训练优质模型后，该竞赛持续升温。这凸显中国企业正尝试用本土方案替代最先进的英伟达芯片。H800虽非最尖端，却是当前被美国禁运至中国的较强算力芯片。

该公司发表的研究论文称，其模型在某些基准测试中偶尔超越Meta Platforms Inc.（该结果未经彭博新闻独立核实）。若效果属实，蚂蚁平台通过降低AI推理和服务支持成本，或将推动中国人工智能发展再进一步。

随着企业向人工智能领域投入大量资金，混合专家模型（MoE）已成为热门选择，谷歌和杭州初创公司深度求索等机构的应用使其广受认可。该技术将任务分解为更小的数据集，就像组建一支专家团队，每位成员专注于工作的某个环节，从而提升效率。蚂蚁集团在邮件声明中拒绝置评。

更多人工智能相关阅读：
英伟达CEO称对深度求索影响的担忧是杞人忧天
创始人称斯坦福、哈佛毕业生争相加入中国AI初创企业
AI先驱预测美中行业洗牌后仅少数模型能存活
腾讯营收创多年最快增速后加速AI投入

然而，MoE模型的训练通常依赖英伟达销售的图形处理器等高性能芯片。高昂成本至今仍令许多小型企业望而却步，限制了更广泛采用。蚂蚁集团一直致力于提升大语言模型训练效率以突破此限制。其论文标题明确表达了"无需高端GPU"扩展模型的目标。

这与英伟达的理念背道而驰。首席执行官黄仁勋认为，即便出现深度求索R1等高效模型，计算需求仍将增长，主张企业需要更强大的芯片来创收，而非更廉价的芯片来降本。他坚持通过增加处理核心、晶体管和内存容量来打造大型GPU的战略。

彭博行业研究观点

蚂蚁集团的论文凸显了中国人工智能领域创新力提升与技术发展加速的态势。若其主张得到证实，则表明中国正通过采用成本更低、计算效率更高的模型来规避英伟达芯片出口管制，在AI自主化道路上取得显著进展。

——彭博行业研究高级分析师Robert Lea

蚂蚁集团表示，使用高性能硬件训练1万亿token需花费约635万元人民币（88万美元），而经优化的方案采用较低配置硬件可将成本降至510万元。Token是模型理解世界并回应用户查询时所处理的信息单元。

知情人士透露，该公司计划利用其最新研发的大语言模型"灵Plus"和"灵Lite"的技术突破，为医疗健康及金融等领域提供工业级AI解决方案。

蚂蚁集团于今年收购中国在线医疗平台好大夫在线，以强化其医疗健康领域的人工智能服务。该公司还拥有名为"知小宝"的AI生活助手应用及智能理财服务"蚂小财"。

在英语理解能力方面，蚂蚁集团论文指出，其"灵Lite"模型在关键基准测试中表现优于Meta的Llama系列某一模型。而"灵Lite"与"灵Plus"在中文基准测试中的表现均超越深度求索公司的同类模型。

了解更多关于中美人工智能竞赛的信息
人工智能热潮如何造就史上最具价值的垄断企业人工智能公司青睐芯片需求更少的高效模型阿里巴巴领跑追赶中国深度求索的竞争对手

“如果你找到一个击败世界顶级功夫大师的突破点，你仍然可以说你击败了他们，这就是为什么实际应用很重要，”北京人工智能解决方案提供商盛商科技首席技术官Robin Yu表示。

蚂蚁集团已将灵模型开源。灵-Lite包含168亿个参数，这些可调节设置如同旋钮和刻度盘般控制模型性能。灵-Plus拥有2900亿参数，在语言模型领域被认为规模较大。作为对比，专家估计ChatGPT的GPT-4.5模型具有1.8万亿参数，据《麻省理工科技评论》报道。深度求索R1模型拥有6710亿参数。

蚂蚁集团在训练过程中面临稳定性等挑战。该公司在论文中表示，硬件或模型结构的微小变化都会导致问题，包括模型错误率飙升。