AI公司青睐在更少芯片上运行的高效模型 - 彭博社

Rachel Metz

2025-03-13

Cohere公司首席执行官艾丹·戈麦斯

摄影师：克里斯·拉特克利夫/彭博社中国深度求索公司爆红近两个月后，引发行业反思科技公司在开发人工智能系统上的巨额投入，部分领先AI企业开始转向"少即是多"的发展策略。

周四，总部位于多伦多的Cohere公司将发布名为Command A的新模型，该模型仅需英伟达A100或H100两款AI芯片即可处理复杂商业任务。这远低于某些大模型所需的芯片数量，也低于深度求索系统的预估需求。

此前一天，谷歌母公司Alphabet推出Gemma系列AI新模型，宣称单块英伟达H100芯片即可运行。两家公司均表示其模型在特定任务上媲美或超越了深度求索的最新AI系统。

包括谷歌在内的AI企业仍在数据中心、芯片和人才方面投入数十亿美元，以开发尖端模型并推动普及应用。但近期发布也暗示全行业正致力于提升AI软件运行效率。虽然Cohere等部分项目在深度求索爆红前已启动，这家中国新锐引发的热潮或将加速这场效率革命。

1月，深度求索发布了开源人工智能软件，其性能可与OpenAI和谷歌的模型比肩——据称其开发成本仅为竞争对手模型的零头。深度求索团队提出了一些简单但关键的创新，例如找到方法更高效利用现有计算机芯片。部分AI高管认为，对深度求索的高度关注对行业是积极的，表明部署先进AI系统的成本可能比普遍认为的要低。

“我认为深度求索的贡献是让市场意识到许多参与者的效率有多低下，“Cohere联合创始人兼首席执行官艾丹·戈麦斯在接受采访时表示，“这是一次非常健康的警醒。”

Cohere表示八个月前就已开始研发新模型，早于深度求索颠覆科技界的时点。对于这家专注于AI商业应用、最近估值55亿美元的公司而言，这种模式还有额外优势。用更少芯片运行AI模型对算力可能受限的企业客户"至关重要”。

“他们没有几十块，更不用说几百块GPU来部署解决方案，“戈麦斯谈及图形处理器时表示，“所以他们需要非常轻量且可扩展的形态。”