AI公司青睐在更少芯片上运行的高效模型 - 彭博社
Rachel Metz
Cohere公司首席执行官艾丹·戈麦斯
摄影师:克里斯·拉特克利夫/彭博社中国深度求索公司爆红近两个月后,引发行业反思科技公司在开发人工智能系统上的巨额投入,部分领先AI企业开始转向"少即是多"的发展策略。
周四,总部位于多伦多的Cohere公司将发布名为Command A的新模型,该模型仅需英伟达A100或H100两款AI芯片即可处理复杂商业任务。这远低于某些大模型所需的芯片数量,也低于深度求索系统的预估需求。
此前一天,谷歌母公司Alphabet推出Gemma系列AI新模型,宣称单块英伟达H100芯片即可运行。两家公司均表示其模型在特定任务上媲美或超越了深度求索的最新AI系统。
包括谷歌在内的AI企业仍在数据中心、芯片和人才方面投入数十亿美元,以开发尖端模型并推动普及应用。但近期发布也暗示全行业正致力于提升AI软件运行效率。虽然Cohere等部分项目在深度求索爆红前已启动,这家中国新锐引发的热潮或将加速这场效率革命。
1月,深度求索发布了开源人工智能软件,其性能可与OpenAI和谷歌的模型比肩——据称其开发成本仅为竞争对手模型的零头。深度求索团队提出了一些简单但关键的创新,例如找到方法更高效利用现有计算机芯片。部分AI高管认为,对深度求索的高度关注对行业是积极的,表明部署先进AI系统的成本可能比普遍认为的要低。
“我认为深度求索的贡献是让市场意识到许多参与者的效率有多低下,“Cohere联合创始人兼首席执行官艾丹·戈麦斯在接受采访时表示,“这是一次非常健康的警醒。”
Cohere表示八个月前就已开始研发新模型,早于深度求索颠覆科技界的时点。对于这家专注于AI商业应用、最近估值55亿美元的公司而言,这种模式还有额外优势。用更少芯片运行AI模型对算力可能受限的企业客户"至关重要”。
“他们没有几十块,更不用说几百块GPU来部署解决方案,“戈麦斯谈及图形处理器时表示,“所以他们需要非常轻量且可扩展的形态。”