中国AI企业商汤科技押注多模态模型以脱颖而出 | 南华早报
Ann Cao
商汤科技,中国人工智能(AI)领域的先驱企业,近日发布新一代模型,宣称其推理能力超越OpenAI产品。该公司正通过押注多模态模型,在激烈的AI竞争中巩固市场地位。4月12日,商汤正式推出自研AI模型系列的新成员SenseNova V6和V6推理引擎。据董事长兼CEO徐立援引基准测试平台TableBench数据,V6在事实核查、数值推理、数据分析和可视化等多项指标上均优于OpenAI的GPT-4o。商汤表示,拥有6000亿参数的V6是目前中国多模态推理领域的标杆模型,也是全行业最具性价比的推理解决方案。
徐立指出,V6推理引擎在多模态推理能力方面超越了OpenAI的o1和谷歌Gemini 2.0闪电思维。这些突破旨在解决全行业面临的共同挑战:用于训练大语言模型的高质量文本数据正在枯竭。
商汤科技在上海某人工智能展会上的展位。图片来源:Costfoto/NurPhoto via Getty Images
与专注于文本的传统大语言模型不同,多模态大语言模型整合了图像、音频、视频等多种信息形态,显著提升了系统的理解与生成能力。
徐在上海周四的采访中表示,该行业最初根据规模法则扩大模型规模的策略已经“碰壁”。他说:“我们几乎已经用尽了所有可以从互联网上收集的文本数据。”