中国AI企业商汤科技押注多模态模型以脱颖而出 | 南华早报

Ann Cao

2025-04-12

商汤科技，中国人工智能（AI）领域的先驱企业，近日发布新一代模型，宣称其推理能力超越OpenAI产品。该公司正通过押注多模态模型，在激烈的AI竞争中巩固市场地位。4月12日，商汤正式推出自研AI模型系列的新成员SenseNova V6和V6推理引擎。据董事长兼CEO徐立援引基准测试平台TableBench数据，V6在事实核查、数值推理、数据分析和可视化等多项指标上均优于OpenAI的GPT-4o。商汤表示，拥有6000亿参数的V6是目前中国多模态推理领域的标杆模型，也是全行业最具性价比的推理解决方案。

徐立指出，V6推理引擎在多模态推理能力方面超越了OpenAI的o1和谷歌Gemini 2.0闪电思维。这些突破旨在解决全行业面临的共同挑战：用于训练大语言模型的高质量文本数据正在枯竭。

商汤科技在上海某人工智能展会上的展位。图片来源：Costfoto/NurPhoto via Getty Images

与专注于文本的传统大语言模型不同，多模态大语言模型整合了图像、音频、视频等多种信息形态，显著提升了系统的理解与生成能力。

徐在上海周四的采访中表示，该行业最初根据规模法则扩大模型规模的策略已经“碰壁”。他说：“我们几乎已经用尽了所有可以从互联网上收集的文本数据。”