腾讯混元T1 AI推理模型在性能与价格上对标深度求索 | 南华早报
Coco Feng
腾讯控股发布了一款名为混元T1的新型人工智能(AI)推理模型,在性能与定价方面均对标深度求索公司的R1模型。这家中国科技巨头于周五推出的最新产品采用大规模强化学习技术——深度求索在其1月发布的R1推理模型中也运用了相同技术。
该版本是继T1预览版在其智能助手元宝上测试运行后推出的正式版。在评估模型知识储备的大规模多任务语言理解(MMLU Pro)基准测试中,T1以87.2分的成绩超越深度求索R1的84分,但略逊于OpenAI去年12月发布的o1推理模型(89.3分)——后者正是ChatGPT开发商的成果。T1在其他基准测试中同样表现优异:2024年美国数学邀请赛(AIME)测评获得78.2分(R1为79.8分,o1为79.2分)。腾讯数据显示,在中文能力方面,T1于C-Eval综合评估中取得91.8分的优异成绩,与R1持平,并优于o1的87.8分。
该模型在定价策略上也向深度求索看齐——后者正是这家明星中国初创企业的主要优势所在。T1的输入定价为每百万tokens收费1元人民币(约合0.14美元),输出费用为每百万tokens4元。其输入费率与R1保持一致(日间每百万tokens1元,夜间仅0.25元);输出定价也具可比性——R1日间输出费率为每百万tokens16元,夜间降至4元。
腾讯宣称自己是业内首家采用谷歌Transformer与卡内基梅隆大学及普林斯顿大学联合研发的Mamba混合架构的企业。这家中国科技巨头表示,与纯Transformer架构相比,该混合方案通过降低内存占用"显著减少了训练和推理成本"。