阿里巴巴推出一款声称超越DeepSeek-V3的人工智能模型 | 路透社
Eduardo Baptista
北京,1月29日(路透社) - 中国科技公司阿里巴巴(9988.HK)于本周三推出了其人工智能模型Qwen 2.5的新版本,称其已超越DeepSeek-V3。Qwen 2.5-Max的发布时机颇为特殊,恰逢农历新年的第一天,此时大多数中国人都在休假,这显示出中国人工智能初创公司DeepSeek在过去三周内的迅猛崛起对外国竞争对手以及国内竞争者施加的压力。
阿里巴巴的云计算部门在其官方微信账号发布的公告中表示:“Qwen 2.5-Max超越了(…)几乎所有的GPT-4o、DeepSeek-V3和Llama-3.1-405B”,指的是美国OpenAI和Meta的最先进的开源人工智能模型。
1月10日,DeepSeek推出了其配备DeepSeek-V3模型的人工智能助手,以及1月20日推出的R1模型,震惊了硅谷,并导致全球科技公司股票暴跌。
但DeepSeek的成功也引发了国内竞争对手之间的竞赛,以更新他们自己的人工智能模型。
在DeepSeek-R1发布两天后,抖音母公司字节跳动推出了其主要人工智能模型的更新,称其在AIME测试中超越了OpenAI的o1,该测试衡量人工智能模型理解和响应复杂指令的能力。
这呼应了DeepSeek的声明,即其R1模型在多个性能基准测试中与o1相媲美。
DEEPSEEK与中国竞争对手
DeepSeek的V3模型的前身DeepSeek-V2在去年五月发布后,引发了中国人工智能模型的价格战。
DeepSeek-V2是开源且便宜,每百万个令牌(或模型处理的数据单位)仅需1元人民币(0.14美元),这使得阿里巴巴的云计算部门宣布对一系列模型的价格削减高达97%。
其他中国科技公司也纷纷效仿,包括百度 (9888.HK),该公司在2023年3月推出了中国首个相当于ChatGPT的产品,以及中国最有价值的科技公司腾讯 (0700.HK)。DeepSeek的创始人梁文峰在7月接受中国媒体Waves的罕见采访时表示,这家初创公司“并不在乎”价格战,达到AGI(通用人工智能)是其主要目标。
OpenAI将AGI定义为在经济上最有价值的任务中超越人类的自主系统。
尽管像阿里巴巴这样的中国大型科技公司拥有数十万名员工,DeepSeek却作为一个研究实验室运作,团队主要由来自中国顶尖大学的年轻毕业生和博士生组成。
梁在七月的采访中表示,他认为中国最大的科技公司可能不适合人工智能行业的未来,因其高昂的成本和自上而下的结构与DeepSeek的精简运营和灵活管理风格形成对比。
“大型基础模型需要持续创新,科技巨头的能力是有限的,”他说。
((翻译 编辑 圣保罗, 55 11 56447753))
路透社 AAJ
- 建议话题:
- 科技