阿里巴巴发布了一种人工智能模型,称其超越了DeepSeek-V3 | 路透社
Eduardo Baptista
北京,1月29日(路透社) - 中国科技公司阿里巴巴(9988.HK)在周三推出了其人工智能模型Qwen 2.5的新版本,并声称其超越了备受赞誉的DeepSeek-V3。Qwen 2.5-Max的发布时机颇为特殊,正值农历新年的第一天,届时大多数中国人都在与家人团聚,显示出中国人工智能公司DeepSeek在过去三周的迅猛崛起对其外国竞争对手以及国内竞争者施加的压力。
阿里巴巴云计算部门在其官方微信账号发布的公告中表示:“Qwen 2.5-Max几乎超越了GPT-4o、DeepSeek-V3和Llama-3.1-405B”,这是指OpenAI和Meta的最先进的开源AI模型。
1月10日,基于DeepSeek-V3模型的DeepSeek人工智能助手的发布,以及1月20日其R1模型的推出,震惊了硅谷,并导致科技股暴跌。这家中国初创公司的开发和使用成本被认为较低,使得投资者开始质疑美国主要人工智能公司的庞大支出计划。
但DeepSeek的成功也引发了国内竞争对手之间的斗争,以提升他们自己的人工智能模型。
在DeepSeek-R1发布两天后,抖音母公司字节跳动发布了其旗舰人工智能模型的更新,声称其在AIME测试中超越了微软支持的OpenAI的o1,该测试衡量人工智能模型理解和响应复杂指令的能力。
DeepSeek声称其R1模型在多个性能测试中与OpenAI的o1相媲美。
DEEPSEEK与国内竞争对手的对比
DeepSeek的V3模型的前身DeepSeek-V2在去年五月发布后,引发了中国AI模型的价格战。
DeepSeek-V2是开源的,且价格前所未有,仅为每百万个token(或AI模型处理的数据单位)1元(0.14美元),这促使阿里巴巴的云单位宣布对一系列模型进行高达97%的降价。
其他中国科技公司也纷纷效仿,如百度 (9888.HK),该公司在2023年3月推出了中国首个ChatGPT的等效产品,以及中国最有价值的互联网公司腾讯 (0700.HK)。DeepSeek的神秘创始人梁文峰在七月接受中国媒体Waves的罕见采访时表示,该初创公司“并不在乎”价格战,其主要目标是实现AGI(通用人工智能)。
OpenAI将AGI定义为在大多数经济价值任务中超越人类的自主系统。
尽管像阿里巴巴这样的中国大型科技公司拥有数十万名员工,DeepSeek则作为一个研究实验室运作,主要由来自中国顶尖大学的年轻毕业生和博士生组成。
梁在七月的采访中表示,他认为中国最大的科技公司可能不适合人工智能行业的未来,将其高昂的成本和层级结构与DeepSeek的灵活运作和管理风格进行了对比。
“大型基础模型需要持续创新,科技巨头的能力是有限的,”他表示。
- 建议话题:
- 商业