阿里巴巴发布其声称超越DeepSeek-V3的AI模型 | 路透社
Eduardo Baptista
阿里巴巴集团的标志出现在2023年7月6日在中国上海举行的世界人工智能大会(WAIC)上。路透社/阿丽·宋/档案照片北京,1月29日(路透社)- 中国科技公司阿里巴巴(9988.HK)周三发布了其Qwen 2.5人工智能模型的新版本,声称其超越了备受赞誉的DeepSeek-V3。Qwen 2.5-Max发布的时机颇为特殊,恰逢农历新年的第一天,大多数中国人都在休假与家人团聚,这显示了中国人工智能初创公司DeepSeek在过去三周内的迅猛崛起对海外竞争对手以及国内竞争者施加的压力。“Qwen 2.5-Max在几乎所有方面都超越了GPT-4o、DeepSeek-V3和Llama-3.1-405B,”阿里巴巴的云计算部门在其官方微信账号上发布的公告中表示,提到OpenAI和Meta的最先进的开源AI模型。
DeepSeek的AI助手于1月10日发布,基于DeepSeek-V3模型,以及1月20日发布的R1模型,震惊了硅谷,导致科技股暴跌,而这家中国初创公司的所谓低开发和使用成本促使投资者质疑美国领先人工智能公司的巨额支出计划。但DeepSeek的成功也导致国内竞争对手争相升级自己的人工智能模型。
在DeepSeek-R1发布两天后,TikTok的母公司字节跳动 发布了其旗舰人工智能模型的更新,并声称其在AIME基准测试中超越了微软支持的OpenAI的o1,该测试衡量人工智能模型理解和响应复杂指令的能力。这与DeepSeek声称其R1模型在多个性能基准上与OpenAI的o1相媲美的说法相呼应。
DEEPSEEK与国内竞争对手
DeepSeek的V3模型的前身DeepSeek-V2在去年五月发布后,引发了中国的 人工智能模型价格战。DeepSeek-V2是开源的,且前所未有地便宜,仅为每百万个令牌(即人工智能模型处理的数据单位)1元(0.14美元),这导致阿里巴巴的云计算部门 宣布对一系列模型降价高达97%。其他中国科技公司也纷纷效仿,包括百度 (9888.HK),该公司在2023年3月发布了 中国首个相当于ChatGPT的产品,以及该国最有价值的互联网公司腾讯 (0700.HK).梁文峰,DeepSeek神秘的创始人在七月接受中国媒体《波浪》的罕见采访时表示,这家初创公司“并不在乎”价格战,实现AGI(人工通用智能)是其主要目标。OpenAI将AGI定义为在大多数经济价值任务中超越人类的自主系统。
虽然像阿里巴巴这样的大型中国科技公司拥有数十万员工,但DeepSeek的运作更像一个研究实验室,主要由来自中国顶尖大学的年轻毕业生和博士生组成。
梁在七月的采访中表示,他认为中国最大的科技公司可能不太适合未来的人工智能行业,认为它们的高成本和自上而下的结构与DeepSeek的精简运作和宽松管理风格形成对比。
他说:“大型基础模型需要持续创新,科技巨头的能力是有极限的。”
路透社每日简报提供您开始一天所需的所有新闻。请在 这里注册。
- 建议主题:
- 被打乱的