阿里巴巴发布Qwen3 AI模型,称其性能超越深度求索R1 | 南华早报
Ben Jiang
阿里巴巴集团控股有限公司于本周二发布了备受期待的第三代开源人工智能(AI)模型系列,该系列承诺提供更快的处理速度和增强的多语言能力,在中国本已拥挤的市场中加剧了竞争。据阿里云旗下通义千问团队介绍,Qwen3系列包含从6亿到2350亿参数的八款模型,全系列能力均有提升。阿里巴巴集团持有《南华早报》。
在AI领域,参数是衡量模型训练过程中变量的指标,其规模通常反映模型复杂度:参数越大意味着更强的能力。
阿里公布的基准测试显示,Qwen3-235B和Qwen3-4B等模型在指令遵循、代码生成、文本创作、数学能力及复杂问题解决方面,性能已持平或超越国内外竞品——包括OpenAI的o1、谷歌的Gemini和深度求索的R1。
11:13
阿里巴巴国际站如何押注AI变革电商
阿里巴巴国际站如何押注AI变革电商
此次Qwen3的发布正如《南华早报》此前报道,预计将巩固阿里巴巴作为开源模型领先提供商的地位。基于其构建的衍生模型超过10万个,Qwen目前是全球最大的开源AI生态系统,超越了Facebook母公司Meta Platforms的Llama社区。