阿里巴巴开源AI模型表现亮眼,基于千问的智能体框架登顶全球排行榜 | 南华早报
Ann Cao
阿里巴巴集团的开源千问人工智能(AI)模型助力智能体框架DeepSWE在这一新兴领域超越竞争对手,该软件平台的开发者表示。由开源组织Agentica与旧金山初创公司Together AI联合开发的DeepSWE,基于千问3-32B大语言模型(LLM)训练而成——该模型属于阿里云第三代AI模型家族。在最新SWEBench-Verified测试中,它以59%的准确率登顶排行榜,超越了深度求索V3-0324等其他所谓开源权重模型,开发者周三在博客中宣布。智能体框架是提供构建、部署和管理AI代理所需结构、工具与功能的软件平台。它们使AI代理能够协作、决策并自动化复杂任务。
诸如中国初创公司蝴蝶效应的Manus等AI代理,是能代表用户或其他系统自主执行任务的软件程序。本质上,这些代理会利用可用资源创建具体任务与子任务的执行计划以实现目标。DeepSWE成为杭州阿里巴巴在全球开源社区日益增长的领导地位。阿里巴巴拥有《南华早报》。开源方式向公众开放程序的源代码,允许第三方软件开发人员修改或共享其设计、修复损坏的链接或扩展其功能。
根据LiveBench的数据,阿里巴巴集团的Qwen3系列在5月超越DeepSeek的R1,成为全球排名最高的开源AI模型。照片:Shutterstock