阿里巴巴的Qwen推动十大开源模型发展,中国AI技术超越DeepSeek | 南华早报
Ann Cao
阿里巴巴集团的通义千问人工智能(AI)模型正在为全球十大开源大语言模型(LLMs)提供支持,据协作式机器学习平台及社区Hugging Face称。Hugging Face最新的Open LLM排行榜显示,所有排名靠前的模型都是在通义千问更新的开源版本上训练和开发的,这是阿里巴巴云计算服务和AI部门构建的通义千问大语言模型家族的一部分。杭州的阿里巴巴拥有《南华早报》。在十大开源大语言模型中,至少有七个是基于阿里云的Qwen2.5-72b系列。排名第一的大语言模型calme-3.2-instruct-78b自称是“Qwen2.5-72b的高级迭代版本”,在自定义数据集上进行了微调,以增强其在通用领域的能力。大语言模型是支撑生成式AI(GenAI)服务如ChatGPT的技术。生成式AI指的是可用于创建新内容的算法,包括音频、代码、图像、文本、模拟和视频。开源使公众可以访问软件程序的源代码,允许第三方开发者修改或分享其设计、修复损坏的链接或扩展其功能。开源技术已经中国科技产业蓬勃发展的巨大贡献者在过去几十年间。
01:20
中国阿里巴巴发布新AI模型,据称性能超越竞争对手Deepseek和OpenAI的GPT-4o
中国阿里巴巴发布新AI模型,据称性能超越竞争对手Deepseek和OpenAI的GPT-4o
通义千问在最新Hugging Face开源排行榜上对大型语言模型发展的影响力,反映出中国AI能力在深度求索近期突破之外的持续深化。