阿里巴巴推出新AI模型,自称性能超越中国最热门初创公司深度求索 | 南华早报
Zhou Xin
阿里巴巴集团周三发布了其通义千问AI模型的升级版本,称该模型在部分基准测试中"全面超越"了去年12月由中国最热门初创企业推出的大语言模型深度求索V3。这家电商巨头旗下云计算与人工智能部门阿里云在微信声明中表示,其新版Qwen2.5-Max模型在LLM性能基准平台Arena-Hard和LiveBench上也超越了OpenAI的GPT-4o及Meta Platforms的Llama-3.1-405B。阿里巴巴持有《南华早报》。阿里云表示,作为通义千问大模型家族成员,Qwen2.5-Max的基准测试表现与Anthropic的Claude-3.5-Sonnet模型相当。大语言模型是支撑ChatGPT等生成式AI服务的基础技术。阿里巴巴的多模态模型提供从30亿到720亿参数的不同规模版本,包含基础版和指令调优版。旗舰模型Qwen2.5-VL-72B-Instruct现可通过通义千问平台使用,而整个Qwen2.5-VL系列已在开源平台Hugging Face和阿里自建开源社区上线模型范围。参数是机器学习术语,指AI系统训练过程中存在的变量,它帮助确定数据提示如何产生期望的输出。开源使公众能够访问软件程序的源代码,允许第三方开发者修改或分享其设计、修复损坏的链接或扩展其功能。
01:20
中国阿里巴巴发布新AI模型,据称性能优于竞争对手Deepseek和OpenAI的GPT-4o
中国阿里巴巴发布新AI模型,据称性能优于竞争对手Deepseek和OpenAI的GPT-4o
阿里巴巴股价在纽约近期交易中上涨近3%,延续了周二6.7%的涨幅,而香港交易因农历新年假期暂停。