阿里巴巴(BABA)发布新款AI模型可在手机上处理视频和音频 - 彭博社

Edwin Chan

2025-03-27

随着模型演进，阿里巴巴希望成为企业开发和应用现实世界AI技术的关键合作伙伴。

摄影师：沈启来/彭博社阿里巴巴集团控股有限公司发布了通义千问系列新一代人工智能模型，该模型可处理文本、图片、音频和视频，其高效性足以直接在手机和笔记本电脑上运行。

公司表示，这款已在Hugging Face和GitHub开源的新模型，将用于构建能通过实时音频描述帮助视障人士感知环境等功能的AI智能体。

自全面投入AI技术以来，阿里巴巴今年正以惊人速度发布AI产品。这家中国电商与云计算巨头在深度求索1月引发关注后数日便推出了新版通义千问模型。本月早些时候，其AI助手夸克应用也发布了新版本。

阿里巴巴并非唯一开发多模态模型的AI企业。OpenAI与Alphabet旗下谷歌均提供能处理文本、音频等多类型输入的生成式AI工具。周二OpenAI还为ChatGPT升级了更先进的图像生成功能以扩展其能力。

阿里巴巴在一份声明中表示，其全新的Qwen2.5-Omni-7B系统在语音理解与生成方面展现出卓越性能。

这家由马云联合创立的互联网巨头宣布，未来在人工智能和云计算领域的投入将超过过去十年总和。随着AI模型迭代对算力需求激增，阿里巴巴致力于成为企业实现AI技术开发与实体应用落地的核心合作伙伴。

了解更多中国AI复兴动态
深度求索成功后中国AI模型席卷全球阿里蔡崇信预警AI数据中心建设存在"泡沫"阿里巴巴领跑中国AI竞赛紧追深度求索马云旗下蚂蚁集团宣布基于国产芯片实现AI突破

自深度求索以仅耗资数百万美元打造的强大模型超越OpenAI后，中国科技企业接连推出低成本AI服务，对OpenAI和谷歌等公司的高价产品形成价格压制。

尽管这些中国AI产品是否真正匹敌或超越西方顶尖系统尚无定论，但这些新选择正给美国头部企业的商业模式带来更大压力。