阿里巴巴推出最新AI图像服务以吸引用户——彭博社

Luz Ding

2025-06-27

中国杭州阿里巴巴集团控股有限公司总部。

摄影师：沈起来/彭博社阿里巴巴集团控股有限公司发布了其人工智能技术的新版本，该技术将使用户更容易根据文本和视觉内容生成和修改图像，这家中国电商巨头正持续加码人工智能领域。

这家总部位于杭州的公司推出了通义千问VLo，这是其Qwen品牌下的一系列人工智能服务之一。新模型是Qwen2.5-VL的升级版，现在能够生成文本到图像和图像到图像的结果。它还拥有一项名为渐进式生成的技术，意味着用户可以观看图像生成的全过程。

“这次全新升级的模型不仅能‘理解’世界，还能基于这种理解生成高质量的创作，”该公司在一篇博客文章中表示。“你可以直接发送诸如‘生成一张可爱猫咪的图片’这样的提示来生成图像，或者上传一张猫咪图片并指示‘给猫咪头上加顶帽子’来修改图像。”

以在中国市场的电商业务闻名的阿里巴巴，一直在积极进军人工智能领域，并围绕Qwen构建独立产品。今年二月，首席执行官吴泳铭甚至表示，公司现在的“首要目标”是通用人工智能（AGI），这是业界追求构建具有人类水平智能的AI系统的目标。

通过新的通义千问多模态模型，阿里巴巴旨在与市场上包括OpenAI在内的众多新型视觉界面竞争。同时，它还面临着来自深度求索等国内企业的激烈竞争。

在深度求索以宣称仅耗资数百万美元构建的强大模型震惊业界后，中国科技巨头迅速推出了一系列低成本AI服务抢占市场。阿里巴巴快速迭代其Qwen系列，新增了处理文本、图片、音频和视频的多模态能力——这些模型能高效运行于手机和笔记本电脑。该公司还在三月发布了新版AI助手应用夸克。

视频：中国深度求索如何挑战AI巨头。