阿里巴巴推出最新AI图像服务以吸引用户——彭博社
Luz Ding
中国杭州阿里巴巴集团控股有限公司总部。
摄影师:沈起来/彭博社阿里巴巴集团控股有限公司发布了其人工智能技术的新版本,该技术将使用户更容易根据文本和视觉内容生成和修改图像,这家中国电商巨头正持续加码人工智能领域。
这家总部位于杭州的公司推出了通义千问VLo,这是其Qwen品牌下的一系列人工智能服务之一。新模型是Qwen2.5-VL的升级版,现在能够生成文本到图像和图像到图像的结果。它还拥有一项名为渐进式生成的技术,意味着用户可以观看图像生成的全过程。
“这次全新升级的模型不仅能‘理解’世界,还能基于这种理解生成高质量的创作,”该公司在一篇博客文章中表示。“你可以直接发送诸如‘生成一张可爱猫咪的图片’这样的提示来生成图像,或者上传一张猫咪图片并指示‘给猫咪头上加顶帽子’来修改图像。”
以在中国市场的电商业务闻名的阿里巴巴,一直在积极进军人工智能领域,并围绕Qwen构建独立产品。今年二月,首席执行官吴泳铭甚至表示,公司现在的“首要目标”是通用人工智能(AGI),这是业界追求构建具有人类水平智能的AI系统的目标。
通过新的通义千问多模态模型,阿里巴巴旨在与市场上包括OpenAI在内的众多新型视觉界面竞争。同时,它还面临着来自深度求索等国内企业的激烈竞争。
在深度求索以宣称仅耗资数百万美元构建的强大模型震惊业界后,中国科技巨头迅速推出了一系列低成本AI服务抢占市场。阿里巴巴快速迭代其Qwen系列,新增了处理文本、图片、音频和视频的多模态能力——这些模型能高效运行于手机和笔记本电脑。该公司还在三月发布了新版AI助手应用夸克。
视频:中国深度求索如何挑战AI巨头。