阿里巴巴发布能识别情绪的AI模型 挑战OpenAI——彭博社
Luz Ding
阿里巴巴集团控股有限公司发布了一款新型人工智能模型,声称能够识别情绪,这显然是为了超越OpenAI的最新模型。
在两次演示中,阿里巴巴通义实验室的研究人员展示了他们新开源的多模态模型R1-Omni,该模型能推断视频中人物的情绪状态,同时还能描述其服装和环境。这为所谓的计算机视觉增添了另一层理解,是同一首席研究员赵嘉星主导开发的另一开源模型HumanOmni的增强版本。
阿里巴巴在人工智能领域确立领先地位的努力因深度求索(DeepSeek)1月份的高调亮相而加速,这家电商巨头目前正在多个领域推出人工智能工具和应用的新版本。该公司将其Qwen模型与深度求索进行对标,与苹果公司就iPhone人工智能达成重要合作,现在似乎也在挑战OpenAI。该公司正在提供R1-Omni供用户在Hugging Face上免费下载。
观看:中国深度求索如何进军大模型领域
实现情感智能的尝试——即让计算机能够识别和响应人类情绪——早已广泛展开。用于识别人类心理状态和健康状况的技术正被应用于客服聊天机器人以检测用户不满情绪,以及特斯拉公司车辆识别疲劳驾驶。
OpenAI于今年初推出其GPT-4.5模型,声称该模型能更精准识别并响应文本提示中的微妙线索。但该模型定价高昂:初期仅向月付200美元的用户开放。而身陷中国市场价格战的阿里巴巴则免费开放其新模型供所有人使用。演示仅显示其能输出"快乐"或"愤怒"等基础情绪标签,但其宣称的通过视觉线索推导情绪的能力颇具突破性。
这家杭州科技公司的首席执行官吴泳铭二月向分析师表示,通用人工智能已成为阿里巴巴"首要目标",而情感智能是实现该目标的关键步骤。