情感交互升级！GPT-4o推动AI陪伴加速落地，万兴科技等抢先布局

2024-05-16

<article><section data-type=“rtext”>【环球网科技综合报道】近期，OPenAI举办新品发布会，推出一款名为GPT-4o的人工智能模型。根据OpenAI官方网站介绍，GPT-4o中的“o”代表Omni，指的是该模型处理文本、语音和视频的能力，也就是“全能”的意思。尤其是在音频理解方面表现出色，GPT-4o可以在232毫秒内对音频输入做出反应，平均响应时长也仅有320毫秒，与人类在对话中的反应速度相当，实现了人与AI的“丝滑”对话。此外，侧重情感陪伴和情绪价值是GPT-4o的另一个特点。OpenAI研究员Mark Chen表示，新模型具有“感知情绪”的能力，能笑、会唱，可以表达情感，还可以处理用户打断它的情况。在OpenAI发布的录播视频中，机器人能够从急促的喘气声中理解“紧张”的含义，并且指导演示人员进行深呼吸。对此，中国银河证券研报指出，GPT-4o展现出对人类交流习惯的高度理解力和适应性，可准确识别和响应人类情绪，并提供更具情感、个性化的回应。同时，GPT-4o在50多种语言（可覆盖约全球 97%的人口）中的处理速度及质量提升，实时翻译功能可助力不同语言使用者交流。<img data-alt="" src="//img.huanqiucdn.cn/dp/api/files/imageDir/e2024b021c209b15340453bdf831b6dfu1.png?imageView2/2/w/750" />而值得一提的是，“感知情绪”的能力天然适配AI陪伴应用的需求。在过去一年，“AI陪伴”一直是人工智能企业们布局的重点领域，商业变现的层面，“AI陪伴”目前也是消费者最愿意买单的应用场景之一。目前，众多公司布局了“AI陪伴”赛道。去年5月，AIGC软件A股上市公司万兴科技已率先推出Trumate，这是一款基于多模态技术构建的沉浸式虚拟陪伴聊天应用，融合了AI语音交流、AIGC技术支持的形象装扮定制、个性化人设问题、基于AI Agent推理的个性化剧场、多个AI Agent协同的精彩群聊等多种功能，在虚拟形象、人设、声音等方面设置了更多玩法，具有高沉浸感和娱乐感等特征。<img data-alt="" src="//img.huanqiucdn.cn/dp/api/files/imageDir/2d3bb2fc064ab785f95b541c9d645c2cu1.png?imageView2/2/w/750" />值得一提的是，加速布局“AI陪伴”赛道的不止万兴科技。海外，如Character.ai, CrushOn，Talkie，Replika等产品早前已出圈，在用户量、营收方面有了较为亮眼的表现。此外,国内AI聊天类产品也不断涌现。而随着GPT-4o的发布，“AI陪伴”赛道鏖战或将更加激烈。类比移动互联网生态演进历程，基础设施的进一步发展是应用繁荣的重要条件，对于AI应用来说，AI底层模型技术的持续迭代，是AI陪伴应用持续发展的一个关键因素。伴随着多模态技术的深入发展，大模型领域也在不断升级变化，从图文时代1.0加速进入到以音视频多媒体为载体的2.0时代，基于这样的趋势，国内厂商正加快大模型迭代。4月28日，万兴科技旗下国内首个音视频多媒体大模型万兴“天幕”正式公测，该大模型采用了先进的音视频生成式AI技术，具备近百项音视频原子能力，并已在海外规模化商用，其中文字生成视频能力实现不同风格、丰富场景及主题的连贯性，一键生成时长可超60秒。</section></article>