情感交互升级!GPT-4o推动AI陪伴加速落地,万兴科技等抢先布局
<article><section data-type=“rtext”><p>【环球网科技综合报道】近期,OPenAI举办新品发布会,推出一款名为GPT-4o的人工智能模型。根据OpenAI官方网站介绍,GPT-4o中的“o”代表Omni,指的是该模型处理文本、语音和视频的能力,也就是“全能”的意思。</p><p>尤其是在音频理解方面表现出色,GPT-4o可以在232毫秒内对音频输入做出反应,平均响应时长也仅有320毫秒,与人类在对话中的反应速度相当,实现了人与AI的“丝滑”对话。</p><p>此外,侧重情感陪伴和情绪价值是GPT-4o的另一个特点。OpenAI研究员Mark Chen表示,新模型具有“感知情绪”的能力,能笑、会唱,可以表达情感,还可以处理用户打断它的情况。在OpenAI发布的录播视频中,机器人能够从急促的喘气声中理解“紧张”的含义,并且指 导演示人员进行深呼吸。</p><p>对此,中国银河证券研报指出,GPT-4o展现出对人类交流习惯的高度理解力和适应性,可准确识别和响应人类情绪,并提供更具情感、个性化的回应。同时,GPT-4o在50多种语言(可覆盖约全球 97%的人口)中的处理速度及质量提升,实时翻译功能可助力不同语言使用者交流。</p><p><img data-alt="" src="//img.huanqiucdn.cn/dp/api/files/imageDir/e2024b021c209b15340453bdf831b6dfu1.png?imageView2/2/w/750" /></p><p>而值得一提的是,“感知情绪”的能力天然适配AI陪伴应用的需求。在过去一年,“AI陪伴”一直是人工智能企业们布局的重点领域,商业变现的层面,“AI陪伴”目前也是消费者最愿意买单的应用场景之一。</p><p>目前,众多公司布局了“AI陪伴”赛道。去年5月,AIGC软件A股上市公司万兴科技已率先推出Trumate,这是一款基于多模态技术构建的沉浸式虚拟陪伴聊天应用,融合了AI语音交流、AIGC技术支持的形象装扮定制、个性化人设问题、基于AI Agent推理的个性化剧场、多个AI Agent协同的精彩群聊等多种功能,在虚拟形象、人设、声音等方面设置了更多玩法,具有高沉浸感和娱乐感等特征。</p><p><img data-alt="" src="//img.huanqiucdn.cn/dp/api/files/imageDir/2d3bb2fc064ab785f95b541c9d645c2cu1.png?imageView2/2/w/750" /></p><p>值得一提的是,加速布局“AI陪伴”赛道的不止万兴科技。海外,如Character.ai, CrushOn,Talkie,Replika等产品早前已出圈,在用户量、营收方面有了较为亮眼的表现。此外,国内AI聊天类产品也不断涌现。而随着GPT-4o的发布,“AI陪伴”赛道鏖战或将更加激烈。类比移动互联网生态演进历程,基础设施的进一步发展是应用繁荣的重要条件,对于AI应用来说,AI底层模型技术的持续迭代,是AI陪伴应用持续发展的一个关键因素。</p><p>伴随着多模态技术的深入发展,大模型领域也在不断升级变化,从图文时代1.0加速进入到以音视频多媒体为载体的2.0时代,基于这样的趋势,国内厂商正加快大模型迭代。4月28日,万兴科技旗下国内首个音视频多媒体大模型万兴“天幕”正式公测,该大模型采用了先进的音视频生成式AI技术,具备近百项音视频原子能力,并已在海外规模化商用,其中文字生成视频能力实现不同风格、丰富场景及主题的连贯性,一键生成时长可超60秒。</p></section></article>