前OpenAI研究员筹集4000万美元打造更具同理心的音频人工智能 | 路透社
Anna Tong
文字显示“人工智能 AI”,机器人和玩具手的微型图像出现在2023年12月14日拍摄的这幅插图中。路透社/Dado Ruvic/插图/档案照片旧金山,12月9日(路透社)- 一位前OpenAI研究员为一家初创公司筹集了4000万美元,该公司将构建能够通过声音与人类情感连接的人工智能模型,该公司周一表示。
这家初创公司WaveForms AI得到了Andreessen Horowitz的支持,估值为2亿美元,首席执行官Alexis Conneau告诉路透社。
Conneau共同创建了OpenAI的GPT-4o模型中的语音模式功能,该功能在发布于今年早些时候时展示了实时响应的能力,没有延迟,并且能够处理打断——这两者都是现实对话的标志,而这些特性迄今为止一直困扰着人工智能语音助手。在发布后,OpenAI首席执行官Sam Altman在社交媒体平台X上发布了“她”这个词,这似乎是对斯派克·琼斯2013年同名电影的引用,讲述了一名男子爱上了他的人工智能助手,后者由斯嘉丽·约翰逊配音。
OpenAI推出GPT-4o时引发争议,因为约翰逊指控这家初创公司在电影中复制了她的声音。OpenAI表示,该声音并不是对约翰逊的模仿,公司使用了不同的配音演员。Conneau与WaveForms AI联合创始人Coralie Lemaitre表示,该初创公司将利用这笔资金训练新的音频AI模型,以解决与AI机器人进行语音对话时让人感觉与人类无异的问题。他补充说,音频是让AI互动感觉“深具人性”的关键。
“音频……传达情感并向用户提供情感反馈,”他说。
Conneau表示,公司计划开发一款消费者软件产品,专注于用户与AI之间的情感连接,但拒绝提供更多细节。
“我们的想法是创造新的、更具沉浸感的AI体验,让人感觉更愉悦,”他告诉路透社。“现在有很多公司专注于超级智能,但对人机交互的质量关注不多。”
路透社每日简报通讯提供您开始一天所需的所有新闻。请在 这里 注册。
- 建议主题:
- 被打断
- 被打断