前OpenAI研究员筹集4000万美元打造更具同理心的音频人工智能 | 路透社

Anna Tong

2024-12-10

文字显示“人工智能 AI”，机器人和玩具手的微型图像出现在2023年12月14日拍摄的这幅插图中。路透社/Dado Ruvic/插图/档案照片旧金山，12月9日（路透社）- 一位前OpenAI研究员为一家初创公司筹集了4000万美元，该公司将构建能够通过声音与人类情感连接的人工智能模型，该公司周一表示。

这家初创公司WaveForms AI得到了Andreessen Horowitz的支持，估值为2亿美元，首席执行官Alexis Conneau告诉路透社。

Conneau共同创建了OpenAI的GPT-4o模型中的语音模式功能，该功能在发布于今年早些时候时展示了实时响应的能力，没有延迟，并且能够处理打断——这两者都是现实对话的标志，而这些特性迄今为止一直困扰着人工智能语音助手。在发布后，OpenAI首席执行官Sam Altman在社交媒体平台X上发布了“她”这个词，这似乎是对斯派克·琼斯2013年同名电影的引用，讲述了一名男子爱上了他的人工智能助手，后者由斯嘉丽·约翰逊配音。

OpenAI推出GPT-4o时引发争议，因为约翰逊指控这家初创公司在电影中复制了她的声音。OpenAI表示，该声音并不是对约翰逊的模仿，公司使用了不同的配音演员。Conneau与WaveForms AI联合创始人Coralie Lemaitre表示，该初创公司将利用这笔资金训练新的音频AI模型，以解决与AI机器人进行语音对话时让人感觉与人类无异的问题。他补充说，音频是让AI互动感觉“深具人性”的关键。

“音频……传达情感并向用户提供情感反馈，”他说。

Conneau表示，公司计划开发一款消费者软件产品，专注于用户与AI之间的情感连接，但拒绝提供更多细节。

“我们的想法是创造新的、更具沉浸感的AI体验，让人感觉更愉悦，”他告诉路透社。“现在有很多公司专注于超级智能，但对人机交互的质量关注不多。”

路透社每日简报通讯提供您开始一天所需的所有新闻。请在这里注册。

建议主题：
被打断
被打断