他已去世近十年,如今却在为你的有声书配音 - 《华尔街日报》
Jeffrey A. Trachtenberg
爱德华·赫尔曼,这位曾为数十本有声读物配音的多产演员已去世近十年。但这并未阻碍他成为近期多部有声读物的声音来源。
赫尔曼先生的最新作品由伦敦人工智能初创公司DeepZen Ltd.生成。该公司在获得演员家属授权后,使用其历史录音资料库。DeepZen表示,通过这些素材能还原赫尔曼本人在演绎新书时可能使用的所有语音语调。
“我们认为这是延续他艺术生命的绝佳方式,“洛杉矶餐饮业者、赫尔曼之子罗里·赫尔曼表示。他初次听到采用父亲合成声音的有声书时感到震惊:“那真是个令人惊叹的时刻。”
生成式AI技术——这种能创造文本、图像和音频等内容的人工智能,自去年底OpenAI推出ChatGPT后成为热词。这款聊天机器人能对几乎所有问题对答如流(尽管有时会犯严重错误),迅速引发全球轰动,令人猜测AI可能彻底重塑诸多行业。
AI进军有声书领域已非理论设想。在谷歌Play图书和苹果Books等主流平台,已有数千本AI旁白的有声书上线。虽然美国最大有声书服务商Audible母公司亚马逊暂未提供此类产品,但表示正在评估相关策略。
这项技术尚未被美国大型图书出版商广泛采用,它们主要将其用于营销活动和部分外语书籍。但对于小型出版商和不知名作者来说,这是一大福音,因为他们的书籍可能没有足够的销售潜力来证明录制有声书(传统成本至少5000美元)的合理性。
苹果和谷歌表示,它们允许用户使用数字复制的人类声音免费创建有声书。苹果和谷歌生成的有声书中的声音来自真实的人,这些人的声音帮助训练了它们的自动叙述引擎。
密歇根大学出版社主任查尔斯·沃特金森表示,自去年年初以来,该出版社已使用谷歌的免费自动叙述有声书平台制作了约100本有声书。这项新技术使这些书籍成为可能,因为它消除了与使用制作工作室、支持人员和人类叙述者相关的成本。
“据我所见,人类叙述者感到非常不安,”德克萨斯州奥斯汀的有声书制作公司Speechki的首席执行官迪马·阿布拉莫夫说,该公司使用合成叙述声音。
斯科特·布里克曾为汤姆·克兰西和尼尔森·德米勒等作者的1000多本有声书担任叙述者,他表示,AI自动叙述最适合非小说类书籍,因为叙述者和读者在情感上不像小说作品那样投入。
“那里有现实主义,但没有灵魂,”布里克先生说。
DeepZen的首席执行官兼联合创始人泰兰·卡米斯表示,该公司已与30多名专业演员合作,帮助其AI引擎捕捉人类情感的所有范围。
你能分辨人类与AI的区别吗?
出生于巴黎、现居洛杉矶家庭录音室工作的女演员梅丽莎·帕佩尔表示,她为DeepZen录制了八小时的法语书籍内容。“有时需要我用愤怒的语气朗读,有时是厌恶的、幽默的或戏剧化的,“她说道。
帕佩尔女士指出,专业配音演员仍有大量工作机会,因为AI自动配音的新时代才刚刚开始,但她认为未来可能并非如此。
“我原以为他们只是用我的声音教软件更人性化地说话,“帕佩尔说,“没想到他们能让我的声音说出我从未说过的话。这太不可思议了。”
DeepZen向配音演员支付固定费用,并根据项目收入支付版税。公司高管卡米斯表示,这些协议期限长达数年。
代表专业有声书朗读者等表演者的美国演员工会-广播电视艺术家联合会总法律顾问杰弗里·贝内特预测,AI终将颠覆这个行业。“我们现在所见所闻的技术会越来越先进,“他说,并补充工会正致力于保护声音和肖像权,“我们相信专业配音人才能够应对这些变革。”
西米·林顿对她2005年出版的残疾女性回忆录《我的政治身体》被密歇根大学出版社选用合成声音"玛丽"来叙述表示不满。
“我同意制作这个合成作品的原因是为了让盲人读者和其他有障碍的人更容易接触到我的书,”她在谈到2020年推出的有声书时说道。
在美国人恢复疫情前活动后,出版业一直举步维艰,而有声书仍是其中的亮点。根据美国出版商协会的数据,去年有声书销售额增长了7%,而图书追踪机构Circana BookScan的数据显示,纸质书销售额下降了5.8%。
巴诺书店首席执行官詹姆斯·道特(该公司已经开始销售AI生成的有声书)表示,只要明确标注,这类有声书是受欢迎的。
据Audible的一位女发言人表示,该公司正在评估由人工智能朗读有声书的方法。“专业朗读一直是并将继续是Audible聆听体验的核心,”她说,但“我们看到了人类表演和文本转语音生成内容可以共存的未来。”
美国最大的出版商们持观望态度。拉加代尔集团旗下阿歇特图书集团的有声书部门阿歇特音频的出版商安娜·玛丽亚·阿莱西表示,该出版商尚未测试用AI技术制作的有声书。她说,只要明确标注,她对计算机生成的录音持开放态度。
与《华尔街日报》同属新闻集团旗下的哈珀柯林斯出版公司,正在有限范围内使用AI。该出版商正在国外市场测试一些AI生成的有声书朗读,以评估质量和消费者反应。哈珀柯林斯使用谷歌制作了这些有声书。
哈珀柯林斯在美国并不销售此类有声书,但该公司最近开始在新书出版前向零售商和评论家发送由DeepZen生成的音频文件。该出版商的数字总监尚塔尔·雷斯提沃-阿莱西表示,公司认为这些音频文件比印刷预印本更环保。这些音频文件并不对外销售。
DeepZen表示,已与35家国内外出版商签订协议,并正与25位作者合作。
DeepZen创建的人工智能引擎使用机器学习软件,能够复制一个人的说话方式及其声音特征。该公司创始人卡米斯表示,该技术可以添加情感,并专注于难发音的词汇,比如科幻小说中的人物名字或中国最小的城镇名称。
“这比使用真人叙述者更容易,”他说。
科罗拉多州柯林斯堡的精神科医生约西亚·齐格勒去年创立了Intellectual Classics,专注于那些已无版权且没有有声书版本的非虚构作品。
他选择赫尔曼先生作为《与墨西哥的战争》的叙述者,这是贾斯汀·H·史密斯的一部作品,曾获得1920年普利策历史奖。齐格勒博士预计今年晚些时候将出版该作品的有声书版本。
“我熟悉他的声音,”齐格勒博士说。“他非常出色,所以我想试试看。”
DeepZen已制作了近一百本以赫尔曼先生声音为特色的有声书,目前正在争取其他已故知名明星的声音版权。
“我们希望扩大我们的声音库,但其他细节不便透露,”卡米斯先生说。
写信给杰弗里·A·特拉亨伯格,邮箱:[email protected]
刊登于2023年4月7日印刷版,标题为《技术为有声书复活历史声音》。