TTS技术成熟 喜马拉雅加速布局音频领域
11月19日消息,今年以来,众多主流媒体加速入驻喜马拉雅,借助喜马拉雅TTS ( Text-to-speech)技术加速制作新闻类音频节目,让听众有了更多的渠道听到更权威的新闻。
TTS技术又称语音合成技术,是将输入的文本转换为语音的技术统称。喜马拉雅音频算法团队自研的TTS框架已处于行业领先水平,目前已经广泛被运用于新闻等多种内容的制作中。
据悉,目前已有超过20家主流媒体和优质自媒体接入喜马拉雅TTS进行日常音频内容生产,共上线超过40张专辑,日均生产约500条声音,覆盖新闻短资讯及长资讯。
喜马拉雅方面表示,TTS技术将助力喜马拉雅在现有的“UGC + PGC + PUGC”内容生态之外,进一步拓展AIGC的可能性。未来,喜马拉雅将通过TTS技术平均每日为媒体生产1万至2万条新闻声音内容。对于用户来说,TTS技术的应用,会给他们带来更丰富的好内容。而对于媒体来说,在无需投入更多人力的情况下,TTS技术将为他们打开新媒体转型的新渠道,让好的内容触达更多的用户。
目前,喜马拉雅新闻TTS支持多种标准普通话男声和女声的音色选择,也支持多种生产方式,包括同步、异步、流式,每分钟内能转化约3000字左右。
喜马拉雅智能语音实验室的卢恒博士表示,喜马拉雅在小说TTS音色演绎方面已经积累了丰富的经验。他说,用TTS音色演绎小说是非常难的,需要学习小说中的抑扬顿挫、情感表达、上下文关系,区分旁白和对白,并最终将作品完美演绎出来,这正是喜马拉雅的优势。而这些经验可以运用到新闻TTS中来,让新闻类的TTS内容更加准确、生动。
据透露,喜马拉雅仍在持续推进不同音色的签约和制作,以及多情感、多风格的TTS技术研发与升级,进一步提升内容生产的质量和效率。未来喜马拉雅将会推出更加全面的新闻音色矩阵和更加自然逼真的新闻播报风格。