YouTube成立20周年之际探讨视频中人工智能的未来 - 彭博社
Mark Bergen
插图:Adam Ferriss为彭博社创作
彭博社记者Mark Bergen在其著作 《点赞、评论、订阅》 (维京出版社,2022年)中记录了YouTube成为现代传媒沉睡巨头的动荡历程。此后,人工智能的蓬勃发展为这家视频巨头带来了其20年发展历程中最大的挑战与机遇之一。在《下一章》栏目中,Bergen展望了AI时代YouTube的未来图景。
YouTube副总裁Amjad Hanif近期会见了埃及网红Farah Medhat,后者在海外拥有大量粉丝。Medhat在YouTube上的第二大受众群体位于韩国,当地粉丝通过字幕观看她的阿拉伯语视频。Hanif相信公司的人工智能技术很快能让Medhat在屏幕上说一口流利的韩语,助她触达更多观众。
他预计五年内,上传至YouTube的每个视频都能自动译制成所有口语版本。每个单词都将保留说话者的真实音色,嘴唇动作也会像母语者般自然重塑。这只是YouTube计划为创作者众多能力中的一项,据公司表述,旨在帮他们扩大受众群体。“您只需创作一次,我们负责让全世界都能轻松观看,“负责创作者产品的Hanif表示。他希望每位上传者都能使用YouTube母公司Alphabet Inc.旗下谷歌的AI工具来构思创意、生成素材、剪辑视频、进行营销,最重要的是——提供视频表现的细粒度数据,激励他们发布更多内容。
二十年前,YouTube首个视频上线——那是联合创始人贾韦德·卡里姆发布的一段19秒的搞笑内容。这个视频分享网站从最初与好莱坞和广播电视对抗、杂乱无章且亏损的运营状态,逐渐发展成为如今傲视群雄的全球巨头。在此过程中,它与数百万内容创作者建立了深厚联系,其中许多是专业创作者,他们依靠这个平台谋生或为之奋斗。
这种关系并不轻松:YouTube历来在制定政策、版权规则和商业策略时,即使是最知名的创作者也鲜有发言权。然而,YouTube现在表示,人工智能(AI)将让它的创作者大军在媒体世界中占据更大份额。这很公平,因为谷歌在开发自己的AI模型Gemini时,利用了无数小时的YouTube内容,而许多创作者并不知情。(YouTube发言人表示,公司使用视频内容“是为了改善YouTube和谷歌上创作者和观众的产品体验,包括通过机器学习和AI应用”,并且“符合创作者同意的条款”。)
成功故事
YouTube的规模比以往任何时候都大。尽管面临来自Spotify、TikTok和电视流媒体的日益激烈的竞争,但去年其广告销售额达到了361亿美元。研究公司MoffettNathanson估计,其订阅和其他收入来源还贡献了180亿美元,该公司预测,明年YouTube将超越华特迪士尼公司,成为美国收入最高的娱乐企业。“这是一个惊人的成功故事,”广告巨头WPP Plc的首席执行官马克·里德说道。
高管变动并未减缓平台的发展步伐。2023年初,苏珊·沃西基辞去首席执行官职务后,尼尔·莫汉接管了YouTube。(沃西基次年因肺癌去世)。作为2015年加入YouTube的谷歌广告业务资深人士,莫汉在延续沃西基对本土创作者公开重视的同时,推动YouTube进一步深入主流媒体渠道。他大力进军播客领域,接纳了YouTube形形色色的右翼视频博主;在2月的CEO公开信中,莫汉特别提到了乔·罗根对唐纳德·特朗普的竞选专访。今年早些时候,YouTube宣布其平台每月有10亿人收听播客,巩固了在该类别对Spotify的领先地位。
莫汉将扩大电视屏幕收视率作为另一重点,借助近期与NFL的合作,甚至吸引竞争对手的流媒体服务入驻YouTube应用。他还支持了艾美奖对超级YouTuber如Rhett and Link的提名。Rhett and Link所属Mythical Entertainment总裁布莱恩·弗拉纳根表示,YouTube与其"在收视率、变现、奖项、文化影响力等各方面被视同电视的雄心不谋而合”。
人工智能时代
2022年9月,我出版了著作《点赞、评论、订阅》。两个月后,ChatGPT横空出世,掀起的生成式AI浪潮对媒体行业的冲击力,堪称YouTube问世以来之最。新兴AI工具正让人们以空前速度和低成本生产内容,互联网充斥着以假乱真的模仿作品、深度伪造和明目张胆的剽窃。好莱坞并未热情拥抱生成式AI——像病毒式传播的伪造Drake单曲这类早期案例,其诡异能力被视为未来盗版泛滥的预兆。
面对搜索引擎业务遭遇的前所未有挑战,谷歌也完成了自我重塑。但在视频领域,这家公司拥有应对AI内容时代的充足筹码。谷歌推出的VeoAI视频工具,仅需在聊天框输入指令即可生成影像。尽管OpenAI等公司已推出类似产品,但YouTube庞大的分发网络意味着:即便创作者使用竞品AI工具,谷歌仍是赢家——想要视频被看见的人,终会将内容上传至YouTube。
随着AI生成内容的新浪潮涌现,YouTube与其他网络平台一样,在保持内容流量的同时努力应对版权问题。在这方面YouTube具有优势:近二十年来,其运行的Content ID系统——这套庞大的软件能检测视频中的版权素材,基本安抚了好莱坞和音乐产业。生成式AI兴起后,YouTube迅速采取行动,与环球音乐集团和创新艺人经纪公司签署协议,监控平台上未经授权的音乐人、运动员及演员AI替身。YouTube近期还将多位顶级网红纳入深度伪造防护计划。创新艺人经纪公司战略发展主管亚历山德拉·香农表示,各科技平台处理深度伪造的持续性参差不齐:“必须承认,YouTube正引领着这一领域。”
但YouTube在解决生成式AI另一关键争议——该行业通过未经许可抓取海量网络数据得以发展——时却显得不够果断。如今的聊天机器人能撰写像样的邮件和诗歌,前提是它们经过训练(通常通过采集大量网络文本输入语言模型的软件程序)。以网络爬虫搜索起家的谷歌,对这一做法再熟悉不过。
ChatGPT问世后不久,众多公司竞相开发能生成图像、语音和视频的人工智能。YouTube成为了训练数据的金矿。自2017年起,每分钟至少有400小时的视频被上传,构建了一个无与伦比的档案库。《连线》与《Proof News》 报道称,去年多家硅谷巨头使用了包含数千个不知情YouTube频道内容的训练数据库(报道中提及的公司之一Salesforce Inc.发言人表示该数据库"公开可用且遵循宽松许可协议”)。该领域的版权问题仍处于灰色地带,对许多YouTuber而言,企业似乎将YouTube视为免费开放的资源库。
这种模糊性在去年OpenAI发布AI视频生成模型Sora时公开化。时任OpenAI技术总监的Mira Murati在《华尔街日报》采访中被问及公司是否抓取YouTube训练Sora时面露难色:“我确实不确定”。
一个月后,Mohan接受彭博社Emily Chang采访时表示虽不了解OpenAI的具体操作,但强调YouTube禁止未经许可盗用视频:“这是基本规则”。当被问及谷歌自身AI模型Gemini是否遵守此规则时,Mohan回避了直接回答,仅表示公司使用YouTube内容"符合平台服务条款"。
这是个含糊其辞的回答。纽约时报去年报道称,OpenAI故意使用YouTube数据训练模型,部分谷歌员工知情却因公司同样行为而保持沉默。(YouTube发言人重申了莫汉关于未经授权抓取的声明。OpenAI向《纽约时报》表示其依赖"多种数据来源";这家初创公司发言人拒绝进一步置评。)
即便是顶级YouTuber和商业伙伴也难以弄清数据抓取详情及YouTube的知情程度。“掩盖此事符合他们的利益,“资深经纪人、Night经纪公司总裁埃兹拉·库珀斯坦表示,“未来回顾时,这将被视为对所有内容的剥削。”
去年八月,资深YouTuber汉克·格林(深受平台青睐)就莫汉对张的回应发布长视频。根据YouTube服务条款,上传视频即授权平台使用内容"运营、推广和改进"服务——格林指出该条款现在已包含训练谷歌AI模型。他二十年前开始发布视频时,大语言模型根本不存在。“我当时根本不知道同意了这个,“视频中愤怒的格林说道。
多年来,YouTube一直采用双轨制运营模式。对于由唱片公司和传统媒体机构运营的频道(如泰勒·斯威夫特和吉米·法伦等名人),平台采用一套支付与合约管理方式;而对于构成平台主体的"独立"创作者(如格林),则适用另一套规则。当谷歌开始研发生成式AI模型时,决定不使用YouTube媒体合作伙伴的内容进行训练,但确实依据服务条款许可,使用了创作者的材料。
但公司从未明确说明这一点,也未透露OpenAI等机构的抓取程度。“以我的立场来看,这明显是在剥削我,“格林在视频中表示。
YouTube拒绝让莫汉接受采访。部分YouTube员工私下辩称,谷歌比OpenAI等机构更负责任,因为它并未抓取全部YouTube内容。去年12月,YouTube推出新功能,允许创作者向第三方表明开放数据抓取。(该公司尚未公布相关数据收集计划,但发言人表示该功能不会改变服务条款。)
一批新兴企业正试图利用这类数据交易,在谷歌体系外建立市场,让创作者可以向AI开发者出售闲置视频素材。前YouTube员工、现Vermillio公司首席战略官凯瑟琳·格蕾丝指出,这种模式旨在向内容生产者倾斜,为其开辟YouTube之外的收入渠道。她将这种模式与YouTube长期运行的版权系统对比:“这对所有人都公平吗?谁获得了万亿美元市值?是谷歌。”
YouTube高管哈尼夫证实,平台的数据训练选择加入条款不适用于谷歌自身模型。他向创作者解释,接受服务条款的交换条件——即同意上传至YouTube的内容可能用于训练Gemini模型——意味着能使用公司最新功能,如自动视频翻译、评论智能回复和观众数据分析AI工具。“我的解释是,他们期待的许多功能都依赖于Gemini。“哈尼夫表示。
创意民主化
YouTube正与数十万创作者测试AI配音技术,可将英语视频即时转换为八种其他语言(或反向转换)。公司数据显示,这些视频超40%的观看量来自配音语言观众。负责该功能的副总裁克里斯蒂安·厄斯特林称,2025年YouTube有"非常雄心勃勃的扩展计划”。目前正运行小规模试点,专注于配音声音克隆技术,并试验唇形同步重塑技术。未来该技术或应用于历史影像甚至已故名人视频片段。“这些都在考虑范围内。“厄斯特林表示。
如MrBeast等顶级YouTuber已自费采用外部配音技术或聘请多语种配音演员。YouTube计划免费提供这种"巴别塔"能力。人才经纪公司WME战略主管克里斯·杰奎明用YouTube的标志性词汇形容,这类生成式AI功能将"实现创意民主化”。
许多创作者愿意采用这类工具,如果它们能节省时间或金钱。但有些人并不情愿完全拥抱AI。萨姆·贝雷斯(Sam Beres)是一位在其频道上尝试AI产品的创作者,他担心配音会拖累收入,因为一些广告商更看重英语国家的高观看率。(YouTube发言人表示,将英语配音成其他语言的创作者可能会看到平均广告价格“略有下降,而将其他语言配音成英语的创作者则相反”,并补充说“在这两种情况下,触及新观众都会增加他们的观看量,因此在大多数情况下,他们的收入应该会增加。”)
一些YouTube频道拥有铁杆粉丝,他们认为AI是出卖或剥削创意工作者的标志。“如果一个元素是由AI生成的,他们会立即攻击你,”Mythical Entertainment的首席创意官史蒂维·温·莱文(Stevie Wynne Levine)说。“而且他们这样做是对的。”
其他人则没有那么有原则。YouTube已经看到了大量AI生成的内容。只需在网站上搜索电影预告片;很明显,分辨什么是真实的变得越来越困难。
“我们已经有了数十万,甚至数百万的无面孔AI频道,”歌手兼YouTuber彼得·霍伦斯(Peter Hollens)说,他预测AI频道的数量只会增加。但YouTube坚持认为,只有高质量的视频才能吸引观众。3月,Deadline 报道称,YouTube切断了两个使用AI制作虚假电影预告片的频道的广告。这些账户无法在平台上赚钱,但它们可以继续发布内容。