YouTube成立20周年之际探讨视频中人工智能的未来 - 彭博社

Mark Bergen

2025-04-18

插图：Adam Ferriss为彭博社创作

彭博社记者Mark Bergen在其著作 《点赞、评论、订阅》（维京出版社，2022年）中记录了YouTube成为现代传媒沉睡巨头的动荡历程。此后，人工智能的蓬勃发展为这家视频巨头带来了其20年发展历程中最大的挑战与机遇之一。在《下一章》栏目中，Bergen展望了AI时代YouTube的未来图景。

YouTube副总裁Amjad Hanif近期会见了埃及网红Farah Medhat，后者在海外拥有大量粉丝。Medhat在YouTube上的第二大受众群体位于韩国，当地粉丝通过字幕观看她的阿拉伯语视频。Hanif相信公司的人工智能技术很快能让Medhat在屏幕上说一口流利的韩语，助她触达更多观众。

他预计五年内，上传至YouTube的每个视频都能自动译制成所有口语版本。每个单词都将保留说话者的真实音色，嘴唇动作也会像母语者般自然重塑。这只是YouTube计划为创作者众多能力中的一项，据公司表述，旨在帮他们扩大受众群体。“您只需创作一次，我们负责让全世界都能轻松观看，“负责创作者产品的Hanif表示。他希望每位上传者都能使用YouTube母公司Alphabet Inc.旗下谷歌的AI工具来构思创意、生成素材、剪辑视频、进行营销，最重要的是——提供视频表现的细粒度数据，激励他们发布更多内容。

二十年前，YouTube首个视频上线——那是联合创始人贾韦德·卡里姆发布的一段19秒的搞笑内容。这个视频分享网站从最初与好莱坞和广播电视对抗、杂乱无章且亏损的运营状态，逐渐发展成为如今傲视群雄的全球巨头。在此过程中，它与数百万内容创作者建立了深厚联系，其中许多是专业创作者，他们依靠这个平台谋生或为之奋斗。

这种关系并不轻松：YouTube历来在制定政策、版权规则和商业策略时，即使是最知名的创作者也鲜有发言权。然而，YouTube现在表示，人工智能（AI）将让它的创作者大军在媒体世界中占据更大份额。这很公平，因为谷歌在开发自己的AI模型Gemini时，利用了无数小时的YouTube内容，而许多创作者并不知情。（YouTube发言人表示，公司使用视频内容“是为了改善YouTube和谷歌上创作者和观众的产品体验，包括通过机器学习和AI应用”，并且“符合创作者同意的条款”。）

成功故事

YouTube的规模比以往任何时候都大。尽管面临来自Spotify、TikTok和电视流媒体的日益激烈的竞争，但去年其广告销售额达到了361亿美元。研究公司MoffettNathanson估计，其订阅和其他收入来源还贡献了180亿美元，该公司预测，明年YouTube将超越华特迪士尼公司，成为美国收入最高的娱乐企业。“这是一个惊人的成功故事，”广告巨头WPP Plc的首席执行官马克·里德说道。

高管变动并未减缓平台的发展步伐。2023年初，苏珊·沃西基辞去首席执行官职务后，尼尔·莫汉接管了YouTube。（沃西基次年因肺癌去世）。作为2015年加入YouTube的谷歌广告业务资深人士，莫汉在延续沃西基对本土创作者公开重视的同时，推动YouTube进一步深入主流媒体渠道。他大力进军播客领域，接纳了YouTube形形色色的右翼视频博主；在2月的CEO公开信中，莫汉特别提到了乔·罗根对唐纳德·特朗普的竞选专访。今年早些时候，YouTube宣布其平台每月有10亿人收听播客，巩固了在该类别对Spotify的领先地位。

莫汉将扩大电视屏幕收视率作为另一重点，借助近期与NFL的合作，甚至吸引竞争对手的流媒体服务入驻YouTube应用。他还支持了艾美奖对超级YouTuber如Rhett and Link的提名。Rhett and Link所属Mythical Entertainment总裁布莱恩·弗拉纳根表示，YouTube与其"在收视率、变现、奖项、文化影响力等各方面被视同电视的雄心不谋而合”。

人工智能时代

2022年9月，我出版了著作《点赞、评论、订阅》。两个月后，ChatGPT横空出世，掀起的生成式AI浪潮对媒体行业的冲击力，堪称YouTube问世以来之最。新兴AI工具正让人们以空前速度和低成本生产内容，互联网充斥着以假乱真的模仿作品、深度伪造和明目张胆的剽窃。好莱坞并未热情拥抱生成式AI——像病毒式传播的伪造Drake单曲这类早期案例，其诡异能力被视为未来盗版泛滥的预兆。

面对搜索引擎业务遭遇的前所未有挑战，谷歌也完成了自我重塑。但在视频领域，这家公司拥有应对AI内容时代的充足筹码。谷歌推出的VeoAI视频工具，仅需在聊天框输入指令即可生成影像。尽管OpenAI等公司已推出类似产品，但YouTube庞大的分发网络意味着：即便创作者使用竞品AI工具，谷歌仍是赢家——想要视频被看见的人，终会将内容上传至YouTube。

随着AI生成内容的新浪潮涌现，YouTube与其他网络平台一样，在保持内容流量的同时努力应对版权问题。在这方面YouTube具有优势：近二十年来，其运行的Content ID系统——这套庞大的软件能检测视频中的版权素材，基本安抚了好莱坞和音乐产业。生成式AI兴起后，YouTube迅速采取行动，与环球音乐集团和创新艺人经纪公司签署协议，监控平台上未经授权的音乐人、运动员及演员AI替身。YouTube近期还将多位顶级网红纳入深度伪造防护计划。创新艺人经纪公司战略发展主管亚历山德拉·香农表示，各科技平台处理深度伪造的持续性参差不齐：“必须承认，YouTube正引领着这一领域。”

但YouTube在解决生成式AI另一关键争议——该行业通过未经许可抓取海量网络数据得以发展——时却显得不够果断。如今的聊天机器人能撰写像样的邮件和诗歌，前提是它们经过训练（通常通过采集大量网络文本输入语言模型的软件程序）。以网络爬虫搜索起家的谷歌，对这一做法再熟悉不过。

ChatGPT问世后不久，众多公司竞相开发能生成图像、语音和视频的人工智能。YouTube成为了训练数据的金矿。自2017年起，每分钟至少有400小时的视频被上传，构建了一个无与伦比的档案库。《连线》与《Proof News》 报道称，去年多家硅谷巨头使用了包含数千个不知情YouTube频道内容的训练数据库（报道中提及的公司之一Salesforce Inc.发言人表示该数据库"公开可用且遵循宽松许可协议”）。该领域的版权问题仍处于灰色地带，对许多YouTuber而言，企业似乎将YouTube视为免费开放的资源库。

这种模糊性在去年OpenAI发布AI视频生成模型Sora时公开化。时任OpenAI技术总监的Mira Murati在《华尔街日报》采访中被问及公司是否抓取YouTube训练Sora时面露难色：“我确实不确定”。

一个月后，Mohan接受彭博社Emily Chang采访时表示虽不了解OpenAI的具体操作，但强调YouTube禁止未经许可盗用视频：“这是基本规则”。当被问及谷歌自身AI模型Gemini是否遵守此规则时，Mohan回避了直接回答，仅表示公司使用YouTube内容"符合平台服务条款"。

这是个含糊其辞的回答。纽约时报去年报道称，OpenAI故意使用YouTube数据训练模型，部分谷歌员工知情却因公司同样行为而保持沉默。（YouTube发言人重申了莫汉关于未经授权抓取的声明。OpenAI向《纽约时报》表示其依赖"多种数据来源"；这家初创公司发言人拒绝进一步置评。）

即便是顶级YouTuber和商业伙伴也难以弄清数据抓取详情及YouTube的知情程度。“掩盖此事符合他们的利益，“资深经纪人、Night经纪公司总裁埃兹拉·库珀斯坦表示，“未来回顾时，这将被视为对所有内容的剥削。”

去年八月，资深YouTuber汉克·格林（深受平台青睐）就莫汉对张的回应发布长视频。根据YouTube服务条款，上传视频即授权平台使用内容"运营、推广和改进"服务——格林指出该条款现在已包含训练谷歌AI模型。他二十年前开始发布视频时，大语言模型根本不存在。“我当时根本不知道同意了这个，“视频中愤怒的格林说道。

多年来，YouTube一直采用双轨制运营模式。对于由唱片公司和传统媒体机构运营的频道（如泰勒·斯威夫特和吉米·法伦等名人），平台采用一套支付与合约管理方式；而对于构成平台主体的"独立"创作者（如格林），则适用另一套规则。当谷歌开始研发生成式AI模型时，决定不使用YouTube媒体合作伙伴的内容进行训练，但确实依据服务条款许可，使用了创作者的材料。

但公司从未明确说明这一点，也未透露OpenAI等机构的抓取程度。“以我的立场来看，这明显是在剥削我，“格林在视频中表示。

YouTube拒绝让莫汉接受采访。部分YouTube员工私下辩称，谷歌比OpenAI等机构更负责任，因为它并未抓取全部YouTube内容。去年12月，YouTube推出新功能，允许创作者向第三方表明开放数据抓取。（该公司尚未公布相关数据收集计划，但发言人表示该功能不会改变服务条款。）

一批新兴企业正试图利用这类数据交易，在谷歌体系外建立市场，让创作者可以向AI开发者出售闲置视频素材。前YouTube员工、现Vermillio公司首席战略官凯瑟琳·格蕾丝指出，这种模式旨在向内容生产者倾斜，为其开辟YouTube之外的收入渠道。她将这种模式与YouTube长期运行的版权系统对比：“这对所有人都公平吗？谁获得了万亿美元市值？是谷歌。”

YouTube高管哈尼夫证实，平台的数据训练选择加入条款不适用于谷歌自身模型。他向创作者解释，接受服务条款的交换条件——即同意上传至YouTube的内容可能用于训练Gemini模型——意味着能使用公司最新功能，如自动视频翻译、评论智能回复和观众数据分析AI工具。“我的解释是，他们期待的许多功能都依赖于Gemini。“哈尼夫表示。

创意民主化

YouTube正与数十万创作者测试AI配音技术，可将英语视频即时转换为八种其他语言（或反向转换）。公司数据显示，这些视频超40%的观看量来自配音语言观众。负责该功能的副总裁克里斯蒂安·厄斯特林称，2025年YouTube有"非常雄心勃勃的扩展计划”。目前正运行小规模试点，专注于配音声音克隆技术，并试验唇形同步重塑技术。未来该技术或应用于历史影像甚至已故名人视频片段。“这些都在考虑范围内。“厄斯特林表示。

如MrBeast等顶级YouTuber已自费采用外部配音技术或聘请多语种配音演员。YouTube计划免费提供这种"巴别塔"能力。人才经纪公司WME战略主管克里斯·杰奎明用YouTube的标志性词汇形容，这类生成式AI功能将"实现创意民主化”。

许多创作者愿意采用这类工具，如果它们能节省时间或金钱。但有些人并不情愿完全拥抱AI。萨姆·贝雷斯（Sam Beres）是一位在其频道上尝试AI产品的创作者，他担心配音会拖累收入，因为一些广告商更看重英语国家的高观看率。（YouTube发言人表示，将英语配音成其他语言的创作者可能会看到平均广告价格“略有下降，而将其他语言配音成英语的创作者则相反”，并补充说“在这两种情况下，触及新观众都会增加他们的观看量，因此在大多数情况下，他们的收入应该会增加。”）

一些YouTube频道拥有铁杆粉丝，他们认为AI是出卖或剥削创意工作者的标志。“如果一个元素是由AI生成的，他们会立即攻击你，”Mythical Entertainment的首席创意官史蒂维·温·莱文（Stevie Wynne Levine）说。“而且他们这样做是对的。”

其他人则没有那么有原则。YouTube已经看到了大量AI生成的内容。只需在网站上搜索电影预告片；很明显，分辨什么是真实的变得越来越困难。

“我们已经有了数十万，甚至数百万的无面孔AI频道，”歌手兼YouTuber彼得·霍伦斯（Peter Hollens）说，他预测AI频道的数量只会增加。但YouTube坚持认为，只有高质量的视频才能吸引观众。3月，Deadline 报道称，YouTube切断了两个使用AI制作虚假电影预告片的频道的广告。这些账户无法在平台上赚钱，但它们可以继续发布内容。