YouTube与AI:平台欲借创作者数据确保成功——彭博社
Mark Bergen
插图:Adam Ferriss 为彭博社创作
彭博社记者马克·伯根在其著作《YouTube:全球超级力量》(Droemer Knaur出版社,2022年)中记录了YouTube从动荡发展到成为现代媒体沉睡巨头的历程。自那时起,人工智能热潮为这家视频巨头带来了其20年历史中最大的挑战与机遇之一。本文中,伯根展望了AI时代下YouTube的未来。
YouTube副总裁阿姆贾德·哈尼夫近期会见了在海外拥有大量粉丝的埃及网红法拉·梅达特:梅达特在YouTube上的第二大观众群体来自韩国,当地粉丝通过带字幕的阿拉伯语视频观看她的内容。哈尼夫认为,公司的AI模型很快就能让屏幕中的梅达特说一口流利韩语,从而吸引更多观众。
他预估五年内,YouTube上每个上传视频都能自动同步所有口语语种。每个单词都将以说话者的真实声线呈现,其唇部动画效果将如同母语者般自然。
据官方透露,这只是YouTube计划为内容创作者提供的众多功能之一,旨在帮助他们拓展受众群体。
“只需一次投入,我们就能轻松触达所有人。”负责创作者产品的哈尼夫说道。他期望每位在YouTube上传内容的人都能利用YouTube母公司谷歌(或其控股公司Alphabet)的AI工具来生成创意、制作素材、剪辑视频、进行营销,以及——或许最为关键——获取详细的视频表现数据。这一切旨在激励用户发布更多内容。
20年前,YouTube首个视频上线——一段由德美联合创始人贾韦德·卡里姆拍摄的19秒搞笑片段。自此,这个视频分享网站从与好莱坞及电视行业交战、杂乱无章且亏损的企业,成长为全球巨头。在此过程中,YouTube与数百万内容创作者建立了紧密联系,其中许多人依靠平台谋生或至少以此为志向。
这段关系充满张力:YouTube过去制定政策、版权规则和商业策略时,甚至未曾咨询其最耀眼的明星创作者。但如今YouTube表示,AI将让无数创作者对媒体世界产生更大影响力。这倒也公平,毕竟谷歌开发自有AI模型Gemini时,基于无数小时的YouTube内容训练,而多数创作者对此毫不知情。(YouTube发言人声明,公司使用视频内容“通过机器学习和AI应用等方式,提升YouTube和谷歌上创作者与观众的体验”,且“遵循创作者同意的条款”。)
成功故事
YouTube比以往任何时候都更强大:虽然面临来自Spotify、TikTok和电视流媒体服务日益激烈的竞争,但去年仍实现了361亿美元的广告收入。根据MoffettNathanson分析师估计,订阅和其他来源还带来了180亿美元的收入。他们预测,YouTube明年将超越华特迪士尼,成为美国收入最高的娱乐公司。广告控股公司WPP的首席执行官马克·里德表示:“这是一个令人难以置信的成功故事。”
领导层的变动并未阻碍平台发展。2023年初,Neal Mohan接替辞去CEO职务的Susan Wojcicki,开始领导YouTube。(Wojcicki次年因肺癌去世。)Mohan是谷歌广告业务的资深人士,2015年加入YouTube,他延续了Wojcicki对YouTube创作者的公开关注,同时带领平台更深入地进军大型媒体渠道。他大力推动了播客领域的发展,并热情接纳了YouTube上形形色色的右翼视频博主。在2月份的CEO公开信中,Mohan赞扬了Joe Rogan在特朗普竞选期间对他的采访。2月,YouTube宣布,每月有10亿人在平台上观看播客,这使该公司在这一类别中扩大了与Spotify的领先优势。
莫汉通过与美国国家橄榄球联盟(NFL)签署协议,甚至为YouTube应用争取到竞争性流媒体服务,将电视屏幕前的更大观众群列为另一优先事项。此外,他还支持了如瑞特与林克等超级YouTuber的艾美奖竞选活动。神话娱乐(瑞特与林克所属工作室)总裁布莱恩·弗拉纳根表示,YouTube怀抱着"在收视率、货币化、奖项和文化影响力等所有方面都被视为电视的雄心"。
AI时代
2022年9月,我出版了著作*《YouTube:全球超级力量》*。两个月后,ChatGPT问世,引发了生成式AI的爆发,这可能会像YouTube诞生以来那样彻底改变媒体世界。
借助新的AI工具,人们已经能够比以往更快、更经济地制作内容,导致互联网充斥着令人信服的模仿品、深度伪造和明显的剽窃作品。好莱坞对生成式AI并不十分热情。很快,就出现了令人不安的实例展示当前技术能力——比如病毒式传播的逼真伪造德雷克歌曲,这些被视为盗版泛滥的前兆。
谷歌也进行了自我革新,以应对其搜索引擎迄今面临的最大挑战。然而,这家公司为AI视频时代做好了充分准备:谷歌发布了名为Veo的自研视频AI,只需向聊天机器人输入指令即可生成影片素材。此举效仿了OpenAI等公司的类似产品——但凭借YouTube庞大的分发网络,即使创作者使用竞品AI工具,谷歌仍能获益。想要视频获得曝光的人,依然会选择在YouTube发布内容。
面对AI生成内容的新浪潮,YouTube与其他网络平台一样,试图在保持收入流的同时解决版权问题。YouTube在此具有优势:近二十年来,该公司运营着*Content ID——*一个能识别视频中受版权保护素材的庞大软件系统,该系统已基本平息了好莱坞和音乐产业的不满。生成式AI突破后,YouTube通过安抚合作伙伴,与环球音乐和创新艺人经纪公司达成协议,对平台上未经授权的音乐人、运动员及演员AI虚拟形象进行审查。YouTube近期还邀请顶级网红参与深度伪造防护计划。创新艺人经纪公司战略发展主管亚历山德拉·香农表示,科技平台处理深度伪造的力度参差不齐。“YouTube是行业标杆。我只能说这么多”,她补充道。
然而,对于生成式人工智能的另一项核心批评——该行业通过擅自抓取互联网海量内容而发展壮大——谷歌并未展现出同等坚决的回应。当今的聊天机器人唯有经过训练才能撰写得体的邮件和诗歌,而这种训练通常依赖于收集海量网络文本并输入语言模型的软件程序。以爬取互联网起家的谷歌,对这种操作再熟悉不过。
ChatGPT面世不久后,众多企业竞相投入生成图像、语音和视频的AI研发。YouTube成为训练数据的金矿:自2017年起每分钟至少有400小时视频内容被上传,形成了独一无二的资料库。《连线》与Proof News 报道称,多家硅谷巨头使用了包含数千个不知情频道内容的训练数据库。(报道提及的公司之一发言人表示,该数据库属公开资源且遵循宽松许可协议。)该领域的版权问题仍是灰色地带——对许多YouTuber而言,科技公司似乎已将YouTube视为其本质上的免费开放平台。
这种模糊性在去年OpenAI发布其AI生成视频模型Sora时公之于众。当时OpenAI的首席技术官Mira Murati去年三月接受《华尔街日报》采访时被问及公司是否为了Sora而爬取YouTube内容。她面露难色地回答:“实际上我也不确定。”
一个月后,YouTube首席执行官Mohan向彭博社的Emily Chang表示,虽然假装不了解OpenAI的具体操作,但强调YouTube不允许企业在未经同意的情况下使用视频。“这是基本规则,“他说。当被问及谷歌自己的AI模型Gemini是否遵守这些规则时,Mohan予以否认,称其公司使用YouTube素材"符合平台服务条款”。
这是个狡猾的回应。《纽约时报》曾报道OpenAI故意使用YouTube数据进行训练,且部分谷歌员工知情却保持沉默——因为谷歌也在做同样的事。(YouTube发言人引述了Mohan此前关于未经授权数据抓取的声明,OpenAI则向《纽约时报》表示其依赖"多种数据来源”,该初创公司发言人拒绝进一步置评。)
即使是顶级YouTuber和商业伙伴也难以获取关于谁抓取了什么内容以及YouTube知晓哪些情况的明确信息。“他们有意掩盖此事,“资深YouTuber经理兼Night人才机构总裁Ezra Cooperstein表示,“日后回顾时,我们会将这种行为视为对所有内容的剥削。”
2024年8月,资深YouTuber兼平台宠儿Hank Green发布长视频回应Mohan对Chang的答复。根据YouTube服务条款,上传视频即授予平台"为运营、推广和改进服务"使用该素材的许可——Green指出,该条款现在已涵盖谷歌AI模型的训练。当他开始向YouTube投稿时(以及此后二十年间大部分时间),大型语言模型尚未出现。“我从未同意过这种用途,“Green在视频中愤慨表示。
多年来YouTube一直采用双轨制系统。唱片公司和传统媒体机构旗下频道(如Taylor Swift和Jimmy Fallon等明星)的付款与合同采用特定方式管理,而占据平台主流的"独立"创作者(如Green)则适用另一套规则。当谷歌开始开发生成式AI模型时,决定不使用YouTube媒体合作伙伴的内容进行训练,而是依据服务条款采用创作者素材。
然而,该公司从未对此作出澄清。OpenAI或其他公司进行数据抓取的范围也未被公开。“在我看来,我显然是被欺骗了,”格林在他的视频中说道。
YouTube拒绝安排与莫汉的采访。一些YouTube员工私下辩称,谷歌比OpenAI和其他公司表现得更有责任感,因为它没有收集YouTube上的所有数据。去年12月,YouTube推出了一项功能,允许创作者告知第三方他们是否同意抓取其数据。(该公司尚未公布其数据收集计划,但一位发言人表示,该功能不会改变使用条款。)
新一代公司正试图从这些数据交易中获利,并在谷歌之外建立市场,让创作者可以向AI开发者出售旧有或未使用的素材。前YouTube员工、现为数据经纪公司Vermillio首席战略官的凯瑟琳·格蕾丝表示,这种模式旨在将重心转向内容生产者,为他们提供YouTube之外的收入来源。她将这种方法与YouTube长期以来的版权系统进行了对比。“这对所有人都有好处吗?”格蕾丝问道,“谁获得了这数万亿美元的市场价值?谷歌。”
YouTube经理哈尼夫证实,YouTube的训练数据选择加入功能不适用于谷歌自己的模型。他向创作者解释说,通过接受使用条款(即同意他们在YouTube上发布的内容可用于训练Gemini),他们将获得公司最新的AI功能,如自动视频翻译、评论建议回复和观众数据的AI分析。“我是这样解释的:许多让他们兴奋的功能都基于Gemini,”哈尼夫说。
创意民主化
YouTube目前正与数十万创作者测试一项AI配音技术项目,可将英语视频即时翻译为八种其他语言(或反向操作)。该公司数据显示,这些视频超40%的播放时长来自观看配音版本的观众。负责该功能的副总裁Christian Oestlien表示,YouTube制定了"真正雄心勃勃的目标"计划在2025年扩大此服务。当前正在运行一个专注于克隆配音声线的小型试点项目,并试验唇形同步动画技术。未来YouTube可能将该技术应用于存档视频甚至已故名人片段。“这些都有可能实现”,Oestlien说道。
部分YouTube顶流如MrBeast已投资外部配音技术或雇佣多语种配音演员。YouTube计划免费提供此功能。人才经纪公司WME战略主管Chris Jacquemin认为,这类生成式AI功能将"民主化"创意——他使用了YouTube最钟爱的动词之一。
许多创作者愿意使用这类节省时间金钱的工具。但部分人对完全接纳AI仍存顾虑。在个人频道试验AI产品的创作者Sam Beres担忧,配音可能减少收入,因为某些广告主更看重英语国家观众数。(YouTube发言人表示,英语转其他语言配音的创作者可能面临广告均价轻微下滑,而反向配音者则相反。他补充说明,两种情况下新受众的触达都会提升观看量,因此多数创作者收入仍将增长。)
一些YouTube频道拥有忠实粉丝,他们视AI为剥削创作者的象征。“哪怕内容中仅含有一丝AI生成的元素,他们就会立刻攻击你,“Mythical Entertainment的首席创意官Stevie Wynne Levine说道,“而且这合情合理。”
其他人则没那么坚持原则。YouTube已经涌现大量AI生成内容。只需在网站上搜索电影预告片——越来越难分辨真假。
“我们已经看到数十万甚至数百万个无面孔的AI频道,“歌手兼YouTuberPeter Hollens表示,他预计AI频道数量还会持续增长。但YouTube声称,只有高质量视频才能赢得观众青睐。三月,《Deadline》报道YouTube已停止为两个使用AI制作虚假电影预告片的频道投放广告。这些账号虽无法在平台盈利,但仍可继续发布内容。
原文标题:YouTube欲借创作者数据赢得AI时代:下一篇章