Netflix的算法与技术如何助其成功 - 《华尔街日报》
Christopher Mims
经过数十年将Netflix 宣传为一家恰好分发娱乐内容的技术公司后,其高管们最近试图将这家流媒体巨头重新定位为一家恰好依赖技术的娱乐公司。
但别被迷惑:Netflix用于收集和分析数据的专有技术仍是其成功的关键。这些数据进而被用来决策制作哪些节目和电影、是否续订,以及是否通过该公司著名的推荐算法将其展示给特定观众。
无论内容是新创原创——如《后翼弃兵》《鱿鱼游戏》和《纸钞屋》,还是现有IP的一部分,如《夏洛特女王:布里奇顿前传》《吉尔莫女孩》重启版或《怪奇物语》等热门剧的后续季集,皆是如此。
Netflix一位女发言人表示,公司已与内容制作方私下分享部分数据,并以每周公开前十名榜单的形式发布。根据好莱坞编剧和演员同步罢工的进展,该公司及其众多模仿者可能不得不披露更多信息。
因为在流媒体时代,回答演员和编剧应如何获得报酬的问题取决于这些数据,以及公司如何利用它来计算一部剧是否值得投资。
数据成为劳资谈判的筹码
鹿特丹伊拉斯谟大学媒体与创意产业助理教授迈克尔·韦恩指出,当合同谈判(如当前好莱坞罢工的核心问题)涉及剩余收益分配时,真正的争议焦点其实是数据及其掌控权。
美国编剧协会和演员工会SAG-Aftra未回应置评请求。
韦恩以Netflix首部大型原创剧集《纸牌屋》为例指出,即使开播十年后,该剧对公司仍有价值,但具体价值尚不明确。
“只要为Netflix制作内容的人不了解自身劳动的价值,Netflix在谈判桌上就占据优势,“韦恩表示,“数据是这一优势的核心。”
据Netflix发言人透露及该公司2019年致英国议会委员会的信函显示,近些年Netflix已开始与制片方共享更多数据。这些数据包括剧集或电影上线前7天及28天的观看人数,以及在此期间完整观看的人数。
Netflix还推出了一项计划,允许数万名订阅用户对部分内容提供早期反馈,以期促使创作者根据观众喜好调整内容。
好莱坞从业者或许希望改变现状。但芝加哥大学计算机科学副教授马希尼·切蒂(研究Netflix数据收集机制)指出,现实情况是,除了这些有限的披露,Netflix没有动机公开其专有内部数据。
Netflix的数据优势
Netflix运用数据的能力帮助其在流媒体竞争中通过原创内容留住用户,同时控制成本。该公司本月表示,最新季度新增590万订阅用户,利润也有所增长。这归功于打击密码共享措施——并自豪宣称在2023年前25周中,有24周其原创剧集占据美国流媒体榜首。相比之下,迪士尼等竞争对手的流媒体业务持续亏损。
加州近期通过的一项法律揭示了Netflix的数据收集机制,以及其如何利用这些数据在流媒体竞争和人才谈判中取得优势。
2020年生效的《加州消费者隐私法》要求企业应消费者要求提供其持有的相关数据。芝加哥大学计算机科学博士生布伦南·沙夫纳表示,Netflix提供的数据颗粒度令人惊讶。
沙夫纳指出,这些数据包含"自账户创建以来接触过的所有内容的详细记录”,包括观看时长、观看地点和使用设备。Netflix还能通过详细的菜单导航记录和点击行为,前所未有地洞察用户最初选择内容的原因。
Netflix已解释这些数据为其推荐算法提供支持。该公司在先前讨论如何测试不同版本的预告片、缩略图等内容时也提及过这些数据。
数据如何塑造内容
了解Netflix如何运用数据的一个窗口是观察该公司决定续订内容的逻辑。
媒体数据分析公司Ampere高级分析师奥利维亚·迪恩表示,传统广播电视网或有线电视网续订的节目平均会播出六季。然而在Netflix平台上,节目通常仅获续订三季。她补充说,这一现象至少从2020年持续至今,尽管随着时间推移人们预期该数字会上升。
迪恩指出,这表明播出超过三季的节目在吸引和留住订阅者方面的效用有限(当然,Netflix确实拥有《马男波杰克》等播出至第八季的长寿剧集)。
Netflix持续投入剧本类剧集——上个季度续订剧目中三分之二为剧本类内容——表明该公司发现这类内容在吸引和留存用户方面的投资回报可观。鉴于剧本类内容制作成本远高于真人秀、纪录片等非剧本类节目,这证明Netflix的数据优势(公司称这些数据使其更确信观众会观看其内容)持续发挥着价值。
安培分析的迪恩指出,网飞内容策略的典型代表是《怪奇物语》。首先,这类高成本剧本创作正是网飞凭借数据驱动的观众喜好洞察力,最初就取得巨大成功的投资方向。其次,该剧目前仅制作了四季(主创曾表示想开发第五季,但尚未确定上线日期)。
网飞能追踪单个订阅用户行为——包括他们何时流失(即取消订阅)——安培分析师认为这些数据表明,持续推出重磅新剧既能吸引也能留住用户,但即便是热门IP的续作,其边际效益也会递减。
网飞内容主管贝拉·巴贾里亚在六月的UCLA娱乐产业研讨会上表示:“算法并不决定我们制作什么内容。”
“没有哪个算法会说’拍部关于国际象棋女棋手的年代剧是个绝妙主意’",她补充道,这里指的是获奖剧集《后翼弃兵》。
算法同样不直接为YouTube、TikTok或Instagram创作内容——但这些平台在某种程度上都受制于各自的内容筛选算法。娱乐平台仍依赖人类观察趋势并构思原创点子并不意外。巴贾里亚的发言未提及数据如何影响决策:既未说明数据如何决定哪些人类构思的项目能开绿灯——正如网飞工程师所述——也未涉及数据对剧集制作数量的影响。
预算紧缩,机器学习应用更广
“预算正变得越来越紧张,资金投向也愈发关键,“迪恩表示。“我认为这正是Netflix比以往更依赖数据的原因。”
Netflix的内容预算在去年和今年保持稳定,约为170亿美元。
作为整个流媒体行业的风向标,Netflix绝非唯一这样运作的流媒体公司。竞争对手的高管们都曾谈及如何利用数据决定制作内容。随着更多流媒体平台探索广告支持版本,收集此类数据成为必选项,以便向广告商提供收视数据。
如今影视剧制作成本空前高昂,这更凸显了利用AI辅助决策的必要性。正如其工程师在2020年博文所述,AI能分析同类作品数据、预测观众规模及区域分布。这需要运用迁移学习、知识图谱等尖端AI系统(如谷歌Bard和ChatGPT)的常规技术——但这些显然不是好莱坞制片会议的传统讨论内容。
Netflix向此类AI输入的数据越多,其输出的结果就会越好。正如我们从当今生成式AI所吞噬的海量数据中看到的,纯粹的数据量可以催生出令人惊讶且实用的新能力。
欲获取更多《华尔街日报》科技板块的分析、评测、建议与头条新闻,请订阅我们的每周通讯。
联系克里斯托弗·米姆斯,邮箱:[email protected]
本文刊登于2023年7月29日印刷版,标题为《Netflix的算法是其成功关键》。