新闻出版商视谷歌AI搜索工具为流量毁灭性噩梦——《华尔街日报》
Keach Hagey, Miles Kruppa and Alexandra Bruell
在ChatGPT推出后不久,《大西洋月刊》就列出了一份对这家拥有166年历史的出版物构成最大威胁的生成式人工智能清单。排在首位的是:谷歌对这项技术的拥抱。
该杂志约40%的网络流量来自谷歌搜索,这些搜索会显示用户点击的链接。《大西洋月刊》的一个特别工作组模拟了如果将其AI整合到搜索中会发生什么。结果发现,75%的情况下,AI驱动的搜索可能会为用户的问题提供完整答案,而《大西洋月刊》的网站将错过原本可能获得的流量。
曾经的假设性威胁现在变得非常真实。自5月以来,谷歌一直在约1000万用户中测试一款名为“搜索生成体验”的AI产品,并公开表示有意将其纳入其核心搜索引擎的核心。
谷歌对AI的整合让媒体机构清楚地认识到依赖大型科技公司将其内容呈现给读者和观众的危险。出版商已经在社交媒体网站流量大幅下降的打击中挣扎,因为Meta和前身为Twitter的X都已退出新闻分发。
尽管社交媒体的下滑已经够糟糕了,但谷歌生成式AI驱动的搜索对出版商来说才是真正的噩梦。根据《华尔街日报》对测量公司SimilarWeb数据的分析,在整个媒体界,谷歌为出版商带来了近40%的流量,占据了他们“推荐流量”的最大份额。
“人工智能和大型语言模型有可能摧毁我们所熟知的新闻业和媒体品牌,”阿克塞尔·施普林格集团董事长兼首席执行官马蒂亚斯·德普夫纳谈及生成式AI技术时表示。该集团旗下拥有美国《政客》和《商业内幕》等媒体,本周宣布与生成式AI专业机构OpenAI达成内容授权协议的欧洲最大出版商之一。
尽管谷歌表示其AI产品的最终形态尚未确定,但出版商们已预估,若近期测试版本广泛推出,其来自谷歌的流量将损失20%至40%。谷歌声称将优先为出版商导流。
AI的崛起是谷歌与出版商漫长而微妙关系中最新、最令人焦虑的篇章——双方始终维系着基础交易关系:谷歌帮读者发现出版商内容,出版商为谷歌搜索引擎提供海量网页信息。
谷歌副总裁利兹·里德称AI是搜索的未来,预计新工具将激发更多查询需求。图片来源:萨贾德·侯赛因/法新社/盖蒂图片社出版业高管表示,谷歌将AI引入搜索可能打破这种脆弱平衡:用户搜索后点击出版商网站链接的概率将大幅降低。最令出版商愤懑的是,谷歌AI搜索的训练数据部分来自其无偿提供的网络内容。
谷歌的观点是,开放互联网上可获取的任何内容都可用于训练AI模型。该公司援引了一项法律原则,允许在未经许可的情况下使用受版权保护作品的部分内容,用于批评、新闻报道或研究等用途。
新搜索功能对谷歌而言也是一场平衡术。为应对ChatGPT等聊天机器人日益增长的人气,该公司迅速改造了其旗舰产品。这些变化可能会损害网站所有者的利益,他们生产的书面材料对谷歌搜索引擎及其强大的AI模型都至关重要。
“如果谷歌扼杀了太多出版商,就无法构建大语言模型,“数字媒体顾问马修·戈尔茨坦表示,他是最早对出版商业务可能受到的影响发出警告的人之一。
负责搜索引擎工作的谷歌副总裁莉兹·里德表示,公司致力于为网络出版商带来流量。她说,与通常对搜索进行重大更改后相比,谷歌与出版商进行了更多对话,因为这是该领域发展中一个更重大的变化。“她没有给出谷歌更广泛推出AI驱动的搜索工具的时间表。
“目前阶段,任何对我们SGE实验流量影响的估计都纯属猜测,因为我们仍在快速改进用户体验和设计,包括链接的显示方式,并密切监控测试中的内部数据,“里德说。
所有这些都使得谷歌与出版商之间的对话日益复杂。据知情人士透露,在一些会议上,谷歌正在推销其正在开发的其他AI工具的潜在好处,包括一个有助于新闻文章写作和发布的工具。从BuzzFeed到《今日美国》的所有者甘尼特,许多新闻机构已经在试验AI工具。
与此同时,出版商正寻求谷歌的保证,要求其保护他们的业务免受可能减少流量的AI驱动搜索工具影响,并明确表示期望为用于AI训练的内容获得报酬。部分出版商——包括《华尔街日报》母公司新闻集团和《纽约时报》——已与谷歌建立了商业合作关系。新闻集团首席执行官罗伯特·汤姆森多次公开表达对AI的担忧,包括可能产生偏见或不准确内容、取代工作岗位以及未经许可使用出版商内容等问题。
“数字出版业正进入转型期并遭受冲击,"《体育画报》《The Street》《Parade》等刊物的出版商Arena集团前首席执行官罗斯·莱文索恩表示。
IAC和Expedia董事长巴里·迪勒指出,若谷歌或任何AI公司在未经许可的情况下抓取出版商内容,他认为这侵犯了出版商的版权。图片来源:迈克·布莱克/路透社### 谷歌的承诺
IAC和Expedia董事长巴里·迪勒表示,包括谷歌及其竞争对手OpenAI在内的所有主要AI公司都承诺将继续为出版商网站导流。“至于具体实施方式,他们向我们和其他方坦言,其实并不清楚,“他说道。
根据SimilarWeb的数据,IAC旗下许多网站如Brides、Investopedia和The Spruce,其超过80%的流量来自谷歌。
今年7月,IAC高管在爱达荷州太阳谷举行的艾伦公司会议上与谷歌高管会面**,**讨论人工智能议题。知情人士透露,谷歌在会上向出版商表示,尽管技术取得进展,仍无法直接追踪AI系统输出的内容来源。
“目前一切都停留在安抚阶段,“迪勒如此评价谷歌及其他科技公司在与出版商关于AI的会谈中采取的态度。
然而,在今年凤凰城举行的闭门Newsgeist会议上(该年度活动由谷歌与奈特基金会联合举办,往年以"愤怒编辑"“截稿噩梦"等俏皮特调鸡尾酒闻名),气氛较往年更为凝重。据与会者透露,出版业高管在分组讨论中抱怨AI搜索工具将剥夺他们的流量及收入。
谷歌于五月开始通过用户自愿测试逐步推出AI搜索工具。该工具采用能理解自然语言长查询的聊天界面,旨在提供所谓"快照"式答案摘要,而非传统搜索结果中链接密集的呈现方式。
初期版本未在回答中直接嵌入链接,而是将其置于段落右侧方框内。根据早期用户反馈,后续版本增加了行内链接。部分最新版本要求用户点击按钮展开摘要才能查看链接。谷歌强调这些链接并非原始素材,而是用于佐证其摘要内容。
在中国国家主席习近平近期访问旧金山期间,谷歌AI搜索机器人对"习主席说了什么?“的提问回应了两段开场白引文。用户需点击红色小箭头展开回复,才能看到引文来源的CNBC报道链接。该报道同时以图片框形式呈现在屏幕最右侧。
相同问题在谷歌常规搜索引擎中显示了习近平的另一段讲话引文,但引文来源的NBC新闻报道链接位于段落下方,排在CNN、PBS等其他媒体新闻列表顶部。
屏蔽谷歌
谷歌高管里德表示AI是搜索的未来,预计新工具将带来更多查询需求。
“全球信息需求总量并非固定值,“她指出,“当信息获取更便捷、理解更高效时,需求实际上会增长。“测试表明AI并非适合解答所有查询的工具。
部分出版商正聚焦法律争议:谷歌或任何AI公司是否有权未经许可抓取其内容。迪勒认为出版商版权正遭受侵犯:“我们相信这个问题能相对容易且快速地解决。”
许多出版商选择在网站植入代码阻止AI工具内容抓取。但屏蔽谷歌存在风险——出版商必须允许搜索引擎抓取才能被收录,从而让搜索其内容的用户可见。
对出版界的某些人而言,谷歌政策中隐含着一项潜在威胁:允许我们使用您的内容进行训练,否则您将难以在互联网上被找到。
9月下旬,谷歌宣布为出版商提供一款名为Google-Extended的新工具,允许出版商将其内容排除在特定谷歌AI工具的训练范围之外。
然而,这项排除并不适用于其AI驱动的搜索功能,这一政策已成为出版商与谷歌之间的争议焦点。
一位谷歌发言人证实了该政策,并表示AI长期以来一直是该公司搜索引擎的核心组成部分。
联系基奇·黑吉,邮箱:[email protected];迈尔斯·克鲁帕,邮箱:[email protected];亚历山德拉·布鲁尔,邮箱:[email protected]
本文刊登于2023年12月15日印刷版,标题为《谷歌AI成为新闻出版商的重大威胁》。