谷歌决定不在AI搜索中为出版商提供选择权——彭博社
Davey Alba, Julia Love
谷歌位于加州山景城的总部。
摄影师:David Paul Morris/彭博社在利用网站数据构建以人工智能生成答案为核心的谷歌搜索时,Alphabet公司一位高管在内部文件中承认存在另一种处理方式:他们可以征得网络出版商许可,或允许其直接选择退出收录。
但该公司在这份文件中得出结论,给予出版商选择权会使搜索领域的AI模型训练过于复杂。该文件是在公司搜索反垄断案审理过程中被披露的。文件称谷歌划定了"严格红线",要求所有希望内容出现在搜索页面的出版商必须同意其数据被用于AI功能开发。根据谷歌搜索产品管理高管Chetna Bindra撰写的文件,谷歌决定"静默更新",且"不公开声明"其如何使用出版商数据。“按我们说的做,做我们说的,但要谨慎。”
谷歌在搜索领域的支配地位(去年被法院裁定为非法垄断)为其当前AI竞赛提供了决定性优势。按照谷歌的规则——以及该公司产品副总裁此前庭审证词——这家科技巨头可利用搜索引擎结果页面的内容开发其他搜索相关AI产品。谷歌表示,出版商只有完全退出搜索才能保护其数据不被搜索AI使用。延伸阅读:谷歌围绕AI重塑搜索以应对ChatGPT等竞争对手
依赖流量的网站所有者无法承受不列入谷歌搜索的代价,谷歌仍占据90%以上的搜索市场份额,使其成为现代互联网的门户。尽管AI概览功能(为部分查询提供AI生成回答)经常蚕食网站流量,许多网站仍不情愿地允许谷歌使用其内容支持搜索AI功能。通过直接回答问题,AI概览使用户无需点击链接,剥夺了网站通过展示广告和销售产品盈利的机会。
代表网络内容创作者的Raptive公司首席战略官保罗·班尼斯特表示,法庭展示的谷歌内部文件显示,该公司从一开始就意识到给予出版商更多控制权的可能性。
“这有点令人愤慨,“他说,“文件清楚地表明他们知道有多种选择方案,却几乎选择了最保守、最具保护性的方案——完全不给出版商任何控制权的选项。”
谷歌最近在华盛顿接受审判,联邦法官正在考虑这家科技巨头必须采取哪些措施来恢复在线搜索领域的竞争。主持听证会的阿米特·梅塔法官正在审议反垄断执法机构提出的一系列补救措施,旨在遏制谷歌的市场主导地位。最后听证日定于5月9日,结案陈词将于本月晚些时候进行。针对补救措施的裁决预计在8月公布。
司法部提案的一部分是强制要求谷歌为在线出版商和创作者提供一种方式,使其能够"按模型逐个"选择不让自己网页内容被用于训练谷歌的生成式AI模型,同时还能"按产品逐个"选择不参与特定生成式AI产品,且不会受到惩罚。阅读更多:谷歌AI搜索转型让企业感到"被背叛”
在公司内部幻灯片讨论的选项中,谷歌列出了"仅限SGE选择退出"的可能性——这将允许出版商选择不让自己内容出现在谷歌搜索的某些生成式AI功能中,同时仍保留在搜索引擎结果里。其中一项条款本可让出版商"选择不让自己内容显示在"AI概览中,但其数据"仍将用于训练目的”。另一项被谷歌列为最极端的选项,本可让出版商"选择不让自己数据用于基础训练"——这是谷歌和其他AI公司将模型锚定现实世界来源的过程,旨在防止AI捏造信息并提高回答准确性。
谷歌最终选择不给出版商提供新选项。该演示文件建议引入"不新增控制功能但调整公开表述",将出版商引导至现有的"“无摘要”退出机制,该机制允许出版商不参与AI概览和其他搜索功能。选择此选项还会导致其网站摘要从搜索结果页消失,从而降低用户点击链接的可能性。
“多年来,人工智能模型已整合至搜索引擎中,帮助呈现相关网站并为其引流,而出版商始终掌握着内容如何提供给谷歌的控制权,”谷歌发言人就彭博社关于庭审展示的质询发表声明称,“这份文件只是发展中的初步选项清单,不代表可行性或实际决策。”发言人补充说,谷歌持续更新其面向网络搜索的产品文档。
法庭展示的文件包含公司代表应如何传达信息以及需避免明确表述的建议。宾德拉2024年4月撰写的文件总结道:“若达成一致,下一步将着手拟定具体措辞并发布。”一个月后,谷歌在加州山景城年度开发者大会上全面引入AI搜索,宣称打造了“彻底革新”的体验。延伸阅读:谷歌在AI退出选项后仍可利用网络内容训练搜索AI
自AI概览功能推出一年来,部分出版商网站流量急剧下滑。与出版商合作的AI初创公司Infactory首席执行官布鲁克·哈特利·莫伊指出,对出版商而言更长远的影响在于:模型发展正逐步生成足以替代其原创新闻的优质内容。
“如果谷歌的模型发展到削弱内容中人类元素的地步,那他们基本上等于签署了自己的死亡令状,”哈特利·莫伊在谈到出版商时表示。
哈特利·莫伊指出,随着出版商寻找新的收入来源,允许其内容被用于检索增强生成(RAG)——一种人工智能模型回溯特定来源以提供更准确回答的技术——已成为一个极具潜力的选项。她表示,谷歌将RAG移出谈判桌的举动之所以影响重大,原因正在于此。
“没有出版商,RAG就不复存在,”哈特利·莫伊说。“在我看来,这是确保谷歌拥有完全市场控制权的策略,而出版商则在谈判中失去了一个关键筹码。”
在谷歌律师肯尼斯·斯穆尔津斯基的质询下,该公司搜索业务负责人莉兹·里德作证称,为不同产品和模型创建多重退出机制将面临挑战。
“这意味着如果搜索页面上有多个生成式AI功能——这很容易实现——每个功能都需要单独的模型支持。但我们不会为这些功能单独构建模型,”根据5月6日的庭审记录,里德在证词中表示。
“因此,如果允许出版商说‘我想加入这个功能但不参与那个功能’,这种模式行不通,”她继续解释道。“因为那样我们实际上等于要求页面上的每个功能都必须使用不同模型。”里德表示,这不仅会因硬件和芯片的巨大投入导致成本激增,更因需确保不同AI模型高效运行并快速响应而面临技术挑战。“这将带来巨大的复杂性,”她在证词中强调。