《彭博社》:Anthropic的"合理使用"版权裁决暴露了人工智能的盲点
Dave Lee
贪婪的读者。
摄影师:Gabby Jones/Bloomberg
在这场围绕创意作品使用的漫长而艰难的斗争中,第一回合的胜利属于AI制造商。在美国首例此类判决中,地区法官William Alsup裁定,Anthropic未经授权使用数百万本书籍训练其人工智能模型的行为符合版权法,因其具有“变革性——且程度惊人”。
这一备受关注的裁决预示着现行版权法下的未来挑战。旨在保护创作自由的“合理使用”原则,如今成为AI时代削弱创意产业自持能力的最有力武器——Anthropic正是借此成功辩护。
彭博社观点“全部驱逐”剧本与民意背道而驰“短吻鳄恶魔岛”是反乌托邦空想而非计划AI热潮可为屋顶太阳能提供新卖点单靠驱逐无法解决美国移民问题如果先例已定,正如几位观察人士所认为的那样,这将严重削弱权利持有者为数不多可能的人工智能变现策略之一,即向公司出售其作品的访问许可。在“合理使用”问题悬而未决期间,部分此类交易已经达成,而这些交易仅在法律诉讼威胁出现后才浮出水面。这一裁决可能直接扼杀了未来的交易可能。
要理解背景,有必要了解Anthropic如何构建支撑其热门AI聊天机器人Claude的大型语言模型。首先,根据法庭文件,该公司下载了至少700万本盗版书籍,以避免通过更合法途径获取这些书籍的“繁琐过程”(其首席执行官写道)。后来,考虑到直接盗版的负面影响,该公司决定购买数百万本二手实体书(通常每本一册),并向分销商声称要建立一个“研究图书馆”。Anthropic员工随后拆除了书脊,将页面扫描成数字格式并销毁了原件。
这个图书馆被用于训练Anthropic的大型语言模型,赋予Claude能够收费的智能水平。该聊天机器人提供有限的免费使用,但每月20美元可获得更完整体验,企业用户费用更高。截至最近一轮融资,Anthropic估值达到615亿美元。(作为对比,出版商Simon and Schuster在2023年以16.2亿美元被收购。)
Anthropic公司遭到三位作家的集体诉讼,他们的书籍被用于训练数据。法官在裁决中表示,Anthropic获取盗版材料的行为属违法,具体赔偿金额将在审判中确定。这是该公司遭遇的唯一坏消息。更重要的裁决结果是,法官宣布该公司的其他行为均符合规范,这为Anthropic——以及所有以同样方式构建大语言模型(LLM)的AI公司——开了绿灯。数百万本书籍被吸收并重新利用,其中的知识被转售却未向原创者支付分文。严格遵循法律的Alsup法官裁决,凸显了当前版权法存在的关键盲区。
“合理使用"原则的第一项测试标准很容易满足:Claude输出的内容与输入材料存在显著差异。Alsup法官在裁决书中用"惊人地不同"来形容,认为这符合标准。这无疑是事实,因为法律(相当合理地)仅关注精确输出内容,而忽略支撑这些输出的基础知识或思想。
更复杂的测试在于Claude的存在是否会削弱作家销售书籍的能力。对此Alsup再次强调,由于Claude的输出并非精确复制或实质性仿制品,因此图书销售市场未受冲击。这种判断忽略了AI机器人的本质。选择使用AI(而非需要付费购书的图书馆或支付稿费的报纸)是一种捷径,它从根本上减少了对原始素材的直接需求。
以谷歌的AI概览功能为例,该功能将新闻和其他来源的内容综合成易于消化的答案,省去了直接访问网站的需要。效果显著:网站流量已大幅下滑,连带摧毁了支撑其存在的商业模式。网络安全集团Cloudflare首席执行官马修·普林斯用更尖锐的措辞指出,在戛纳的一场活动上,普林斯表示,Anthropic每为出版商带来一次网页访问,就会对该网站进行六万次信息抓取。“人们不再追踪脚注了”,他警告道。
鉴于书籍获取方式的特性,虽无法获得完全对等的统计数据,但逻辑显然相通:AI降低了溯源需求,从而减少了出版商向人们销售内容并获取收益以支持更多创作的机会。
法院提出的另一项反对理由是担忧Claude可能被用于创作竞争性作品——由于AI掌握了书中全部内容,可能被用来生成替代书籍。对此,阿尔苏普法官认同这种可能性,但补充道:
作者的控诉,与他们抱怨学校培养儿童写作能力会导致竞争作品激增并无二致。这并非《版权法》所关注的那种竞争性或创造性替代。《版权法》旨在推动原创作品发展,而非保护作者免受竞争。
这最清晰地暴露了版权法的严重局限性,它没有提供任何框架来解释一个吞噬了700万本被盗书籍的惊人写作机器的存在和应用。即使有所考虑,也是目光短浅的——正如阿尔苏普所写,认为它“与儿童无异”,因为两者都被给予阅读材料并学习写作。这简直荒谬:一个是人类学童,另一个是机器。这彻底改变了讨论的性质。
如果幸运的话,一个孩子一年可能读10本书。她所读书籍的创作是由父母或学校购买支持的。如果她决定写作,那是生命的奇迹之一——她的想象力有机会流淌到纸上。尽管只是个孩子,或许正因为如此,她的写作将是新鲜而独特的,字里行间满载生活经历。她成长的家庭、遇到的朋友、怀揣的梦想——所有这些都会影响她如何解读所读书籍的内容,决定她如何选择传递这些知识。她的写作将包含矛盾、缺陷和人性。对这场辩论最重要的是,她的“竞争性创作”是增量式的。她将有所贡献。
机器下载了700万本书却一无所获——因为它无法学习,至少不是这个词的真正意义。它不贡献;它复制。当然,它可能以令我们惊讶的方式合成信息,但这完全归功于他人辛勤且未获补偿的工作。它无法拥有真实的或新的经历。
可以肯定的是,一个强大的新知识工具或许已被创造出来,但人工智能与其说是在创造新价值,不如说是在转移价值——从原始来源转移到它自身。这本身并不是问题;许多技术都在这样做。但如果要实现版权法所声明的促进原创作品发展的目标,让后代受益,那么这种价值转移应当向原创者支付费用。
人工智能已经是一项我每天使用的非凡技术。我现在每月为多种AI服务支付的费用超过了其他任何订阅服务。我愿意支付这些费用,因为我明白运营一个AI平台成本高昂,需要数据中心、发电厂、英伟达芯片和大量工程人才的支持。正如阿尔苏普所言,“这项技术是我们许多人一生中见过的最具变革性的技术之一”,他说得没错。
但这并不意味着它不应该支付应有的费用。没人敢建议英伟达公司CEO黄仁勋免费发放他的芯片。没有建筑工人会被要求无偿建造数据中心墙壁来降低成本。软件工程师们也不会因为对马克·扎克伯格的商业计划心生敬畏而自愿为Meta Platforms Inc.无偿工作——他们反而要求获得1亿美元甚至更高的薪水。
然而,科技行业一如既往地认为,创意作品及其创作者应该被视为几乎没有价值,必须为人工智能的伟大使命让路——尽管他们对产品的贡献与上述任何其他因素同样重要。正如科幻作家哈兰·埃里森在他著名的激烈抨击中所说,如果可以逃避,没人愿意付钱给作家。在人工智能领域,向原创作品的创作者支付费用并非不可能,只是不方便。立法者应该让企业别无选择。
更多来自彭博观点的内容:
想要更多彭博观点?终端用户请前往OPIN <GO>。或订阅我们的每日通讯。