研究人员有一个理解人工智能的神奇工具:哈利·波特 - 彭博社
Saritha Rai
一个行人走过伦敦西区的《哈利·波特与被诅咒的孩子》演出剧院,2020年。
摄影师:西蒙·道森/Bloomberg在J.K.罗琳介绍了一个充满魔法生物、禁忌森林和一个少年巫师的宇宙两个多十年之后,哈利·波特在一个截然不同的文学体裁中找到了新的相关性:人工智能研究。越来越多的研究人员正在使用畅销书《哈利·波特》来进行生成式人工智能技术的实验,引用该系列作品在流行文化中的持久影响以及其页面中丰富的语言数据和复杂的文字游戏。回顾引用哈利·波特的研究和学术论文的列表可以窥见尖端的人工智能研究,以及该技术面临的一些棘手问题。
也许最引人注目的最近例子是,哈利、赫敏和罗恩在一篇名为“哈利·波特是谁?”的论文中扮演主角,该论文揭示了一种帮助大型语言模型有选择性地遗忘信息的新技术。这对该行业来说是一项高风险的任务:驱动AI聊天机器人的大型语言模型是建立在大量在线数据的基础上的,包括受版权保护的材料和其他问题内容。这导致了一些AI公司面临诉讼和公众审查。该论文的作者,微软研究人员马克·鲁辛诺维奇和罗南·埃尔丹表示,他们已经证明了AI模型可以被修改或编辑以删除对《哈利·波特》书籍的存在的任何知识,包括角色和情节,而不会牺牲AI系统的整体决策和分析能力。这对选择这些书籍是因为它们的普遍熟悉度。“我们相信,研究界的人们会更容易评估我们的技术产生的模型,并自行确认内容确实已经被‘遗忘’,”微软Azure首席技术官鲁辛诺维奇说。“几乎任何人都可以提出提示,来探究模型是否‘知道’这些书。甚至那些没有读过这些书的人也会知道情节元素和角色。”
在另一项研究中,华盛顿大学西雅图分校、加州大学伯克利分校和艾伦人工智能研究所的研究人员开发了一种名为Silo的新语言模型,可以删除数据以减少法律风险。然而,他们在今年早些时候发表的一篇论文中指出,如果仅在低风险文本上进行训练,比如过期的图书或政府文件,该模型的性能会显著下降。
为了更深入地研究,研究人员使用哈利·波特的书来观察单个文本片段对人工智能系统性能的影响。他们创建了两个数据存储,或者说网站和文件的集合。第一个包括除了第一本哈利·波特书之外的所有已出版书籍;另一个包括该系列中的所有书籍,但不包括第二本,以此类推。“当哈利·波特的书从数据存储中移除时,困惑度变得更糟了,”研究人员说道,指的是衡量人工智能模型准确性的指标。
至少十年来,人工智能研究一直引用哈利·波特,但随着学者和技术人员专注于能够处理自然语言并提供相关答案的人工智能工具,这种引用变得更加普遍。关于哈利·波特,“丰富的场景、对话、情感瞬间使其与自然语言处理的特定领域非常相关,”卡内基梅隆大学的研究人员Leila Wehbe说道,她在2014年进行了一系列实验,收集了人们阅读哈利·波特故事时的脑部MRI数据,以更好地理解语言机制。在arXiv上,一个开放获取的科学研究存储库,最近的论文包括“霍格沃茨的魔药开发机器学习”,“大型语言模型遇见哈利·波特”和“使用基于Transformer的人工智能检测奇幻文学中的咒语”。
即使它并不是研究的核心内容,哈利·波特也是研究人员喜爱的文学参考之一。例如,一项研究使用罗琳的作品来测试人工智能系统的智能,比如生成了聊天机器人ChatGPT的系统,这个话题在最近的辩论中引起了很多热议。 Terrence Sejnowski,他是索尔克生物学研究所的计算神经生物学实验室主任,在论文中提出,聊天机器人只是反映了其用户的智能和偏见,就像哈利·波特第一本书中的欲望镜一样,它会将一个人的愿望反射回给他们。“哈利·波特在年轻的研究人员中很受欢迎,”Wehbe说。“他们在孩童或青少年时期可能已经阅读过这些书,因此在选择书面或口头文本语料库时会想到它们。”