《华尔街日报》:《幻觉":当聊天机器人(和人类)看到不存在的东西》
Ben Zimmer
插图:James Yang语言学家兼词典编纂者Ben Zimmer解析新闻词汇的起源。阅读往期专栏请点击此处。
如果你试用过最新的人工智能聊天机器人,如OpenAI的ChatGPT或谷歌的Bard,可能会发现它们能自信且权威地生成完全错误的陈述。
例如,我向Bard询问了“论证性双元音化”——这个短语其实是我刚编造的。它不仅生成了五段文字来阐述这个虚假现象,还告诉我该术语“由语言学家Hans Jakobsen于1922年首次提出”。不用说,历史上从未有过名为Hans Jakobsen的著名语言学家(尽管1920年奥运会确实有位同名丹麦体操选手参赛)。
当聊天机器人生成的文本偏离正轨、脱离现实时,AI研究者称这种现象为“幻觉”。在上周末接受CBS《60分钟》节目采访时,谷歌CEO Sundar Pichai承认了开发Bard等语言模型时AI幻觉的风险。“目前该领域尚未有人能解决幻觉问题,”Pichai表示,“所有模型都存在这个缺陷。”
但是,一个用于描述人类幻觉感知的词汇是如何被应用到计算机合成回应上的呢?这种“幻觉”的说法是否适得其反,助长了这些回应来自一个有意识(即使混乱)心智的观念?
“幻觉”及其动词形式“产生幻觉”源自拉丁语“alucinari”,可以意为“在心灵中漫游”、“做梦”或“被欺骗”。在英语中,从17世纪中叶开始,“幻觉”可以指在没有实际物体的情况下对物体的明显感知。
这个术语出现在托马斯·布朗于1646年出版的一本广为流传的科学著作《流行谬误》中。(布朗的著作帮助普及了科学,并早期出现了“医学”、“病理学”和“计算机”等词汇。)布朗写道,当一个人的视觉“堕落”并“错误地接收其对象”时,就会产生幻觉。
心理学家随后将幻觉分类为影响其他感官的现象。幻觉被归因于睡眠剥夺、精神障碍和药物使用等原因。在20世纪50年代,当研究人员研究LSD等迷幻药物的效果时,他们称这些药物为“致幻剂”,即幻觉的产生者。
在人工智能领域,随着语言模型变得更加复杂,计算机科学家抓住了“幻觉”作为隐喻。在2015年的一篇博客文章中,OpenAI的创始成员安德烈·卡帕西写道,模型如何可以‘产生’文本回应,比如编造看似合理的URL和数学证明。这个术语在2018年由与谷歌合作的AI研究人员在一篇会议论文《神经机器翻译中的幻觉》中被采用,该论文分析了自动翻译如何产生与输入完全脱节的结果。
我与论文的主要作者、康奈尔大学研究科学家凯瑟琳·李进行了交谈,她承认虽然“幻觉”是“无根据”文本生成的便捷简称,但它在人工智能讨论中的广泛使用一直存在问题。“这个词本身受到了不同的批评,”她说,主要是“通过说它们产生幻觉,我们是在拟人化这些模型。”李女士表示,她现在认为“幻觉”是“不是最好的词”,并很高兴有人能想出更好的替代词。
华盛顿大学计算语言学家艾米丽·M·本德对此表示同意,并指出这个术语错误地“暗示语言模型具有感知和经验。”她还担心“轻视可能是一种严重的心理健康症状。”虽然像“合成的无根据文本”这样的替代词可能有些拗口,但它们避免了想象人工智能系统具有人类感知(无论是幻觉还是其他)的陷阱。
刊登于2023年4月22日的印刷版,标题为《当聊天机器人(和人)看到不存在的东西时》。