也许AI垃圾正在扼杀互联网——彭博社
Issie Lapowsky
图片说明:731;图片来源:Getty Images (1)菲尔·门泽尔在2010年代初首次察觉到他称之为“社交机器人”的存在。当时他正在研究信息如何在推特上传播,偶然发现了几组看起来有些可疑的账号群。其中一些账号将同一篇帖子分享了数千次,另一些则相互转发各自账号的数千条内容。“这些不是人类行为,”他回忆当时的想法。
由此开启了他漫长的机器人观察生涯。作为印第安纳大学伯明顿分校信息学教授,门泽尔研究了机器人如何增殖、操纵人类并挑动对立。2014年,他参与开发了工具BotOrNot,帮助人们识别网络中的虚假账号。如今他被视为互联网顶尖的机器人猎手之一。
菲尔·门泽尔正在分析一个传播网络图,该图展示了特定叙事如何在推特用户间扩散,突出显示了社交机器人和网红的作用。该可视化工具名为Hoaxy。来源:印第安纳大学若说有人天生擅长发现人群中的自动化程序,非门泽尔莫属。几年前,当被称为“死互联网理论”的假说开始流传——该理论认为几乎所有网络对话都已被人工智能生成的内容取代——他曾斥之为无稽之谈。但如今,随着生成式AI的爆发式发展,从聊天机器人男友到AI网红,门泽尔开始以新视角审视这个理论。他仍不认同其字面意思,但正如人们所说,他开始认真对待其核心警示。“我担心吗?”他自问自答,“是的,我非常担忧。”
彭博社商业周刊若特朗普驱逐合法移民 美国将失去什么中国游客选择跳伞与野生动物园而非手袋宝莱坞与印度大银行的故乡面临日益增长的飓风风险埃隆刚刚拥有了自己的专属小镇2021年,一位名为"光明会海盗"的用户在冷门论坛发帖后,“互联网已死"理论开始流行。该理论认为互联网已沦为算法优化的复制内容充斥的非人化荒原,并将此归咎于政府秘密阴谋——这种指控让理论显得荒诞不经。但随着ChatGPT和Midjourney等工具的出现,这一预言竟显得颇具先见之明。社交媒体愈发诡异,搜索引擎每况愈下,AI生成的新闻网站一夜涌现。Meta公司甚至设想未来Facebook和Instagram上大部分内容将由AI参与创作。维基百科等网站正因AI爬虫的频繁抓取而不堪重负,这些程序疯狂搜寻新数据喂养模型。这一切形成了恶性循环:为取悦AI推荐系统而批量生产的AI内容,正将人类逐渐边缘化为旁观者。
去年,蕾妮·迪雷斯塔(顶尖虚假信息研究者)与乔什·戈德斯坦(乔治城大学研究员)着手研究AI内容在垃圾信息与诈骗中的应用。他们锁定百余个Facebook主页,每个主页充斥数十张AI生成图片,合计拥有数百万粉丝。部分主页展示微型奶牛的虚假照片,将用户导向声称可购买的诈骗网站;另一些则呈现田园诗般的迷你木屋图像,将人引流至布满广告的网页。
虚假信息研究员蕾妮·迪雷斯塔。摄影师:巴斯蒂安·因绍拉尔德/法新社/盖蒂图片社这些操作延续了通过创建所谓"内容农场"从数字广告中获利的悠久传统。借助生成式AI,填充这些内容农场的效率大幅提升。不仅如此,广告行业研究显示,生成式AI让机器人更容易模拟真实用户行为,使广告点击看起来像真人操作。
迪雷斯塔和戈尔茨坦在论文中通过重复粘贴的标题识别出大量Facebook页面。“这是我做的第一个蛋糕!期待您的评分”,这个完全相同的标题出现在18张不同的AI生成人物与不同蛋糕的合影下。这些页面吸引了不明真相的真实用户关注,更令人困惑的是,一张将耶稣描绘成螃蟹的AI图片竟收获数十万点赞和爱心拥抱反应——这属于基督甲壳类主题AI图像的奇特细分领域。低质量AI艺术已在网络泛滥,观察者将其称为"数字泔水”。
某些情况下,“数字泔水"背后不单纯是商业动机。例如自俄乌冲突以来,俄罗斯虚假信息网络Pravda通过数百个新建网站发布数百万篇文章,可能是试图用海量宣传内容影响AI爬虫,进而操纵AI模型。近期媒体监督机构NewsGuard发现,主流聊天机器人的回答中已出现引用这些网站内容的情况。
用于批量生产网络垃圾的生成式AI工具出现得正是时候——恰逢社交媒体平台从推荐亲友内容转向推广未关注用户的帖子。这使得随机账号的传播范围远超社交媒体更注重"社交"属性的时代。果然,迪雷斯塔与这类页面互动越多,看到的垃圾内容就越多。“这些内容不仅被制造出来,还被算法推荐,“现任乔治城大学副研究员的迪雷斯塔表示,“机器正在帮它们找到我们。”
网络垃圾偶尔也能吸引人类。其离奇或骇人的特质足以让人驻足;有时,不受现实约束的内容确实比真实世界更可爱或迷人。“如果只局限于真实事件或人类创作的笑话,内容池就太有限了,“诚信研究所(信任与安全智库)联合创始人兼首席研究官杰夫·艾伦指出,“AI扩展了这个内容池。“但AI生成和推广的内容就像入侵物种,其快速传播会损害网络生态。“这好比藻类爆发,可能扼杀健康生态系统中应有的生命,“艾伦解释道。
今年2月,OpenAI报告了其模型的若干"恶意用途”。加纳某虚假青年组织使用AI生成文章和评论试图操纵2024年大选;另一起事件中,数十个疑似朝鲜黑客关联的账号用AI生成简历、求职信甚至虚构推荐人身份,成功潜入西方企业。这些账号借助AI工具通过面试,入职后向同事解释为何拒绝视频通话。(OpenAI强调其政策严禁此类欺诈行为)
另一个问题是AI公司为训练模型而进行网络爬取的庞大规模。据帮助出版商在网站被爬取时获得补偿的公司Tollbit统计,去年第四季度各网站爬取量较第三季度翻倍。美国前总统吉米·卡特逝世时,维基媒体服务因爬虫集中访问1980年辩论视频而短暂瘫痪。“我们的基础设施本可承受人类用户在高关注事件中的流量激增,但爬虫程序产生的流量前所未有,带来日益增长的风险和成本,“该基金会在博文中写道。
部分出版商正通过两种方式应对:与AI公司达成内容付费协议,或设置付费墙阻挡爬虫。麻省理工学院博士候选人、数据溯源计划负责人Shayne Longpre警告,这种趋势可能侵蚀网络自由开放的核心理念:“普通消费者将更难免费获取特定信息,要么付费订阅,要么依赖特定AI机器人获取。“同时,“小型网络出版商可能被排除在对话之外”。
向聊天机器人主导的互联网转型也可能威胁互联网巨头。最典型的案例当属谷歌母公司Alphabet,其搜索引擎本质是信息导航服务。该公司已推出名为"AI概览"的摘要功能。除了偶尔提供可疑建议外,该功能可能削弱人类运营网站的价值。如彭博商业周刊报道,部分网络出版商流量暴跌,主要归咎于AI(谷歌否认此说法,称流量波动有多重因素,AI概览"正创造连接用户与网络内容的新机遇”)。AI互联网的崛起凸显科技巨头的商业目标常与用户利益相悖。在争夺AI主导权的竞赛中,他们正加速推动转型——无论世界是否准备好。当Meta高管设想AI账号与老同学动态混杂时,用户真的需要这种体验吗?答案未可知。但在人类发帖频率下降的当下,只要能延长用户停留时间,Meta绝对乐于尝试。
艾伦指出,不难想象这些趋势最终将汇聚成怎样的反乌托邦结局。当真实人类再也无法通过数字广告维持网站运营,当他们的帖子被人工智能生成的社交网络噪音淹没,互联网终将迎来死亡。更可怕的是,研究表明当AI模型以AI生成内容为训练素材时,整个系统可能崩溃。艾伦表示:“如果网络上不再有真人创作的内容,互联网某种意义上就死亡了。”
门策尔目前并不认同这种末日预言。他认为,如果科技公司任由其产品沦为机器人的廉价温床,人类终会将注意力转向他处。“如果信噪比低到全是垃圾信息,人们自然会弃用。“科技巨头绝不会允许这种情况发生。
这或许没错。但别忘了,去年脸书上最火的帖子之一展示的是一间整洁卧室:中世纪现代风格床架的头板处装着巨型风扇,悬罩在光秃秃的床垫上方,收获约17.9万次互动。发帖者写道:“终于找到完美床铺,有这玩意儿晚上肯定不出汗!“该帖子具备AI垃圾内容的某些特征——风扇格栅略显扭曲,其他用户也发布了相同内容——但无人能百分百确定。而这恰恰是关键所在。