什么是深度伪造和裸体化应用?它们能被阻止吗?——彭博社
Nate Lanxon, Omar El Chmouri
2024年6月于华盛顿特区举行的《下架法案》新闻发布会现场。摄影师:安德鲁·哈尼克/盖蒂图片社互联网充斥着深度伪造内容——通过人工智能工具生成的音频、图片或视频,使人们看似做了或说了未曾发生的事,出现在未曾去过的地方,或是改变了外貌特征。部分涉及"裸体化"技术,即篡改照片使人呈现裸露状态。其他深度伪造则被用于诈骗消费者,或损害政界人士等公众人物的声誉。
人工智能的进步使得仅需键盘敲击几下就能生成逼真的深度伪造内容。警觉的各国政府正试图反击,但始终处于下风。身份验证公司Signicat数据显示,过去三年间利用深度伪造实施的欺诈尝试增长了逾20倍。
当前采取了哪些反制措施?
4月28日,美国众议院通过《下架法案》,将未经同意的AI生成色情内容(即深度伪造复仇色情)定为刑事犯罪。该法案得到第一夫人梅拉尼娅·特朗普支持,预计将由唐纳德·特朗普总统签署生效。同日,英格兰儿童事务专员呼吁英国政府禁止网络上广泛流通的裸体化应用程序。
去年,美国联邦通信委员会规定企业禁止在自动语音电话中使用AI生成的声音。该禁令出台前两天,FCC刚对一家公司发出停止令,该公司制作了拜登总统的音频深度伪造内容。新罕布什尔州居民在该州总统初选前接到自动语音电话,声音酷似拜登,敦促他们留在家中"把选票留到11月大选"。
欧盟《人工智能法案》要求平台对深度伪造内容进行标注。中国也在2023年实施了类似立法。
深度伪造技术还引发过哪些新闻事件?
2024年1月,流行歌手泰勒·斯威夫特的露骨深度伪造图片在社交媒体疯传,引发其粉丝强烈不满及白宫关注。
2024年美国总统大选期间,埃隆·马斯克分享了一段民主党候选人卡玛拉·哈里斯的深度伪造竞选视频且未标注误导性。这段经AI处理的视频中,她似乎称拜登总统"年老昏聩",并宣称自己"对国家治理一窍不通"。该视频获得数千万浏览量。作为回应,加州州长加文·纽森签署法案,于9月起禁止数字篡改的政治深度伪造内容。
深度伪造视频是如何制作的?
它们通常通过AI算法制作,该算法经过训练能识别特定人物真实视频中的模式,这一过程称为深度学习。随后可以将一个视频中的元素(如人脸)无缝替换到另一段内容中,使其看起来不像粗糙的剪辑。当结合语音克隆技术使用时,这种篡改最具迷惑性——该技术将某人说话的音频分解为半音节片段,可重组为听起来像原声者所说的新词句。
深度伪造技术如何兴起?
这项技术最初属于学术界和研究领域。然而2017年Vice旗下媒体Motherboard报道,一位名为"deepfakes"的Reddit用户利用开源代码开发了制作虚假视频的算法。Reddit封禁了该用户,但技术迅速传播。早期的深度伪造需要既有视频素材、真实人声录音及娴熟的剪辑技巧。
如今生成式AI系统仅需简单文字指令就能制作逼真图像视频。让电脑生成一段让人"口吐特定台词"的视频,它就能立即呈现。
如何识别深度伪造?
随着AI公司将新工具应用于网络海量素材(从YouTube到商用图库),数字伪造品越来越难辨别。
但AI生成的图像视频仍可能存在破绽:错位的肢体、六根手指的人手、图像编辑与未编辑部分的色差。视频中可能出现口型与语音不同步的情况。AI在渲染头发、嘴唇和阴影等细节时可能力有不逮,物体边缘有时会呈现锯齿状像素化。
但随着底层模型的进步,这一切都可能改变。
深度伪造的其他案例有哪些?
2023年8月,中国网络水军传播了夏威夷毛伊岛野火的篡改图像,以支持其声称火灾由美国测试的秘密“气象武器”引发的论断。2023年5月,一张显示五角大楼起火的图片在网上流传后,美国股市短暂下跌。专家称该假图具有AI生成的特征。同年2月,一段伪造音频曝光,内容疑似尼日利亚总统候选人阿提库·阿布巴卡尔密谋操纵当月选举。2021年,社交媒体上一分钟视频看似显示乌克兰总统泽连斯基命令士兵向俄罗斯缴械投降。其他深度伪造内容则无害,如足球明星C罗吟诵阿拉伯诗歌的视频。
这有何危害?
令人担忧的是,深度伪造终将逼真到难辨真伪。试想:诈骗者通过伪造CEO发布企业动态的视频操纵股价,或伪造士兵犯下战争罪行的影像。政客、商界领袖和名人尤其危险,因其公开影像资料众多。
该技术使所谓"复仇色情"成为可能——即便没有真实裸照或视频,女性通常成为目标。一旦视频在互联网疯传,几乎无法遏制。英国儿童事务专员四月报告指出,儿童越来越恐惧成为露骨深度伪造的受害者。另一重忧虑是:随着公众对深度伪造认知提升,真实丑闻当事人可能更容易辩称不利证据系伪造。已有法庭案例出现"深度伪造抗辩"。
还有哪些方法可以抑制深度伪造?
生成深度伪造的机器学习技术难以逆向用于检测它们。但荷兰的Sensity AI和爱沙尼亚的Sentinel等少数初创公司以及许多美国大型科技公司一直在开发检测技术。
包括微软公司在内的企业已承诺在其AI工具生成的图像中嵌入数字水印,以标记其为伪造。ChatGPT开发者OpenAI已开发出AI图像检测技术及文本水印方案——不过后者尚未发布,部分原因是该公司表示恶意行为者"很容易"该技术。
参考资料
- 调查人员如何破解拜登深度伪造案。
- 谷歌和微软如何助推AI深度伪造色情。
- 泰勒·斯威夫特事件为AI领域长期关注的问题注入了新紧迫性。
- 相关快评关于生成式AI和AI监管。
- 彭博关于会"代你说话"的AI公司Lyrebird的视频报道。
- 伦敦大学学院研究表明人类无法识别超过四分之一的深度伪造音频。