什么是深度伪造和裸体化应用?能否阻止它们?——彭博社
Nate Lanxon, Omar El Chmouri
2024年6月于华盛顿特区举行的《下架法案》新闻发布会现场。摄影师:安德鲁·哈尼克/盖蒂图片社互联网充斥着深度伪造内容——通过人工智能工具生成的音频、图片或视频,使人们看似做了或说了他们未曾做过的事,出现在未曾去过的地方,或是改变了外貌。部分涉及"裸体化"技术,即修改照片使人物呈现裸露状态。其他深度伪造则被用于欺诈消费者,或损害政界人士等公众人物的声誉。
人工智能的进步使得仅需键盘敲击几下就能生成逼真的深度伪造内容。警觉的各国正试图反击,但始终处于下风。身份验证公司Signicat数据显示,过去三年使用深度伪造的欺诈尝试增长了20倍以上。
如何应对深度伪造?
5月19日,美国总统唐纳德·特朗普签署了《下架法案》,将未经同意的AI生成色情内容(即深度伪造复仇色情)定为刑事犯罪,并强制社交媒体公司接到请求后删除此类露骨性影像的分享。
去年,美国联邦通信委员会宣布企业在自动呼叫中使用AI生成语音属违法行为。该禁令出台前两天,FCC刚向制作拜登总统音频深度伪造的公司发出停止令。新罕布什尔州居民曾在总统初选前接到自动电话,声音酷似拜登怂恿他们"留在家中,把选票留到11月大选"。
欧盟《人工智能法案》要求平台对深度伪造内容进行标注。中国也在2023年实施了类似立法。4月28日,英格兰儿童事务专员呼吁英国政府封禁网络上泛滥的裸体合成应用。
深度伪造技术还有哪些新闻事件?
2024年1月,流行歌手泰勒·斯威夫特的露骨深度伪造图片在社交媒体疯传,引发其粉丝群情激愤及白宫关注。2024年美国总统大选期间,埃隆·马斯克分享了一段民主党候选人卡玛拉·哈里斯的深度伪造竞选视频且未标注误导性。这段经AI篡改声音的视频显示她称乔·拜登总统"老糊涂",并宣称自己’对国家治理一窍不通’。该视频获得数千万浏览量。作为回应,加州州长加文·纽森签署法案,于9月起禁止数字篡改的政治类深度伪造内容。
深度伪造视频如何制作?
通常采用能识别特定人物真实影像模式的AI算法(即深度学习)进行制作。通过该技术可将视频元素(如人脸)自然融合到其他内容中,毫无粗劣拼接感。当结合语音克隆技术时欺骗性最强——该技术将原始录音分解为半音节片段,可重组为原声者"说出"的全新语句。
深度伪造技术是如何兴起的?
这项技术最初属于学术界和研究人员的领域。然而,Vice旗下的Motherboard在2017年报道称,一位名为"deepfakes"的Reddit用户利用开源代码开发了制作虚假视频的算法。Reddit封禁了该用户,但这种技术却传播开来。最初,深度伪造需要已有视频素材、真实的语音表演以及娴熟的剪辑技巧。
如今的生成式AI系统允许用户通过简单的文字指令就能制作出令人信服的图像和视频。让电脑生成一段将话语强加于某人的视频,它就能立即呈现。
如何识别深度伪造内容?
随着AI公司将新工具应用于网络上海量素材(从YouTube到图库视频库),数字伪造品变得越来越难以辨别。
有时会出现明显的破绽表明图像或视频是由AI生成的,比如错位的肢体或六根手指的手。图像中被编辑和未编辑部分的颜色可能存在不一致。深度伪造视频有时会出现语音与嘴型不匹配的情况。AI可能难以呈现头发、嘴巴和阴影等元素的精细细节,物体边缘有时会出现锯齿和像素化。
但随着底层歌唱模型的改进,所有这些都可能发生变化。
深度伪造还有哪些其他案例?
2023年8月,中国网络水军传播了夏威夷毛伊岛野火的篡改图像,以支持这些火灾是由美国测试的秘密“气象武器”引发的说法。2023年5月,一张显示五角大楼起火的图片在网上流传后,美国股市短暂下跌。专家表示,这张假图片具有人工智能生成的特征。同年2月,一段伪造的音频片段出现,内容听起来像是尼日利亚总统候选人阿提库·阿布巴卡尔策划操纵当月选举。2021年,社交媒体上发布的一段一分钟视频似乎显示乌克兰总统弗拉基米尔·泽连斯基命令士兵放下武器向俄罗斯投降。其他深度伪造内容则无害,比如足球明星克里斯蒂亚诺·罗纳尔多演唱阿拉伯诗歌的视频。
这有什么危险?
人们担心深度伪造最终会变得如此逼真,以至于无法区分真实与虚构。想象一下,欺诈者通过制作伪造的首席执行官发布公司更新的视频,或伪造士兵犯下战争罪行的视频来操纵股价。政治家、商界领袖和名人尤其面临风险,因为他们的录音和录像资料众多。
这项技术使得所谓的复仇色情成为可能,即使没有实际的裸照或视频存在,女性通常是目标。一旦视频在互联网上疯传,几乎无法控制。英国儿童事务专员4月的报告强调了儿童越来越担心成为露骨深度伪造的受害者。另一个担忧是,对深度伪造的广泛认知会让那些真正在录像中做了或说了令人反感或非法事情的人更容易声称针对他们的证据是伪造的。一些人已经在法庭上使用深度伪造作为辩护理由。
还有哪些方法可以遏制深度伪造?
生成深度伪造的机器学习技术难以逆向用于检测。但荷兰Sensity AI、爱沙尼亚Sentinel等初创公司正与多家美国科技巨头共同研发检测技术。
包括微软公司在内的企业已承诺在其AI工具生成的图像中嵌入数字水印以标识伪造内容。ChatGPT开发商OpenAI不仅研发了AI图像检测技术,还开发了文本水印方案——不过后者尚未发布,部分原因是该公司表示恶意行为者"很容易"规避该技术。
延伸阅读
- 调查人员如何破解拜登深度伪造案
- 谷歌与微软如何助推AI伪造色情内容泛滥
- 泰勒·斯威夫特事件使解决AI领域长期隐患的紧迫性骤增
- 彭博早前关于生成式AI与AI监管的解读
- 彭博视频报道AI公司Lyrebird如何实现语音克隆
- 伦敦大学学院研究显示人类对超过四分之一的伪造音频无法识别