拜登假冒电话显示AI语音克隆很容易上当 - 彭博社
Parmy Olson
听起来好像…
来源:彭博社
在瞄准英国、斯洛伐克和世界其他地方的政客之后,音频诈骗者终于在美国引起轰动。他们克隆了总统乔·拜登的声音,并将其制作成了自动拨号电话,这是上世纪70年代的一种竞选策略。
欢迎来到2024年,你在电话中听到的政治声音可能是在互联网上捏造的。
周末时,这条自动电话消息在播放时引起了选举专家的警惕,它播放了一段经过编辑的声音,听起来就像拜登,并告诉新罕布什尔州的居民不要在周二的民主党初选中投票。“把你的选票留到11月的选举中使用,”它说,并附上了拜登的口头禅:“真是一派胡言。”(点击此处查看详情)
虚假信息研究人员对所谓的音频深度伪造在大选年初出现感到担忧,因为全球大约一半的人口将进行投票。虽然虚假视频和图片引人注目且戏剧性,但虚假音频剪辑更加危险。可以把它们看作是虚假信息的蚊子。它们小巧且易于制作,难以发现并且几乎不可能追踪。它们可以传播错误信息,造成灾难性的影响。例如,去年,斯洛伐克的一个政党很可能因为其领导人的音频深度伪造在选举前两天走红而输掉了国家选举。
政府对这个问题非常清楚。拜登本人去年底签署了一项行政命令,试图引导人工智能的发展,而不会让公众面临风险。但是魔鬼已经出笼。已经有数十家公司提供工具来克隆任何声音,包括你自己或其他人的声音,有些公司对伪造更加严格。
例如,一家名为Synthesia的英国人工智能公司销售软件,用于制作真实人物的语音和视频克隆,通常用于制作企业培训视频,并禁止客户生成政治或新闻内容。当客户尝试生成他们的克隆视频时,一组内容审核员会在视频完全生成并发送给用户之前观看视频,以确保它不违反这些规定。
但其他公司不会监管客户制作的内容。另一个名为HeyGen的工具上周在社交媒体上走红,有人使用它修改了西班牙语演讲的达沃斯演讲,阿根廷总统哈维尔·米莱。它不仅展示了他用流利的英语说话,并且他的嘴唇与翻译的词语相配。然而,HeyGen依赖客户获得克隆其他人声音的许可,包括政治人物。
迈莱的视频吸引了一大批欣赏的观众,但如果他的话被误解,情况可能会变得不同。而HeyGen公司的技术将责任推给客户,似乎比Synthesia公司更容易被滥用。HeyGen公司没有回应多次要求发表评论。
一些人工智能公司发现自己陷入了一场阻止人们滥用其系统的游戏。ElevenLabs是最受欢迎的人工智能语音生成服务之一,用于翻译有声书或播客,去年在网络论坛4chan的人们滥用其系统后,加强了执法力度。用它制作了艾玛·沃特森、乔·罗根和其他名人说种族主义言论的深度伪造声音。
即使所有人工智能公司严格监管音频深度伪造的制作,恶意行为者仍然可以转向提供更多自由的开源替代方案。这样的替代方案有很多。最近的项目之一是来自麻省理工学院(MIT)、清华大学和人工智能初创公司MyShell的研究人员开发的一个名为OpenVoice的语音克隆工具。该工具允许任何人“仅使用小音频剪辑”就能以“无与伦比的精度”克隆声音,其创作者在X上表示。
美国联邦贸易委员会最近承诺奖励25000美元给任何能提出可行解决方案的人,解决AI语音克隆的问题。到目前为止,没有技术修复,因为虚假信息专家表示,用于区分克隆声音的新软件仍然不可靠。
拜登的自动拨号电话突显了一个令人警醒的现实,这对于虚假信息专家、其他国家和政治领导人来说早已显而易见,他们一直受到AI生成的声音的攻击。由于各种政策、像Facebook这样的平台的执行规则非常宽松,以及欺诈者可以毫不受约束地使用越来越多的免费工具,声音克隆将会增加,我们的机构将不得不应对混乱。
目前,可能很长一段时间内,责任将再次落在我们身上,我们需要对所听到的内容更加具有对抗性和谨慎性,即使是在我们自己的手机上。
更多来自彭博观点:
想要更多彭博观点吗? OPIN <GO>****。或者你可以订阅 我们的每日新闻简报**。**