AI生成的图像如此逼真 连AI都难以辨别部分作品——《华尔街日报》
Ann-Marie Alcántara
人工智能图像生成器正以肉眼可见的速度进化着。
早在今年一月,像OpenAI的DALL-E这样的系统生成的人物可能手指错位或眉毛悬空。到了三月,部分图像已逼真到能骗过大量观众。
这张教皇方济各身着白色羽绒服的伪造图片愚弄了众多网友。插图:Guerrero Art从身穿白色羽绒服的教皇,到特朗普被捕、法国总统马克龙穿过抗议人群等照片,这些引发轩然大波的假图促使马斯克和苹果联合创始人沃兹尼亚克等科技领袖公开呼吁暂停AI工具开发。
虽然AI生成内容颇具娱乐性,但它给行业和日常交流都带来了风险——可能被用于传播虚假信息、侵犯知识产权或制作人物色情图片。我们已迫切需要区分人类创作与机器生成图像的方法。
多数AI图像背后是Midjourney的杰作,它能将文字描述转化为图像,或以新颖方式混合现有图片。学者们表示,其最新版本极大模糊了现实与虚构的界限。其他图像生成器(包括为微软新版Bing图像生成器提供支持的DALL-E)也在快速进步。
一些开发者正在构建能够分析图像以识别AI生成痕迹的工具。问题是,除非这些工具能跟上它们所监控的图像生成器的步伐,否则连自己也可能被欺骗。
检查图像伪影
AI信任与安全公司Optic推出了AI or Not网站,用户可上传照片或插图,由该网站判定是人工作品还是AI生成。支持直接上传图片或粘贴图片链接,且上传数量无限制。
用户还可以在Optic的推特账号@optic_xyz发布或转发图片,并带上#aiornot标签,将收到包含置信度百分比的分析回复。该公司还在开发谷歌浏览器扩展程序。
首席执行官安德烈·多罗尼切夫表示,该工具通过检测人眼不可见的图像伪影(如亮度与色彩变化)进行分析。
该工具此前准确率达95%,但Midjourney发布新版软件后,准确率骤降至88.9%。Optic团队随即更新系统以识别新版Midjourney图像。而采用更新版DALL-E的微软Bing Image Creator同样影响了工具判断。
教皇方济各身穿白色羽绒服的形象在Optic工具更新前曾骗过了它的检测。图片来源:Ann-Marie Alcantara/华尔街日报### “一场军备竞赛”
内容标记AI公司Hive也同步更新了其免费AI生成内容检测器以应对不断进化的图像生成器。该工具基于对DALL-E、Stable Diffusion、Midjourney数百万张图像的AI训练,可判定图像和文本来源。除非购买高级服务,Hive将用户查询限制为每日100次。
公司估计其能准确识别约95%的AI生成图像,但广泛传播的伪造图像往往更为逼真。Hive首席执行官Kevin Guo表示,人们分享AI图像时会精选最逼真的假图,这使得辨别真伪愈发困难。
与Optic类似,Hive在识别新版Bing Image Creator生成的图像时也存在困难。
“这是场军备竞赛,“郭先生指出Hive将持续进化,“我们监测所有工具的动态,每当它们更新模型,我们必须同步升级以保持竞争力。”
目前若要验证图像是否AI生成,建议同时使用Optic和Hive的双重检测。只要任一工具提示为生成图像,基本可判定属实。
上下文是关键
多数AI图像生成器正在建立自身防护机制。例如Bing Image Creator会标记并拦截生成知名公众人物图像的指令。Midjourney公司创始人David Holz表示,虽然目前采用人工审核,但正在开发算法审核用户请求的新系统。
你也可以通过训练自己的眼睛来更好地识别虚假图片。
加州大学河滨分校电气与计算机工程教授阿米特·罗伊-乔杜里表示,首先要观察背景:看到图片的场合和时间能帮助你判断其真实性。
注意图片中不协调的部分。罗伊-乔杜里教授指出,比如人物的表情在AI生成照片中可能显得不自然或存在违和感。他补充说,有些图片可能会缺失某些元素,比如镜子或玻璃窗上没有显示人物倒影。
真正的问题或许不在于生成式AI越来越难检测,而在于越来越多人用它来欺骗他人。
“即便技术不算顶尖,它也可能造成非常非常严重的危害,“他表示。
——欲获取更多《华尔街日报》科技分析、评测、建议和头条新闻,请订阅我们的每周通讯。
联系安-玛丽·阿尔坎塔拉,邮箱:[email protected]
本文发表于2023年4月12日印刷版,标题为《检测AI伪造品的工具》。