你能判断这个标题是机器人写的吗?——《华尔街日报》
Christopher Mims
你可能没有注意到,但你在互联网上阅读的部分内容很可能出自机器人之手。而且这种情况很快就会变得更加普遍。
根据工具开发者、研究该软件的学者以及投资内容自动生成公司的投资者所述,生成文本的人工智能软件已经足够复杂,其输出常常难以与人类写作区分开来。越来越多的公司正试图利用这项技术,自动化生成我们可能依赖的信息。
“对于日常使用互联网的大多数人来说,很可能已经接触过AI生成的内容,”华盛顿州斯波坎市一家小型搜索引擎优化公司的负责人亚当·克罗尼斯特说。他补充道,他所在的专业搜索引擎优化团体中的每个人都在某种程度上使用这项技术。克罗尼斯特的客户包括数十家中小型企业,对于其中许多客户,他使用定制的人工智能软件快速生成在谷歌搜索结果中排名靠前的文章——这种做法被称为内容营销——从而将这些网站的潜在客户吸引过来。
“我们的大多数客户不希望外界知道他们的内容是由AI撰写的,”Glimpse.ai的首席执行官亚历克斯·卡迪内尔说,该公司开发了克罗尼斯特使用的服务之一Article Forge。当被要求撰写一篇关于小企业贷款的文章时,该公司的AI生成了一篇1500字的文章,开头写道:“在申请小企业贷款之前,研究你有资格获得哪种类型的贷款很重要。”该公司有许多竞争对手,包括SEO.ai、TextCortex AI和Neuroflash。
谷歌公司发言人表示,谷歌清楚AI生成内容出现在搜索结果中的现象,并对此持开放态度,前提是AI生成的内容对阅读者有所帮助。她补充道,语法检查器和智能建议——谷歌自身工具中提供的技术——与AI内容生成一脉相承。
“我们的排名团队关注的是内容的有用性,而不是内容的生产方式,”谷歌搜索公共联络员丹尼·沙利文说。“这使我们能够创建解决方案,旨在减少搜索中所有类型的无用内容,无论是由人类还是通过自动化流程生成的。”
AI内容服务正在蓬勃发展。它们使内容创作者更高效,但也能够生产出无人能分辨出是机器制作的内容。这通常也适用于其他类型的AI生成内容,包括图像、视频、音频和合成客服代表。
由人工智能服务Dall-E生成的插图,提示词为“机器人在传送带上分类社交媒体应用”——这是对本专栏顶部人类创作插图的描述。图片说明:Dall-E 2022与其他类型的自动化一样,让AI处理对人类来说往往是苦差事的基础写作任务有许多潜在好处。话虽如此,广泛且无法检测的合成内容也存在相当大的危险。首先,它有可能取代一个庞大而繁荣的人类工作者生态系统,就像之前许多受自动化影响的行业一样,由数量不断减少的大型实体取代,从而拥有更大的力量来塑造人们的想法。在最坏的情况下,它可能给不良行为者提供一个强大的工具,在战争等危机时刻传播欺骗。
人工智能生成内容的兴起得益于一种被称为计算创造力、人工创造力或生成式AI的现象。根据企业家Anne-Laure Le Cunff收集的数据,这一领域在两三年前仅有少数几家公司,如今已激增至超过180家初创企业。尽管科技投资整体环境低迷,这些公司近几个月仍获得了数亿美元的投资。
使用相同机器人手部提示词生成的第二幅Dall-E插图。像"Madial"这类无意义词汇频繁出现在AI生成图像中。图片说明:Dall-E 2022荷兰莱顿大学高级计算机科学研究所助理教授Peter van der Putten表示,我们网络上遇到的许多内容已是自动生成的,而自动内容生成系统的应用才刚刚开始。“未来两三年世界将大不相同,因为人们会大量使用这些系统,“他补充道。
到2025年或2030年,互联网上90%的内容将是自动生成的,研究生成式AI及其陷阱的2020年书籍作者尼娜·希克表示。她补充说,并非我们看到的每10样东西中有9样是自动生成的,而是自动生成将极大增加可用内容的数量。其中一些可能以个性化的形式出现,比如包含合成视频或根据个人口味定制的演员的营销信息。此外,很多可能只是社交媒体上分享的自动生成内容,比如人们只需向内容生成服务输入文本提示就能创建的文本或视频片段。
以下是即将大量出现的合成媒体的几个例子:艺术家、营销人员和游戏开发者已经在使用Dall-E、Midjourney和Stable Diffusion等服务,以不同艺术家的风格创作细节丰富的插图,以及照片般逼真的幻想作品。Facebook母公司Meta Platforms的Meta AI部门的研究人员在9月公布了一个可以从文本提示自动生成视频的系统,而谷歌在10月推出了一个看起来更复杂的版本。
范德普顿博士和他的团队开发了一个系统,能够撰写符合任何报纸风格的新闻文章。(《华尔街日报》拥有自己的AI文章写作工具,该工具是与Narrativa合作开发的,这是一个“语言生成AI系统”,帮助人类作者生成部分市场更新。)
自动文本生成系统正在帮助小说家加速写作过程,驱动客服聊天机器人,并支持一项名为Replika的服务,数十万人将其视为他们的人工男友或女友——许多人表示他们已经爱上了它。
这种人工创造力的一个缺点是可能削弱信任。以在线评论为例,AI正在加剧欺骗行为。Fakespot的首席执行官萨乌德·哈利法表示,算法生成的虚假评论在亚马逊和其他平台上呈上升趋势,该公司开发了一款浏览器插件,用于标记此类伪造内容。他补充说,根据他们公司的检测系统,虽然大多数欺诈性评论仍由人类撰写,但约20%是由算法生成的,而且这一数字还在增长。
插图:詹姆斯·斯坦伯格过去,亚马逊曾表示,Fakespot无法判断其网站上的哪些评论是真实的,因为它无法获取公司的内部数据。该公司还表示,顾客在其网站上阅读的评论中,超过99%是真实的。
值得注意的是,这些系统生成的许多内容存在错误或人类不会出现的怪癖。人工智能产生的一些内容仍需要人类进行审查,并在某种意义上进行编辑。
例如,范德普滕博士的报纸文章写作AI可以自动以更具党派色彩的媒体的语气和政治倾向重写一篇直白的新闻文章,但其输出也可能包含事实性错误。(例如,在一篇文章中,它将荷兰的首都标识为海牙。)
OpenAI软件根据“宇航员骑马”的请求生成了这张图片。照片:OpenAI/法新社/盖蒂图片社AI生成的图像中常常有奇怪的伪影。特别是Dall-E,它在渲染手或正确绘制人或动物的肢体数量方面表现不佳。从文本提示自动生成视频的系统只能生成短视频片段,就输出质量而言,目前是所有这些系统中最原始的。
但在熟练的人类和复杂的人工智能的交汇处,结果可以与人类单独创作的结果一样好,甚至更好,而且可以更快地生产出来,使人类创作者更具生产力。例如,虽然克罗尼斯特先生的团队使用AI文本生成服务为某些客户创建内容库——比如回答常见的管道问题,旨在吸引人们访问当地水管工的网站——但他的作者仍然会审查这些内容,并可能对其进行编辑,以进一步增强其对谷歌搜索算法的吸引力。“它不会取代作者,但可以补充他们的创作过程,”他补充道。
Hour One是一家通过创建照片级真实的人物虚拟版本,并使其能以原声自动朗读任何输入文本,从而实现“克隆”真人的公司。目前效果仍略显生硬。在YouTube红人Dom Esposito使用该技术制作自己虚拟副本的视频中,可以明显区分哪些片段是自动生成,哪些是真实的Esposito本人。
但这项技术正在快速发展。最近,一个深度伪造版的演员基努·里维斯席卷TikTok,在该应用上获得超5.5亿次观看,并欺骗许多观众信以为真。其他名人如汤姆·克鲁斯,也正被深度伪造技术处理。
Hour One战略主管Natalie Monbiot表示,除了可信度差异外,其公司生成的虚拟演员与这些深度伪造内容的主要区别在于授权方式。Monbiot女士的公司会向同意授权虚拟形象用于商业用途的演员支付报酬,客户包括需要教学视频虚拟主持的企业。而深度伪造目前处于法律灰色地带,创作者与被模拟者之间通常不存在授权关系。
互联网充斥着AI生成内容的风险多种多样。首先,许多内容生成AI存在众所周知的偏见。例如,一位AI研究员最近记录显示,在Stable Diffusion AI图像生成器中输入"雄心勃勃的CEO"一词时,没有生成任何女性高管的图像。关于AI偏见的讨论存在两面性——一方面,缺乏问责机制时,AI可能像人类一样做出带有偏见的决定;另一方面,当由软件生成内容或决策时,审计和系统性纠正这些偏见可能更容易实现。
更广泛的风险在于,随着顶尖创作者和公司生产力提升,他们能生成远超人类个体管理能力的内容。根据人们对这类内容的喜爱程度及其低廉的创作成本,我们最终可能进入这样一个世界:每天在互联网消费的大部分内容由越来越少的人和公司创造。Coinbase开发者安德烈·里斯科夫在近期文章中描述了这个反乌托邦的极端版本:从搜索结果、短视频到精心设计以求病毒式传播的社交媒体帖子,互联网的某些部分最终可能几乎完全由人工智能生成。
希克女士表示,即使人工智能生成的内容不会完全占领整个互联网,但随着其日益普及,我们所有人都可能比现在更不信任所看到的一切,这种风险确实存在。可以说,这种情况已经发生——人工智能通过算法推送符合我们偏见、加剧立场分化的内容。但随着算法生成的内容比以往任何时候都多,且可能专门针对我们的世界观和倾向量身定制,这种情况可能会变得更糟。
“这就是’骗子红利’,“希克女士说。“如果任何东西都可以伪造,那我为什么要相信任何东西是真实的?”
欲获取更多《华尔街日报》技术分析、评论、建议和头条新闻,请订阅我们的每周通讯。
联系克里斯托弗·米姆斯,邮箱:[email protected]