没有事实核查员的Facebook将对真相进行考验 - 彭博社
bloomberg
插图:Sebastian König 为彭博社创作
没有事实核查员的Facebook将考验真相(音频)
11:05
在2021年8月4日,Instagram的事实核查员删除了一条关于药物伊维菌素的帖子。该帖子来自 考克伦图书馆,这是一个高度受尊敬的国际组织,负责整理和总结医学研究。在彻底审查可用数据后,考克伦告诉他们的追随者,他们没有发现支持伊维菌素作为Covid-19治疗方法的证据。
难道Instagram的事实核查员犯了错误?考克伦对此决定提出了上诉;几乎一年后,他们终于收到了通知,称该帖子“违反了社区准则”。与此同时,考克伦注意到用户无法在帖子中提及他们,这表明该账户被“影子禁言”。
在疫情期间,社交媒体平台删除的许多Covid-19帖子确实是虚假信息,从薄弱的阴谋论到与所有科学证据相悖的危险主张。然而,也有像考克伦帖子这样的事件,真正正确和有用的信息被事实核查员删除,可信的账户受到惩罚。
近年来,社交媒体上的事实核查干预措施有所加强,受到Covid-19威胁的推动。但这种情况不会持续太久。马克·扎克伯格最近 宣布 Meta Platforms Inc. — Facebook、Instagram和WhatsApp的拥有者 — 将结束对第三方事实核查员的依赖,以标记虚假内容。相反,公司将让用户为潜在误导性帖子添加上下文,借鉴X平台上使用的社区笔记方法。在这些新规则下,考克伦的帖子将被保留,用户可以自由评估其可靠性。这一转变引发了一个问题:这样的措施能减少社交媒体上的虚假信息吗?准确性能否通过众包实现?
社区笔记
作为伦敦卫生与热带医学学院的一名教授,我专注于传染病疫情的研究,我花了很多时间在线上研究和反驳错误信息。因此,当社区笔记在2022年底在X平台广泛推出时,我对此充满了兴趣。
基本想法很简单:一部分用户对一条帖子写笔记,然后其他用户可以将这些笔记评为“有帮助”或“无帮助”。最有帮助的笔记会与原始帖子一起显著展示。但这不仅仅是收集最多的投票。X的指南指出“笔记需要在过去有时存在分歧的贡献者之间达成一致。”
我不仅仅是告诉我的追随者为什么错误的说法是错误的,我也开始对社区笔记进行评分。最终,我获得了足够的信誉积分,开始撰写自己的笔记。在X上,用户如果将一条笔记评为有帮助或无帮助,并且最终大众给予相同的状态,就会获得一个积分。如果他们将一条笔记评为无帮助,而它最终获得了有帮助的状态,他们会失去一个积分。如果他们认为一条笔记有帮助,但最终却获得了无帮助的状态,他们会失去两个积分。
尽管依赖普通用户而非专业事实核查员,社区笔记通常会得出正确的结论。一项2024年的研究要求专业疾病研究人员评估205条随机选择的关于Covid疫苗的社区笔记。他们发现97%的笔记是准确的,约一半引用了高质量的来源,如原始科学论文。
这样的成功并非单纯的运气。我们有百年统计学的理由来期待社区笔记表现良好。1907年,统计学家弗朗西斯·高尔顿分析了来自英国普利茅斯的一场猜测牛重比赛的数据。尽管个人估计差异很大,但他注意到所有猜测的平均值与真实重量相符。这催生了“群体智慧”的概念——一个群体的平均评估可能比其任何一个成员的评估更准确。
多样化的视角
要使一个群体变得聪明,必须满足两个关键标准。首先,估计必须独立进行,以便贡献者不受彼此的影响。其次,贡献者必须拥有多样化的视角或知识,以便在我们取平均值时,个体猜测中的任何偏见都能相互抵消。
社区笔记在很大程度上满足这些标准。用户在评分之前无法看到笔记是否有用,而来自不同用户的共识需求减少了系统性偏见的可能性。即便如此,X上的群体并不保证是聪明的。用户可能会受到该主题其他帖子影响,某些主题即使用户在其他事情上有多样化的观点,也可能会收到偏颇的评分。实现97%的准确率对于众包疫苗笔记来说似乎很高,但当数百万用户可能接触到危险信息时,这是否足够好?
如果我们想区分真相与虚构,我们理想中希望避免两种潜在错误。我们不想在某事为假时暗示它为真,也不想在某事为真时暗示它为假。但这可能存在权衡:如果平台对删除或标记内容设定了高标准,虽然可以减少审查准确帖子的风险,但也可能让虚假内容漏网。而相反,低标准会捕捉到更多错误信息,但也有可能删除有效的帖子。
尽管依赖于普通用户而非专业事实核查员,社区笔记通常会得出正确的结论。
扎克伯格的公告 表明Meta特别关注事实核查员在后者错误方面的表现。“即使他们意外地审查了仅1%的帖子,那也是数百万人,”他说。社区笔记评分系统表明X对干扰无害内容也有类似的担忧。请记住,如果评估者建议在帖子中添加笔记,而更广泛的群体认为这没有帮助,他们会受到双重惩罚。
规模的好处
社交媒体并不是我们必须平衡惩罚无辜和释放有罪的双重错误的唯一领域。在英国刑法中,“布莱克斯通的比例”表明让10个有罪的人自由比定罪一个无辜的人更好。并非所有司法体系都达成了这一比例:在1930年代的共产中国,被认为“杀死100个无辜的人总比让一个真正有罪的人自由更好。”同样,在线平台在理论上可能具有相同的检测真相的能力,但在实践中对哪种错误更糟糕的态度却存在分歧。
插图:Sebastian König为彭博社提供首先还有一个问题,那就是谁有责任决定什么是真实的。例如,许多欧洲法院依赖法官在情况下作出裁决,而英美法院则常常使用陪审团。从本质上讲,欧洲倾向于信任专业知识来确定真相,而英语国家则将这项工作委托给公众的一个横截面。
与劳动密集型的陪审团服务不同,在线众包评估的一个优势是它具有可扩展性。以维基百科为例,这是一个访问量最大的在线信息资源之一。它利用社区贡献,支持严格的编辑指南,生成了近700万篇文章仅在英语中。研究估计在医学主题如药理学和解剖学方面,维基百科的准确性可以达到99%与黄金标准教科书相当。
维基百科的一个优势是编辑可以随着时间的推移对文章进行迭代以提高准确性。不幸的是,当面对虚假社交媒体内容的紧迫性时,我们并没有同样的奢侈。当我开始在X上撰写社区笔记时,我很快感到沮丧。即使我在虚假帖子出现后几个小时内添加了注释,兴趣往往已经消退。因此,没有足够多的人对我的注释或其他人的注释进行评分,帖子也没有得到纠正。
减缓虚假信息的传播不仅仅是关于事实核查;它还与速度有关。在2014年,Facebook的研究人员发现如果另一位用户评论并提供链接到事实核查网站,删除误导性帖子的机会大约为20%。但采取行动的窗口非常短,即使在纠正之后,流行的虚假内容仍然可以被广泛分享。正如他们所说,“高传播性可以克服暂时的挫折。”
事实与虚构
即使平台采取更大胆的措施试图彻底消除虚假信息,正如他们近年来所做的那样,并非所有内容都可以简单地划分为真/假二分法。麻省理工学院在2024年的一项研究发现,Facebook上那些最能降低对疫苗信任的帖子在技术上是准确的,但给人一种误导性的风险印象。
例如,以下标题在2021年被广泛分享:“一位健康的医生在接种新冠疫苗两周后去世;CDC正在调查原因。”这个陈述在事实上的确是正确的,但并没有提供关于疫苗安全性的完整信息。
研究人员估计,这些准确但误导性的帖子并未被Facebook的事实检查员标记,整体上对疫苗态度的影响是明显虚假帖子数量的50倍。扎克伯格最近告诉乔·罗根,他的公司与拜登政府在如何划定新冠病毒的界限上发生了冲突。“他们强烈要求我们删除那些实际上是正确的内容,”他说。可以说,这些正是那种会从及时的社区注释中受益以增加背景信息的帖子。
如果反应性的更正或删除并不完美,还有哪些其他选项可以减少在线虚假信息?一种替代方案是主动展示来自可信来源的内容。例如,2020年,英国用户在Facebook或Instagram上搜索“新冠”时看到了国家健康服务资源的显著链接。还有证据表明,促使用户思考准确性可以减少大约10%的虚假信息后续分享。
一个更戏剧性——也是更有效——的干预措施是改变社交网络本身的结构。在2017年和2018年,印度发生与WhatsApp上的虚假谣言相关的攻击后,该公司限制了消息转发 至五个人。次年,Pinterest 更改了其搜索功能以阻止反疫苗内容。这些措施可以减少虚假信息的传播,但不足为奇的是,社交媒体公司通常不愿意让他们的平台变得不那么社交。
在大流行期间,关于伊维菌素的虚假声明传播如此广泛的原因之一是,它们承诺了一种简单、低成本的解决方案,可以在不引发广泛社会动荡的情况下减少伤害。看起来像Meta这样的公司现在对社区笔记的承诺寄予了非常相似的希望。
亚当·库查斯基是伦敦卫生与热带医学学院的教授,也是几本关于数学和科学的书籍的作者。他的最新书籍, 《证明:不确定性的科学》 (Profile) 预计将在2025年3月出版。