《华尔街日报》:科技如何加速揭露劣质科研的进程
Nidhi Subbaraman | Photographs by Michael Rathmayr for The Wall Street Journal
达纳-法伯癌症研究所在1月初收到投诉,指控资深研究人员的数十篇论文中存在图像篡改迹象。数日后,该机构宣布将撤回或修正部分研究,引发科学界震动。
同月,麻省总医院布里格姆分院与哈佛医学院也收到投诉:另一位教授合著的近30篇论文似乎包含复制或伪造图像。
这些投诉来自不同的质疑者,但存在共同点。两位科学家——分子生物学家肖尔托·大卫和图像专家伊丽莎白·比克——在分析中都使用了同一款工具:名为Imagetwin的图像扫描软件。
近期问题科学论文曝光背后,是维也纳公司开发的Imagetwin和以色列公司研发的Proofig AI等软件。这些工具帮助科学家筛查数百项研究,极大加速了识别欺诈性图像的过程。
在这些工具出现前,数据侦探们需要肉眼审查已发表研究中的图像,耗时从几分钟到一小时不等,且依赖个人识别模式的能力。如今,技术工具将这一过程自动化,一两分钟内即可标记问题图像。
在一次演示中,Imagetwin分析上传的照片,并从其数据库中找出外观相似的图像(以绿色框高亮显示)。科学图像为我们提供了窥见原始数据的罕见机会:数百万像素整齐地排列在论文文本旁。常见的图像类型包括组织切片和细胞的照片。研究人员表示,在显微镜下,取自不同动物的组织样本绝不应看起来相同,两种不同的细胞培养物也不应相同。
当它们看起来相同时,这就是一个危险信号。
比克花了十多年时间仔细检查科学图像,并在2000多篇被撤回或更正的论文中发现了危险信号。
比克大部分时间都在寻找照片中不应存在的重复或篡改。她说,这就像看一张一家人围坐在餐桌旁的照片,但乔叔叔的脸出现了两次。
特别是Imagetwin提供了一项人类侦探无法复制的功能:它将一篇论文中的照片与一个包含5100万张图像、回溯20年的数据库进行比较,标记出从先前研究中复制的照片。“这是一个人类永远无法做到的惊人发现,”比克说。
伊丽莎白·比克已经分析科学图像十多年了。照片:克拉拉·莫克里为《华尔街日报》拍摄通过使用该工具以及谷歌的图片搜索工具对网络进行梳理,比克最近发现,2022年发表在《自然-通讯》期刊上的一篇论文包含的图片,与十几处其他来源的图片看起来完全相同。这属于比克今年早些时候向哈佛医学院和布莱根妇女医院报告的近30项研究之一,这些研究的共同作者均在该机构工作。
2020年,比克曾获准试用由马库斯·兹拉宾格开发的软件早期版本,该工具是兹拉宾格在读研期间完成的硕士论文成果。
在比克于社交媒体称赞Imagetwin后,几家出版商联系兹拉宾格询问购买事宜。但存在一个问题:“我无法出售任何产品,“他回复道,“我没有公司。”
兹拉宾格邀请大学时期攻读经济学的朋友帕特里克·斯塔克加入。两人因共同热爱体育和沙滩排球而结缘。2022年,他们联合创立了Imagetwin AI初创公司,并获得了奥地利政府的资助以支付初期成本。
创始人表示,自当年上线以来,Imagetwin的客户包括多所知名大学和科学出版领域的部分顶尖机构。
这些工具(Proofig每份手稿收费35至50美元,Imagetwin每篇论文约27美元,订阅方案各异)为提升已发表科研成果的质量提供了可能。且有证据表明,该软件正在产生实质影响**。**
现有的期刊论文发表评审体系并非为防范学术欺诈而设计。数十年来,像比克这样的志愿研究者一直在X(原推特)和PubPeer等公共讨论平台上揭露已发表论文中的错误,这常常引发期刊、作者及研究机构之间漫长且充满争议的审查过程。
Proofig软件开发商创始人德罗尔·科洛德金-加尔表示,技术手段可以避免这种"发表后验尸"的情况。该工具能在几分钟内比对论文中的图像,并标记出复制或篡改痕迹。
在拥有百年历史的《临床研究杂志》使用Proofig的首年,这款软件使已通过同行评审论文的拒稿率从1%提升至3%。这些被编辑接受的论文中,存在图像重复或错误等本应被淘汰的问题。
该刊执行主编莎拉·杰克逊透露,在采购软件前,他们依赖眼力过人的员工人工核查录用论文中的所有图像。
《科学》期刊集团总编霍尔登·索普表示,经过去年试点后,未来所有论文在发表前都将通过Proofig进行扫描。**”**我们发现了本不该发表的论文。“他说道。
即便如此,这项技术也并非完美无缺。
“它不像计算器那样直接给出答案,"《自然》及约3000种其他期刊的出版商施普林格·自然的科研诚信总监克里斯·格拉夫表示。该出版商的编辑们使用Proofig或内部工具扫描待审或调查中的论文,但他们会逐一评估每一处警示标记。
使用Imagetwin的比克指出,该工具有时会漏检低对比度图像中的问题,有时又会高亮显示本应相似的一系列图像,比如以分钟或秒为间隔的时间序列实验数据。
演示中,Proofig生成的报告显示多组图像间的相似性。图片来源:Proofig就在技术创新助力检测不可靠科研的同时,科技也带来了新难题。如今复杂算法已能伪造科研论文文本,研究者们担忧这些技术也将被用于制造虚假实验图像。
Imagetwin和Proofig都在尝试识别AI生成内容,它们相信即便人眼无法区分算法生成的图像与真实图像,终有一日其软件能够做到。
联系记者尼迪·苏巴拉曼请致信[email protected]