《华尔街日报》:打假科学家团队揭穿不良科研行为
Nidhi Subbaraman
一位屡获殊荣的哈佛商学院教授兼研究员花费多年时间探究人们撒谎和欺骗的原因。三位行为科学家在审阅她的数篇学术论文后得出结论:她本人的研究发现源自伪造数据。
对于乔·西蒙斯、莱夫·尼尔森和尤里·西蒙松这三位科学家而言,这不过是又一次常规打假——他们因揭露基于错误或欺诈数据的已发表研究而享誉学界。他们运用线索、数据分析和直觉来识破骗局。过去十年间,他们得出了自己的结论:数字不会说谎,但人会。
“当你发现多篇论文中存在相同模式时,存在合理解释的概率就微乎其微了,“宾夕法尼亚大学沃顿商学院教授西蒙斯说道。他与两位同事在名为"数据可乐"的博客上公布打假成果。
西蒙斯和他的两位同事是全球各领域日益壮大的"数据侦探"科学家群体中的成员,这些学者利用业余时间筛查学术期刊论文中的欺诈证据。
根据追踪撤稿情况的网站"撤稿观察"统计,2022年至少有5500篇问题论文被撤回,而2002年仅有119篇。该网站联合创始人伊万·奥兰斯基博士表示,这一激增主要归功于"数据可乐"团队及其他学术志愿者的调查工作。他们的发现导致尴尬的撤稿、职业生涯的颠覆,甚至引发报复性诉讼。
神经科学家马克·泰西尔-拉维涅因多年来其发表研究中的数据问题受到批评,于上月辞去斯坦福大学校长职务。科学家剖析已发表研究的网站PubPeer上的帖子引发了《斯坦福日报》的审查。随后大学展开调查,他参与合著的三项研究被撤回。
马克·泰西尔-拉维涅于今年8月辞去斯坦福大学校长职务。图片来源:Winni Wintermeyer/《华尔街日报》斯坦福大学调查结论显示,尽管泰西尔-拉维涅本人未参与研究不端行为或知晓他人的不端行为,但他"未能果断坦率地纠正科学记录中的错误”。仍保留教职的泰西尔-拉维涅拒绝置评。
追查误导性研究的意义远超学术范畴。存在缺陷的社会科学研究可能导致企业对消费者行为做出错误决策,或使政府制定不当法规政策。错误的医学研究则可能危害患者。所有领域的研究者都可能因推进最终被证实为欺诈性的发现,而浪费数年时间和数百万美元资助。
数据侦探们希望他们的工作能在公众对科学的信任度下降之际保持科学的诚实性。西蒙斯等人指出,发表论文的压力——这能带来工作机会、研究经费、演讲邀约和企业顾问席位——驱使研究者追逐独特而有趣的发现,有时甚至以牺牲真相为代价。
“那些缓慢、优质、严谨的科研工作简直让我抓狂——如果你坚持这种工作方式,就意味着你的论文产出更少,“西蒙斯说,“显然,如果你伪造数据,什么结果都能做出来。”
《自然》杂志本月就提醒读者注意一篇关于室温超导体发现的论文引发的质疑——如果属实,这将是影响深远的重大科学发现。审查该研究的物理学家表示数据存在矛盾。领导这项研究的罗切斯特大学物理学家兰加·迪亚斯未回应置评请求,但一直为自己研究辩护。他参与合著的另一篇论文在调查显示部分测量数据系伪造后,已于八月被撤稿。迪亚斯更早的一篇论文去年也被撤稿。目前校方正对其更多研究成果进行严格审查。
那些审查已发表研究中可疑数据的专家们,将每一次对有缺陷论文的撤稿或更正都视为科学诚信与透明度的胜利。“拆墙需一砖一瓦进行,“澳大利亚莫纳什大学的医生兼研究员本·摩尔说道。他专门调查妇产科临床试验,其举报已促使期刊撤回了约100篇论文,另有70篇正在调查中。
从事其他科学家工作审查的专家包括伊丽莎白·比克,这位前微生物学家擅长识别分子生物学实验中的图像篡改;以及悉尼大学癌症研究员珍妮弗·伯恩,她协助开发了筛查论文中错误序列的软件,这些错误表明实验不可能成功。
“若将侦探们排除在外,“奥兰斯基说,“很难想象这些撤稿多数会如何。”
加州大学伯克利分校的莱夫·尼尔森(左)与乔·西蒙斯。图片来源:《华尔街日报》伊恩·贝茨### 意外造就的专业
数据可乐达的起源可追溯至1999年的普林斯顿大学。当时同为研究生的西蒙斯和尼尔森,在名为"吉布森5000"的翻唱乐队和名为"心理塑性"的垒球队中相识。尼尔森与西蒙松于2007年在加州大学圣地亚哥分校商学院共事时相熟。
三人组成为了朋友,并于2011年联合发表了他们的第一篇论文《虚假正向心理学》。文中包含了一个讽刺性实验,该实验使用公认的研究方法证明:听披头士歌曲《当我六十四岁》的人会变得更年轻。他们想展示研究标准如何能得出荒谬结论。“他们因此有点传奇色彩,“多伦多大学士嘉堡分校心理学家约埃尔·因巴尔说。这项研究成为《心理科学》期刊被引用次数最多的论文。
当三人组在2013年创建"数据可乐"博客时,它成为了讨论统计工具和数据分析利弊的平台。“初衷只是吸引少量读者且不让自己难堪,“西蒙斯说。随着时间的推移,“我们意外地练就了识别学术欺诈的能力。”
他们合著了一篇2014年发表的文章,创造了如今常见的学术术语"p值操纵”,指通过选择性使用数据或分析方法,使不显著的结果在统计上显得可信。他们的早期工作推动了研究方法的变革,包括共享数据以便其他科学家复现已发表成果的实践。
“这三位在开发验证研究可信度的新方法论方面做出了惊人贡献,“位于弗吉尼亚州夏洛茨维尔的非营利组织"开放科学中心"执行主任布莱恩·诺塞克表示,该机构致力于推动可靠研究。
尼尔森在加州大学伯克利分校哈斯商学院任教,被他的合作伙伴们称为大局观者,能够跳出细枝末节,把握宏观视角。
西蒙索恩则是技术奇才,对晦涩的统计方法驾轻就熟。“这简直是一种超能力,“尼尔森说。西蒙索恩是第一个学会如何识别数据集中欺诈痕迹的人。
西蒙索恩表示,合作过程"感觉就像一台拥有三个核心处理器并行工作的计算机”。
两人首先会直观检查数据,看其在研究背景下是否合理。西蒙索恩在博客上审查的第一项问题数据研究非常明显:参与者被要求用0到10分评价某个体验,但数据集中却出现了无法解释的负值。
西班牙巴塞罗那Esade商学院的乌里·西蒙索恩。图片来源:Edu Bayer/华尔街日报另一个危险信号是违背常理的结论——比如某项研究称短跑运动员能在半秒内跑完100码。这类发现总会受到二次核查。“你立刻就知道这不可能,“在西班牙Esade商学院任教的西蒙索恩说。另一个蛛丝马迹是小数据集中过于完美的数据,真实世界的数据应该是混乱且随机的。
任何这类迹象都可能引发对论文原始数据的审查。“这只是无心之失?还是p值操纵?“西蒙斯说,“我们从不轻易断言存在欺诈。”
为了跟上他们的博客和其他事业,三人几乎每天都在群聊中发短信,每周大约在Zoom上见面一次,并且不断通过电子邮件联系。
西蒙松的手机在八月响起,当时他正与家人在西班牙山区度假。西蒙斯和纳尔逊传来消息,他们因诽谤被起诉,面临2500万美元的诉讼。
“我完全惊呆了,感到非常害怕,”纳尔逊说。
‘她通常是对的’
不良数据在学术期刊中未被发现,很大程度上是因为这些出版物依赖志愿专家来确保发表作品的质量,而不是检测欺诈。期刊没有专业知识或人员来检查基础数据是否存在错误或故意操纵,《科学》系列期刊的主编霍尔顿·索普说。
索普表示他与比克和其他揭露者交谈,并指出大学和其他期刊编辑也应该这样做。“没有人喜欢听到她的消息,”他说。“但她通常是对的。”
他表示,这些数据侦探已经推动期刊更加关注纠正记录。大多数期刊已经聘请人员来审查不良数据的指控。出版《自然》和约3000种其他期刊的施普林格·自然公司有一个由20名研究人员组成的团队,该公司的研究诚信总监克里斯·格拉夫说,这比他2021年接手时多了一倍。
撤稿观察与研究组织Crossref合作,记录了过去一个世纪中约5万篇被质疑的论文,估计截至2022年,每1万篇发表的研究中约有8篇被撤稿。
比克和其他人表示,期刊可能需要数月甚至数年来解决针对可疑研究的投诉。比克指出,在2014至2015年间她向40家期刊举报的近800篇论文中,约有三分之一存在误导性图像问题,但五年后仅三分之一得到更正或撤稿。
这项工作并非没有风险。法国传染病专家迪迪埃·拉乌尔特曾威胁起诉比克,因她指出其合著的数十篇论文存在错误,包括一篇鼓吹羟氯喹治疗新冠疗效的研究。拉乌尔特表示坚持其研究结论。
伊丽莎白·比克在加利福尼亚家中。图片来源:克拉拉·莫克里为《华尔街日报》拍摄### 诚信研究
西蒙松在2021年收到关于哈佛商学院教授弗朗西斯卡·吉诺所发表论文数据的线索。这位备受尊敬的学者主要研究道德议题:为何有人会说谎?何种诱因驱使他人作弊?哪些因素影响道德行为?
三位科学家核查了四项研究的基础数据,发现部分条目存在异常。数据集中的数字似乎被人工篡改。2021年12月,他们将发现提交给校方,哈佛随后启动了独立调查。
根据吉诺对哈佛大学、尼尔森、西蒙斯和西蒙松提起的诉讼,哈佛大学认定吉诺“对‘学术不端行为’负有责任”。哈佛商学院要求发表这四篇论文的期刊予以撤稿,称其研究结果无效。
今年六月,这三位学者在Data Colada上发布了关于吉诺研究的结论。他们指出,四篇论文中的数据存在篡改。当他们在其中一项研究中还原其假设的正确信息时,结果并不支持原研究的结论。相关博文引发了社会科学界的轩然大波。
吉诺目前处于行政停职状态,学院已启动撤销其终身教职的程序。吉诺在诉讼中称,哈佛的调查存在缺陷且因她的性别而带有偏见。商学院发言人拒绝置评。诉讼还指出,Data Colada的博文对其构成不实欺诈指控。三位科学家表示坚持其公布的调查结果。
吉诺通过律师否认存在不当行为,并索赔至少2500万美元损害赔偿金。“我们坚决反对使用‘欺诈’一词的任何暗示,”吉诺的律师安德鲁·米尔滕伯格表示。吉诺本人拒绝发表评论。
米尔滕伯格称吉诺正在准备对Data Colada结论的反驳材料。
八月,13名科学家组织的筹款活动在一个月内募集超30万美元,用于支付Data Colada的法律费用。
“这些人正在发出代价高昂的信号,”西蒙斯说,“他们真金白银地表明‘是的,科学批评至关重要’。”
写信给Nidhi Subbaraman,邮箱:[email protected]
刊登于2023年9月25日的印刷版,标题为《揭穿者揭露不良科学家》。