《丑闻震撼癌症科学对你的健康有影响-彭博社》
F.D. Flam
又是一天,又是一个丑闻。
摄影师:Maddie Meyer/Getty Images癌症生物学领域一团糟。在最近的丑闻之前,一些问题的迹象早在多年前就出现了,调查人员发现哈佛大学附属达纳·法伯癌症研究所的一系列备受关注的论文中存在数据篡改的证据。
这是学术研究领域的最新危机,需要更好的质量控制——比同行评议更严格的过滤器。一些研究人员认为,人工智能可能有助于指出哪些论文需要更仔细地审查。
但要理解正在发生的事情,我们必须了解我们是如何到达这里的。十年前,一些研究监督者开始发出警报,之后科学家们发现少于一半的“里程碑”临床前癌症研究——即顶级期刊上的研究——能够复制。
2021年,一项类似的评估发现炒作是常态。研究人员发现他们只能重复193项实验中的50项。而且在那些得到复制的实验中,第二次尝试显示出的效应规模要小得多——仅为最初声称的大小的15%。
这些是在试管或小鼠中进行的实验,确定哪些治疗方法会在人体中进行测试。它们还影响着试验对象对风险和益处的了解。因此,结果会影响真实人的生活。
虽然数据篡改的证据——达纳·法伯科学家被指控的行为——与不可重复的结果是不同的问题,但两者都源于相同的根本原因。科学家通过获得引人注目、潜在影响巨大的发现而获得名望和财富,但人们受益于坚实且可重复的发现。我们也受益于显示哪些治疗方法不太可能奏效的发现,尽管这些发现很难发表。
诺贝尔奖得主威廉·凯林在2017年曾经警告过我,生物医学研究人员已经开始以更脆弱的证据提出更大的主张。(他也在达纳·法伯工作,但他的工作没有被卷入当前的丑闻。)
当然,科学家是允许犯错的。但他们应该准确呈现他们测量到的数据。任何图表都应该代表测得的数据。未经解释地添加、减少或更改数据通常被视为欺诈行为。
虽然案件仍在调查中,达纳·法伯计划撤回六篇论文并在更多论文中发布更正。某些论文中的问题可能是意外的,但有很多问题——这样的错误仍然会对研究结果产生怀疑。
数据操纵是司空见惯的,Retraction Watch博客的联合创始人伊万·奥兰斯基说。“让我担心的是,我们会继续把这看作是一种奇怪的异常,但事实并非如此。”
另一方面,一项无法复制的研究可能是按照所有规则进行的,但结论并不是你想拿癌症患者的生命去打赌的。研究人员可能误解了他们的数据,或者实验可能只在非常特定的条件下有效。
那么,为什么同行评议没有阻止发表薄弱的结果和彻头彻尾的欺诈呢?首先,许多论文不包括原始数据,使欺诈难以发现。
但在更深层次上,同行评议并不是许多人所认为的质量控制措施。一些历史学家将同行评议追溯到1830年,当时英国哲学家威廉·惠威尔提议在一本新期刊《伦敦皇家学会会议录》上发表论文时采用同行评议。在第一次尝试中,惠威尔自己担任了这项工作,但无法与第二位审稿人达成一致意见,从而开启了一项被全世界科学家诟病已久的悠久传统。
社会科学家、西北大学凯洛格管理学院的布赖恩·乌兹曾表示,审稿人通常有足够的专业知识来评估论文的90%或95%。“你会把最后的5%留给希望另一位审稿人能够发现。但也许另一位审稿人也在做同样的事情,”他说。审稿人通常也会因为时间紧迫、被其他审阅请求和自己的研究义务压得喘不过气来。
Uzzi 发现,在社会科学领域存在长期的可重复性危机,机器学习可以标记 最有可能无法复制的论文。他利用数百次尝试复制的数据来训练一个系统,然后在他有复制数据的300个新实验上进行测试。这个机器学习系统比单个人审阅者更准确,而且成本低廉,几乎是瞬间完成。
也许这样的系统可以帮助人类专家更多地标记粗心和不诚实的工作。它还可以帮助过度工作的审稿人和期刊编辑远离那些往往受到最多关注的著名科学家和机构,转向不那么知名的团队的重要发现。
科学家们已经创造了大量新的研究论文,因此增加一层质量控制并投入更多时间和金钱来区分好的论文和坏的论文并不会有害。否则,我们将为所有那些糟糕的研究买单 —— 不仅是用我们的税款,还有我们的健康。
更多来自彭博观点的 F.D. Flam 文章:
- 穆斯克必须更 透明地对待 Neuralink
- 我们不知道应该有多担心 关于纳米塑料
- 美国食品药品监督管理局需要找到 直发剂致癌物的根源
想要更多彭博观点吗? OPIN <GO>****。 或订阅我们的 每日新闻简报。