《逃离模型乐园》评论:被数字诱惑——《华尔街日报》
David A. Shaywitz
图片来源:盖蒂图片社/500px Plus套用一句陈词滥调——我们生活在一个信息时代,确切地说是信息过载的时代。但伦敦政治经济学院统计学家埃丽卡·汤普森指出:“测量数据本身不会说话。“她强调,数据"只有通过模型提供的背景和框架才能获得意义”。
当我们需要了解新型传染病毒的传播速度时,会求助于数学模型。气候科学家用模型预测全球变暖;期权交易员用模型为合约定价;国会预算办公室用模型评估立法对经济的影响;气象学家用模型预警即将来临的暴风雨。汤普森表示,若没有模型,数据"不过是毫无意义的数字流”。
模型无处不在且极具说服力,它们还推动着决策制定——在汤普森看来,这正是我们需要迫切关注模型的原因之一。她告诉我们,作为研究北大西洋风暴的研究生时,她注意到不同模型会预测出不同的整体影响并产生矛盾结果。由此她开始思考模型的角色——作为隐喻工具、认知手段和社会政治权力的表达。《逃离模型大陆》一书凝练地总结了她这些年的思考与研究。
模型试图再现现实世界,却游离于现实之外。它们存在于被汤普森称为"模型大陆"的理想化空间。在这片大陆上,模型假设被视为"绝对真理",从而支持无限推演与宏大预测。问题在于,模型大陆易入难出。汤普森写道,当构建出"一个完美自洽的模型"后,人们往往"难以从情感上接受整个体系的基础假设根本不符合现实"。
模型可能以各种方式误导我们。输入数据中的微小测量误差可能导致预测结果严重失准——这种现象被称为“蝴蝶效应”。幸运的是,这类不确定性通常可以控制。更棘手的是汤普森女士所说的“不可量化的未知因素”——那些因无法预见而被排除在模型计算之外的事物,比如颠覆性技术的意外出现或稳健市场的突然崩溃。她指出,我们现有的数据并不总是与未来相关,正如1987年股市崩盘时交易员们的惨痛教训:他们的模型在那场灾难中彻底失效。
除了模型天生无法处理不可预测因素外,它们还反映了创造者的偏见。我们可能倾向于认为模型是客观真理的表达,但它们实则是人为构建的阐释,浸透着建模者的价值观和视角——汤普森特别指出,这些建模者主要是受过良好教育的中产阶级人士。疫情期间,模型“对某些人群所受伤害的考量远多于其他群体”,导致支持封锁的“道德理由”存在“片面性与偏见”。当建模者居家办公时——而其他人维持着供应链运转——他们常常忽视模型所建议措施“可能造成的所有危害”。即便模型试图描述不同行动方案的影响,最终仍需人类来权衡利弊。“科学无法告诉我们如何评估事物的价值,”汤普森强调,“所谓‘遵循科学’的说法毫无意义。”
汤普森女士认识到,模型的潜力与风险在生物医学领域引起深刻共鸣——酵母菌和斑马鱼等所谓模式生物带来了基础性发现,加速了疗法研发。然而在"模型世界"表现卓越的治疗方案,往往在人体中失效,既摧毁患者希望,又令药企沮丧。当某种模型的支持者压制替代方案研究时(已故记者莎伦·贝格利在2019年一份重磅报告中曾记录此类现象),改进疾病模型的探索会变得尤为复杂。汤普森犀利批判了单一"黄金标准"模型的采用,指出特定假设体系的"固化"会禁锢思维,阻塞其他重要研究路径。
统计学家乔治·博克斯曾言:“所有模型都是错的,但有些是有用的。“对汤普森而言,模型的真正价值在于作为探索工具,而非揭示真理或预测未来的机制。“构建模型的过程会改变我们看待问题的方式,“她写道;这个过程会"强化某些观念,弱化其他观念”。援引艾森豪威尔总统的名言"计划无用,但规划不可或缺”,她指出仅关注模型输出会错失建模过程的核心价值:更深入理解权衡取舍,以及在基础假设突变时灵活调整的能力。
尽管承认人类"对数学解决方案的过度热衷”,汤普森坚决主张不应弃用模型,而需保持审慎与谦卑。她强调必须明确模型用途:流行病学模型能揭示病毒传播与医院压力,却无法预测关停企业的经济影响。建模者应承认模型中隐含的价值判断,阐明何为"好"模型,并说明局限性。但关键在于,既要汲取模型智慧又不被其精致外表迷惑,更要确保"模型世界"的启示能在真正重要的领域——我们混乱、物质而瑰丽的现实世界——得到实质性体现。
Shaywitz博士是武田制药的医师科学家,哈佛医学院的讲师,以及美国企业研究所的兼职研究员。
刊登于2022年12月28日的印刷版,标题为《被数字诱惑》。