《华尔街日报》:AI现在为您服务
Lee Hood and Nathan Price
凭借医学训练,医生拥有丰富的知识、经验、智慧和判断力。然而,即便是最杰出的人脑也无法记忆或解读当前关于人类健康与疾病信息总量的冰山一角。就在几年前,大多数医疗决策还完全依赖于医生在做出决定时头脑中的知识。如今,得益于人工智能的快速发展,这一状况正开始改变。
催生出ChatGPT及类似大语言模型的这场技术演进,正使AI成为历史上应用最迅猛的技术之一,它将深刻改变我们的生活和工作方式。其中最重要的变革将发生在医疗健康领域。随着这些系统背后的技术进步,AI很快会像医生、护士、候诊室和药房一样,成为我们医疗体验中不可或缺的部分。事实上,用不了多久,AI就会在很大程度上取代或重新定义所有这些元素。
一系列AI"决策支持系统"已在帮助医生在诊疗时获取海量信息。这些系统充分发挥计算机与生俱来的优势——近乎即时地存储、调取和关联海量信息——并将其与人类专家直觉推理和创造性思维的能力相结合。
当早期所谓的"专家系统"在20世纪80-90年代首次开发时,曾遭到许多医生的抵触,他们担心计算机很快会主导医疗决策,将"医生的触觉"排除在外,并束缚那些与计算机分析意见相左的医生的手脚。但这种情况并未发生。研究表明,这些系统在帮助医生发现可能遗漏的潜在结果方面越来越出色,同时并未剥夺他们最终的决策权。
我们正快速迈向一个时代,届时“半人马医生”——融合人类智慧与人工智能辅助的最佳部分——将能够做出大胆的医疗决策,同时大幅减少意外后果。这一点至关重要,因为仅在美国,医疗失误每年就导致约25万人死亡。可以说,人工智能赋能的医疗已经挽救了无数生命,这并非夸张。
例如,一款名为MedAware的人工智能程序帮助医生避免意外开错药物。该系统由Gidi Stein博士首创,起因是他听闻一名9岁男孩因医生点错选项而死亡——本该开具哮喘药却误开了血液稀释剂。此类错误普遍得可怕:约70%导致不良反应的用药错误属于处方错误。
这个问题为何如此普遍不难理解。美国食品药品监督管理局已批准数万种处方药产品,其中许多名称极为相似。比如诺和灵与诺和锐、长春碱与长春新碱、羟嗪与肼屈嗪。考虑到医生以字迹潦草著称,可以想象在处方多为手写的年代这会造成多大困扰。即便在数字时代,简单的拼写错误或一时记忆模糊仍可能导致开错药。
当医生开具的处方与MedAware评估的患者医疗需求不匹配时,系统会发出警报。若医生试图开具可能与患者现有药物产生负面相互作用的药物——另一个医生从不核对的常见错误——系统也会提示。全球使用MedAware的医院中,医生仍拥有最终决定权。该系统只是提供额外核查,这对超负荷工作的疲惫医生尤为有益。
图片说明:埃德蒙·德哈罗还有另一个优势。犯错的风险常使医生不敢创新思考,将治疗方案局限在少数熟悉的选择上。这些做法最佳状态下虽基于临床试验,但结合人工智能与个人数据云的力量,我们能做得比"遵循平均值"更好。AI辅助的医生能在提供推荐治疗方案前,快速自信地评估数万种可能结果——综合考虑个人独特的基因构成、生化指标、生活方式和病史。
临床决策支持系统还能帮助检测结果更个性化,根据年龄、性别、种族、疾病亚型等因素调整参考范围。麻省总医院计算机科学实验室开发的AI工具DXplain,能根据临床表现提供可能的诊断。随机对照试验显示,使用DXplain的家庭医学住院医师在30个临床病例的诊断测试中表现显著提升,准确率从74%提高到84%。
如今临床决策支持系统还用于辅助实验室检测和结果解读,提供异常指标预警。它们有时能帮助避免使用高风险或有创诊断方案,选择更安全的替代方法。例如肝活检虽是判断乙肝丙肝损伤程度的金标准(比无创检测更准确),但AI模型能整合影像学、血液标志物和遗传学等多源数据,无需活检即可获得更高准确率。
病理报告驱动着许多关键医疗决策,人工智能可用于执行诸如自动肿瘤分级等任务。一项研究表明,人工智能分析膀胱肿瘤的准确率可达93%。如今其他AI系统被应用于患者安全、临床管理、成本控制和诊断支持领域。当患者电子健康档案显示其符合临床试验条件时,某决策支持系统会向医生发出提醒;另一系统则能确保文档准确性——例如确认脾切除术后患者已接种预防细菌感染的疫苗。在临床专家资源有限的地区,这类系统能提供远超当地原有水平的专业护理,具有重大价值。
尽管仍存在阻力,但越来越多医生开始寻求AI系统作为辅助工具。诊断权力格局变动之际,总有人会抵制新技术。但那些将AI融入实践的医生,将为患者(及自身)提供卓越服务。最优状态下,这些系统如同集结了成千上万名专家同时高速协作。由于AI运行成本普遍低廉,其在优化诊疗和大幅降低成本方面潜力惊人。
医疗AI的进步主要得益于可用数据量的激增。所有大型医疗机构都积累了海量电子健康档案(EHRs),记录患者诊疗全过程。2017年研究发现,每位患者年均产生80兆字节数据,包括影像资料、基础检测结果、预后信息等。这尚未计入基因组学、血液分析、肠道微生物组分析和可穿戴设备数据——当我们开始整合这些更庞大的数据集时,它们都将成为每位患者数据云的一部分。
通过将患者数据输入深度知识系统进行分析和解读,医生可以得出针对个体的前沿诊断和治疗方法。佛罗里达大学开发的GatorTron是早期利用大型语言模型进行此类应用的尝试,该系统通过900亿字的电子病历数据进行训练,使其能够提取临床概念并回答医学问题。
为了迎接计算机系统能够推理、决策并向人类解释其决定以获得最终批准的未来,人工智能需要取得新的进展。传统的计算机"专家系统"难以扩展,因为随着规则的堆积往往会变得复杂,导致决策树异常错综复杂。相比之下,人类思维并非纯粹基于规则。与计算机不同,我们非常擅长识别何时不应将规则应用于特定案例或逻辑在何处失效。人类大脑的奇迹之一就是能够应对意外情况。
基于知识的人工智能系统迫切需要类似于推动数据驱动人工智能系统取得突破的进步。这将带来一个"深度学习"与"深度推理"相结合的世界,使人工智能能够理解隐含关系,而不仅仅是那些专门编程到其代码中的关系。这一挑战之所以如此困难,是因为与深度学习不同,在深度学习中增加大量计算能力和数据推动了飞跃,而我们需要概念上的进步才能实现深度推理。
然而很快,这类系统将成为医生在数据爆炸、医学认知与洞察力激增的时代中不可或缺的助手。在近期最可能实现的协作模式中,人工智能将提供一系列附有医生可理解说明的决策建议,使其能够批判性评估底层逻辑。这高度契合了专科医生指导全科医生为患者制定最终诊疗方案的方式。AI不仅将成为强大的健康管理工具,更会成为卓越的教学辅助手段。
随着自然语言处理技术的进步,特别是ChatGPT等大型语言模型的出现,人类与计算机终将能就患者状况展开缜密的推理论证,通过实时交流共同探讨各种可能性。医生将保留最终决策权,同时从海量新数据与知识的学习整合压力中解放——这些本是做出最优决策的必要条件。深度推理终将揭示人类仅凭自身无法察觉的关联与概念。
当AI开始揭示复杂洞见而非简单数据时,医生将扮演什么角色?若这些干预措施有效,即便人类无法解释其原理,我们是否仍会采纳?这看似激进,但需知现有许多药物疗法虽作用机制未完全阐明却依然奏效,人类生理系统的惊人复杂性始终令我们叹服。
历来如此。早在人类理解为何这些化学物质能减轻疼痛和炎症之前,古苏美尔人和埃及人就已经开始利用柳树等富含水杨酸的植物制作药物。尽管由此衍生的现代药物阿司匹林已问世165年有余,但其对人体作用机制的研究至今仍在继续。我们推测,人工智能将如同阿司匹林:即便无法完全理解其原理,人类仍会因其有效性而持续使用。这需要信念的飞跃,但创新往往意味着在真相大白前,需在未知领域探索一段时间。
胡德博士是表型健康公司首席执行官、系统生物学研究所联合创始人兼教授,普赖斯博士是索恩健康科技公司首席科学官。本文节选自他们4月4日由哈佛大学出版社出版的新书《科学健康时代》。
更正与说明肝活检用于评估乙型和丙型肝炎的损伤程度,而非诊断病毒存在(需通过血液检测)。本文早期版本错误地将活检描述为"诊断乙型和丙型肝炎的金标准"。(4月11日修正)