《华尔街日报》：ChatGPT即将为您看诊——医生开始用AI回答患者问题

Nidhi Subbaraman

2023-04-28

每位医生的医疗建议背后都蕴含着丰富的知识，但很快，全国各地的患者可能会从另一个来源获得建议：人工智能。

在加利福尼亚州和威斯康星州**，**OpenAI的“GPT”生成式人工智能正在阅读患者信息并起草医生的回复。这项操作是一个试点项目的一部分，三个医疗系统正在测试人工智能是否能减少医务人员回复患者在线咨询的时间。

加州大学圣地亚哥分校健康中心和威斯康星大学健康中心于四月开始测试该工具。斯坦福医疗保健计划于下周初加入推广。总共有大约二十多名医疗保健工作人员正在试用该工具。

加州大学圣地亚哥分校健康中心的首席医生玛琳·米伦正在协助领导人工智能测试，她已经在自己的收件箱中测试GPT约一周。她表示，早期人工智能生成的回复需要大量编辑，她的团队一直在努力改进回复。他们还在添加一种“床边态度”：如果患者提到旅行归来，草稿中可能会包括询问他们旅途是否顺利的一句话。“它提供了我们想要的人情味，”米伦博士说。

有初步数据表明，人工智能可以增加价值。根据周五发表在《JAMA内科学》杂志上的一项研究，ChatGPT在回应患者在线发布的查询时得分高于真实医生，该研究由一组医生对帖子进行了盲评。

斯坦福医疗保健机构计划很快加入AI项目的推广行列。照片：《华尔街日报》的Ian Bates随着许多行业将ChatGPT作为商业工具进行测试，医院管理者和医生们希望这种AI辅助能缓解员工倦怠问题，这是疫情期间激增的难题。根据美国医学会的数据，在行政任务中，信息洪流和健康记录管理是主要原因之一。

总部位于威斯康星州维罗纳的Epic公司开发了“MyChart”工具，患者可通过该工具与医疗提供者沟通，其登录次数从2020年第一季度的1.06亿次激增至2023年第一季度的2.6亿次。Epic的软件使医院能够以电子方式存储患者记录。

本月早些时候，Epic和微软宣布，医疗系统将通过Epic的软件和微软的Azure云服务获得OpenAI的GPT技术。微软已投资OpenAI，并正在其产品中集成人工智能工具。医院正在试用GPT-3，这是驱动ChatGPT的大型语言模型的一个版本。

ChatGPT在回答医学问题方面的能力令计算机科学家感到困惑——尽管它被指会编造信息——包括其能够通过美国医师执照考试。微软AI平台企业副总裁埃里克·博伊德表示，OpenAI的语言模型并未专门针对医学数据集进行训练，但在教会其识别模式的海量数据集中包含了医学研究和医学信息。

“与ChatGPT合作的医生可能是最佳传信者，“加州大学圣地亚哥分校计算流行病学家、《美国医学会杂志》研究报告作者之一约翰·艾尔斯表示。

米伦博士称，这项AI试点让部分医护人员感到兴奋。“医生们已经精疲力竭，他们正在寻找任何希望的曙光。“米伦博士表示，该医院系统的患者消息量从疫情前的每月5万条激增至疫情后的每月超8万条，在某些疫情月份甚至超过14万条。

她表示，医生及其团队正疲于应对额外的工作负担。“我的日程表上根本没有空闲时间。我的团队也非常忙碌。”

现在当米伦医生点击患者消息时，AI会立即显示回复草稿。Epic研发高级副总裁塞斯·海恩表示，AI会参考患者消息中的信息及其电子病历生成回复。他补充说，所有医疗数据都按照联邦患者隐私保护法规进行保护。

加州大学圣地亚哥分校健康中心于四月开始测试一款人工智能工具。图片来源：迈克·布莱克/路透社系统提供从草稿开始的选项——若内容无误可直接编辑或发送原样信息——亦可选择空白回复重新撰写。AI在生成回复时会参考患者病历，例如提及他们正在服用的药物或最近一次就诊时间。“它帮助我们快速启动，“她表示，这节省了调取患者档案所需的数秒钟时间。

目前圣地亚哥团队已禁止AI回答任何涉及医疗建议的查询。威斯康星大学健康中心首席信息官切罗·戈斯瓦米表示，威斯康星州的10名医生同样仅允许AI回复有限类型的患者咨询，包括处方申请和文件索取需求。

管理人员和医生们表示，该工具可能带来变革——但前提是它能有效运作。斯坦福医疗保健胃肠病学家帕特里夏·加西亚指出，若草稿需要过多事实核查、修改或耗费大量时间，医生将失去信任。她所在团队计划下周开始试用GPT处理消息：“只有当它能简化工作时，医生们才会持续使用。”

据某医生团队研究显示，用于该研究的ChatGPT版本在回答网络医疗咨询时表现显著优于医生。《美国医学会内科杂志》新研究中，作者们分析了Reddit论坛r/askDocs上的健康咨询帖，该论坛由经认证的医疗从业者提供专业解答。

在这项研究中，作者从该论坛10月份发布的帖子中提取了195个问题及医生的回复。随后他们将这些问题输入ChatGPT，并记录下人工智能的答案。

由五位医疗专业人员组成的团队，将AI回答与Reddit上医生的回复进行了质量和同理心评分。在不知道答案来源的情况下，评估者给ChatGPT回答打出"优秀"或"非常优秀"的比例是医生回答的四倍。此外，仅有4.6%的医生回答被评为"具有同理心"或"极具同理心”，而ChatGPT的这一比例达到45%，是医生的十倍。

该研究的合著者、加州大学圣地亚哥分校健康中心首席数字官兼首席医疗官克里斯托弗·朗赫斯特表示，研究数据说服他尝试引入AI试点。“现有研究表明这确实有效——那么，让我们看看能否将其转化为实际应用。“他说。

联系记者尼迪·苏巴拉曼请致信[email protected]

更正声明早期版本的ChatGPT在回答网络医疗咨询方面优于医生。本文先前版本错误表述为最新版ChatGPT表现更佳。（2023年4月28日修正）

本文发表于2023年4月29日印刷版，标题为《ChatGPT医生为您看诊》。