阿里巴巴医疗AI模型在医学考试中得分媲美资深医生 | 南华早报
Wency Chen
阿里巴巴集团旗下基于先进通义千问系列开发的医疗专用人工智能模型,已展现出与资深医生相当的诊断能力,并已接入该公司旗舰级消费者AI助手应用夸克。
阿里巴巴周二宣布,该AI模型成功通过中国医师资格考试,在全科医学、内科、普外科、妇产科、儿科等12个常见医学专科达到"副主任医师"职称标准。中国医疗职称体系共分五级,“副主任医师"为第四高级别职称。
该医疗模型由阿里巴巴通义千问2.5-32B基础模型驱动,依托海量高质量数据与先进的多阶段训练体系。阿里巴巴集团为《南华早报》母公司。
夸克提供的基准数据显示,在测试准确率方面,该医疗模型表现优于深度求索的R1和V3版本,以及OpenAI的GPT-4o。其在"副主任医师"级别测试中取得74.8%准确率,在最高级的"主任医师"标准测试中达56.4%准确率。
通义千问标志与人形轮廓的展示图。图片来源:Shutterstock图库
阿里巴巴表示,该医疗模型已全面接入夸克应用,当用户提出健康相关问题时系统将自动调用。通过与医院及医疗单位的合作,模型持续优化以提升诊断精度,目前这些医疗机构正将模型集成至自有应用系统中。