新冠疫情丨这份来自人工智能、大数据和云计算的答卷,你给多少分?_风闻
云猜预测家-“超级预测者”的资讯站和训练营。2020-02-11 20:16
首发于微信:超级预测
据《连线》(Wired)杂志报道,加拿大一家名为BlueDot的公司凭借其人工智能平台在12月31日就向其客户发出了此次疫情的消息。人工智能一类的技术在此次疫情中扮演了怎么样的角色,它将要扮演怎样的角色?人工智能能预测流行疾病吗?为什么流行疾病难以预测?

本期内容部分来自Forbes、Vox、Wired和英国电讯报等媒体
人工智能最早预测疫情
当一种未知的疾病首次出现,政府和公共卫生官员很难迅速收集信息并协调应对。
人工智能技术却可以通过对世界各地的新闻报道和在线内容进行挖掘,帮助专家识别可能导致潜在流行病的异常情况——这一能力在最近爆发的疫情中得到了充分展示。
据《连线》(Wired)杂志报道,加拿大一家名为BlueDot的公司在12月31日就向其客户发出了此次疫情的消息——早于美国疾病控制与预防中心(CDC)和世界卫生组织(WHO)。

该公司网页上的介绍:“我们将公共卫生和医疗专业知识与先进的数据分析相结合,创建追踪、情境化和预测传染病风险的解决方案。”
BlueDot是利用数据评估公共健康风险的众多公司之一。公司创始人兼首席执行官卡姆兰·汗(Kamran Khan)同时也是一名传染病医生。
目前,BlueDot已经建立了一个复杂的人工智能平台,目前正在使用自然语言处理(NLP)和机器学习(ML)来处理大量非结构化的文本数据,目前支持65种语言,跟踪超过100种不同疾病。
旅行者的行程信息和航班路线等其他数据可以帮助了解疾病可能的传播方式和具体地点。在一月早些时候,BlueDot的研究人员预测,在中国大陆出现新冠病毒后,亚洲其他城市也会出现新冠病毒。
汗在接受采访时说道,公司的系统还可以利用一系列其他数据,比如一个地区的气候、温度,甚至当地家禽的信息,来预测个人是否感染了某种疾病、地区是否可能引发疫情。
2016年,BlueDot在寨卡病毒出现在美国佛罗里达州的前六个月就预测了它的爆发。

BlueDot向客户发送的预警
日前,流行疾病监测公司Metabiota也通过观察飞行数据得出了关于此次疫情的预测:泰国、韩国、日本将是本次新冠疫情的高风险地区。
据悉,Metabiota还可以根据疾病的症状、死亡率和可获得的治疗等信息,估计疾病传播造成的社会性风险。
人工智能的优势在于对所有的数据源进行整合。因此,全球范围内的从业人员均在着手研发基于人工智能的流行病预测模型,希望借此以应对潜在的危机。
但创造一个能从个体层面上精确模拟流行疾病爆发的人工智能,却仍然有待于未来。
为何流行疾病难以预测?
我们可以做些什么,来防止未来的疫情爆发?
这也是疫情预测这个新兴科学领域的核心。
BlueDot通过人工智能监测平台率先预测和发布武汉出现传染疫情的新闻,得到了媒体的广泛关注——借助大数据沉淀基础和人工智能的推断,人类成功地预测了未来。
在过去的几个世纪里,科学家对世界的预测越来越准确:行星的轨道、潮汐的涨落和飓风的路径。充分理解自然和物理系统,并对其做出准确的预测,确实可以看作是人类巨大的成就之一。

微软(Microsoft)联合创始人比尔‧盖茨(Bill Gates)2018年也曾预(警)测(告)说,下一次在全世界传播的大型流行疾病可能是我们从未见过的传染病。盖茨还警告说,世界没有足够的能力来应对病毒性疾病传播的影响。
对未来进行预测的理念与行动很大程度上始于艾萨克·牛顿(Isaac Newton)对事物的判断:存在一种稳定的自然规律,而这些规律支配了我们周围的自然现象。
如今,快速执行大型计算的能力辅助了牛顿主义的观点,即只要有足够的数据和计算能力,就可以预测最复杂的现象。
然而,对流行疾病进行预测的效度仍旧是有限的。
因为在流行疾病中,最重要的变量均是不断变化的。对流行病进行预测,与天气预报一样,收集实时数据对于提高预测疫情的能力可能至关重要。
科学家对流行疾病进行建模的想法基于这样一个概念,即每次疫情的发展轨迹是可以预测的。

张文宏“流感非感冒,老虎不是猫”演讲截图
假设疾病是由传染性病原体引起的。疾病的传染性可以用其“繁殖系数”来衡量,即R0,R0描述病原体在特定人群中传播的可能性。
在此种假设下,R0是一个稳定的变量。
但它并不稳定。例如寨卡病毒,其R0的范围在0.5到6.3,在可以制造一场会自行消散的流行疾病到一场长时期的流行疾病之间不等。
寨卡病毒R0值范围如此之广并非因为统计上的不确定性,而是各种因素都会导致不同环境下的R0值不同。
一种流行疾病的特征病原体的传染性、传播速度、疫苗的可获得性等等,这些均可以在一场疫情中飞快地变化。
这也决定了科学家们只能在疫情中预测动态。

流行疾病像是一系列嘈杂的事件,其中许多变量扮演着重要但不断变化的角色。这种疾病没有潜在的真相,只有不稳定的细节集合,并随着疾病的蔓延而变化。
所以,科学家们不再假设每次爆发都遵循相同的规则。在比较一次疫情与另一次疫情时,他们牢记每一次爆发的相异之处。
即使两种疫情都植根于同一种传染性病原体,但许多细节上的差异意味着科学家可能需要重新界定他们如何模拟每种疾病。为了更好地了解这些细节,科学家需要大量的实时数据。
这也回答了另一个问题:为何疾病监测仍然是科学中风险最高的领域之一。
ABC时代,我们如何抗疫?
ABC(人工智能、大数据、云计算)技术带来的变革有目共睹。
在此次疫情中,它们也发挥了重要的作用。
腾讯云于1月24日向中山大学药学院罗海彬教授团队提供了批量GPU云服务器免费使用权,帮助该团队推进病毒药物的筛选工作。
同时,腾讯云还向北京生命科学研究所、清华大学生物医学交叉研究院的实验室提供了大量标准的CPU算力以及对象储存能力,帮助他们进行基因测算的离线计算任务。
云计算的关键在于其高性能的算力,能够帮助实验室快速筛选数亿级别的化合物数据库,从而加快针对新冠状病毒的研究工作。
丁香园·丁香医生则在第一时间制作了“疫情实时动态”,第一财经商业数据中心推出实时更新的“定制防疫地图”。类似的实时查询工具还有不少,大数据分析技术是它们的核心所在。
大数据分析不仅可以用来支撑服务疫情态势研判、疫情防控部署,也可以对流动人员进行疫情监测、精准施策。

“丁香园疫情实时动态”界面(截图时间:2月10日15时)
2月1日,浙江省疾控中心上线自动化全基因组检测分析平台,该平台利用阿里达摩院研发的AI算法,可将原来数小时的疑似病例基因分析缩短至半小时。
与目前医院普遍采用的核酸检测方法不同,该平台采取的是全基因组检测技术,可对疑似病例的病毒样本进行全基因组序列分析比对。
阿里达摩院算法专家顾斐表示,整个检测过程包括提取样本、建库以及数据分析等步骤,其中,AI主要提升分析环节的效率。
2月4日,响应工信部对人工智能企业加速赋能的倡议书,中关村管委会对外发布“首批抗击疫情的新技术新产品新服务清单”。
该清单包括86家中关村企业的138项新技术新产品新服务,涵盖病毒检测、疫苗研发、临床治疗、医疗防护、智能诊断、疫情分析与发布等与抗击疫情相关的各个方面。

旷视AI测温系统落地海淀,测温精度误差仅为±0.3摄氏度
近日,旷视科技的近百人研发团队经过十天的奋战,正式上线了人工智能测温系统,并已经在海淀政务大厅和海淀区部分地铁站展开试点应用。
该系统可以通过前端红外相机鉴别人流中的高温人员,再根据疑似发烧者的人体、人脸信息,通过行人再识别技术,辅助高密度人员流动场景下的工作人员快速定位发烧者。
相比人工近距离检测手段和传统的发热筛查系统,智能测温系统既可以有效防止疫情扩散,又能减少对公众的干扰,提高通行效率。
青岛悟牛智能科技有限公司利用自身技术优势在最短的时间内改装出了消毒机器人,投入到当地多家医院的治疗一线。
除此之外,人工智能还可以根据地区预测潜在新病例的数量,以及哪些类型的人群面临的风险最大;可以帮助优化策略的增强;可以预测病毒从动物传播到人类的热点地区。
一旦确定了已知的疫情,卫生官员就可以根据环境条件、医疗条件和传播方式,利用人工智能来预测病毒将如何传播。人工智能还可以用于指导公共卫生官员在危机期间如何分配资源。
机器学习则可以阅读数百亿的数据点和医疗记录中的临床文件,并建立起与感染或未感染该病毒的患者之间的联系;可以评估和优化隔离策略控制传播;可以开发增强疫苗接种策略的方法。
人工智能对公共卫生领域进行预测的历史可以追溯至2008年。彼时,谷歌推出了一项服务,试图利用人们的搜索查询来发现流感爆发。

如前所述,创造类似BlueDot能够准确预测疾病传播的人工智能,已经成为世界各地研究人员的首要任务。或许在未来,人工智能将成为对抗流行疾病的第一道新防线。
但问题仍旧存在,人工智能通常存在歧视和偏见;而对于隐私侵犯的潜在忧虑,也是在人工智能这一技术发展时所必须面临的问题。