Covid Tracking Project志愿者在美国疫情期间挺身而出 - 彭博社
Drew Armstrong
插图:731;海报:美国国会图书馆提供2020年初,阿曼达·弗伦奇(Amanda French)正处于学术工作之间。大约一年前,她的母亲去世了,她花时间帮助处理她的事务。然后疫情爆发了,打乱了她的就业搜索,她独自一人在北卡罗来纳州的罗利市外,除了在Twitter上进行末日滚动(doomscroll)外几乎无事可做,她是这样描述的。
她在网上关注的某人发出了一个号召,寻求志愿者协助一个新项目,统计美国各地进行了多少次新冠病毒检测——这是公众无法从联邦政府那里得到明确答案的事情。“我无事可做。反正我一个人在家,”弗伦奇说。“这比阅读所有可怕的新闻要健康得多。”所以她在3月18日报名参加了。
阿曼达·弗伦奇摄影师:彭尼斯·B·杜尼(Phyllis B. Dooney)为彭博商业周刊拍摄从那时起,由一支由大多数志愿者组成的小型数据收集团队运营的新冠病毒追踪项目可能已成为关于疫情在美国如何发展的最可信赖的来源。该网站已被流行病学家和其他科学家、新闻机构、州卫生官员、白宫冠状病毒工作组以及拜登过渡团队引用。虽然还有其他可靠的疫情统计来源,但该项目因其以一种易于理解的方式呈现的丰富、几乎实时的数据而脱颖而出。“我认为他们做出了非凡的工作,满足了一个重要需求,”约翰斯·霍普金斯大学卫生安全中心的高级学者詹妮弗·努佐(Jennifer Nuzzo)说,该中心发布自己的一套疫情数据(并从新冠病毒追踪项目中获取一些信息)。“他们正在追踪一些未被追踪的事情。”
这个重要的健康信息库,令人难以置信地是由三名记者、一名数据科学家/生物技术投资者和几张电子表格开始的。回到二月底,冠状病毒在美国仍然是一个潜在的威胁,新病例在全国各地零星出现,西海岸也有隐藏传播的迹象。特朗普政府官员举行吹嘘政府快速推出检测的简报。但是他们无法回答一个重要问题:到底做了多少检测?
亚历克西斯·马德里加尔,《大西洋》的科技作家,以及罗宾逊·梅耶,该杂志的环境作家,决定致电每个州,找出已经进行了多少次检测,并将数字填入电子表格中。当联邦官员谈论已经分发了数百万次检测时,这两位记者在3月6日报道称,美国只有不到2,000人接受了新冠病毒检测。
故事发表后不久,马德里加尔收到了一位老朋友杰夫·哈默巴赫的来信。他和马德里加尔曾一起在哈佛上学。马德里加尔获得了英语学位并成为了记者;哈默巴赫学习了数学,然后开始了Facebook的数据团队。
马德里加尔并不知道的是,哈默巴赫(现在帮助创办生物技术公司,但之前在医学领域工作,应用数据科学技术进行研究)有自己的电子表格。他将其发布在网上,不断更新,并得到读者的反馈。“我想,‘我想我会继续这样做’”,哈默巴赫回忆道。
当马德里加尔的第一份分析发表在大西洋上时,哈默巴赫给他发了电子邮件:“嘿,你们用我的电子表格做了这个吗?”马德里加尔和迈耶的表格中充满了来自卫生部门官员的引用,而哈默巴赫的表格则被设置为一个合适的数据库。他们决定合作,直到政府的数据变得更好。(联合创始人埃琳·基桑,一位在新闻和技术领域工作的编辑和社区经理,在这个时候加入了。)他们认为这个项目会持续一两个星期。“我们只是觉得,当然疾控中心会发布这些信息,”马德里加尔说。“但事实上从来没有发生过。”
“让一群志愿者来做这件事,有点令人难以置信”
在谷歌学术上搜索 Covid Tracking 项目,这个项目汇编了学术文献,你会得到500多个结果,这显示了它在科学界的地位。该项目已经帮助迫使各州改善其披露的 Covid 数据:四月份,它开始给各州关于其报告数据质量的字母评分。起初只有10个州获得了 A 或 A+;现在有40个州和地区达到了这个等级。
这个项目展示了公民的专业知识和公民的奉献精神,这在国家感觉像是被撕裂的时候尤为重要。然而,令人困惑的是,进入疫情爆发将近一年的时候,Covid Tracking 项目正在做美国政府本应做的事。“让一群志愿者来做这件事,有点令人难以置信,”该项目的早期志愿者之一卡拉·谢赫特曼说,她后来成为了数据质量的有薪联合负责人。
美国疾病控制和预防中心几十年来一直在追踪全国的流感和其他疾病。但其系统并不是为实时监测新流行病而设计的。根据该机构的说法,通常情况下,各州从医疗保健提供者那里获取信息并将其输入其系统,然后将数据发送给疾控中心,这个过程可能需要几天时间。“我们清楚地看到,我们的监测系统,无论是获取数据还是跟踪数据,都非常不足够,” Nuzzo说。(约翰斯·霍普金斯公共卫生学院从彭博商业周刊的母公司的大多数所有者迈克尔·布隆伯格那里获得了大量资金。)
竞速跟上 Covid 数据
美国每日病例
数据:Covid Tracking Project,彭博报道
春季末,作为美国卫生与公众服务部的一部分,疾控中心成立了一个由十多人组成的团队,每晚在州卫生网站上爬取信息,然后在早上与各州确认信息。这基本上就是 Covid Tracking Project 在三月初开始做的事情。疾控中心的信息流入 HHS Protect 公共数据中心,这是一个于四月推出的工具,用于汇总有关检测、病例和住院情况的不同数据来源。
如果您访问 HHS Protect 寻找例如弗吉尼亚州的 Covid 数据,您可能会点击进入疾控中心的冠状病毒网站,然后再从那里进入疾控中心 Covid 数据追踪器主页。它显示了州的总病例数和过去七天的新增病例数,但过去二十四小时的新增病例数在另一个选项卡下。点击地图上的弗吉尼亚州,您将被重定向到弗吉尼亚州卫生部。相比之下,Covid Tracking Project 有一个易于找到的弗吉尼亚州页面,告诉您今天的新增病例数、ICU 病人、呼吸机病人等其他细分数据点。(HHS Protect 也提供有关医院容量的信息,但与疾控中心的页面分开;七月份,政府要求医院将数据发送给 HHS 而不是疾控中心,引起了一些健康专家的担忧。)在 Google Scholar 上搜索 HHS Protect 只有大约 30 个结果,而 Covid Tracking Project 有 500 个。
Ryan Panchadsaram,Covid Tracking Project的顾问,曾在奥巴马白宫担任副首席技术官,表示CDC有望成为Covid数据中心。“他们可以向全国每家医院请求数据,可以向所有实验室请求数据并进行汇总,”他说。
事实上,CDC确实收集了与Covid Tracking Project大部分相同的数据,并且从自身渠道获得了更多数据。但这并没有转化为完全公开、易于使用或透明的数据。“令人沮丧的部分是,只有少数数据集是公开的,”Panchadsaram说。“他们拥有所有的渠道,拥有所有的关系;他们只是没有跟进到另一边。”
CDC的卫生信息与监测部门主任Paula Yoon谈到资源短缺以及吸引人才进入公共部门的困难。她还表示,公共卫生机构与医院、医生之间需要建立更紧密的关系,以及他们处理一线疾病的记录和IT系统。“在这两个方面达成一致并使用共同的数据标准、共同的消息传递标准将非常困难,”Yoon说。
今年4月,CDC主任Robert Redfield表示,大流行将加强该机构:“核心能力将最终达到所需水平。”但该机构并没有获得所需的资源。今年早些时候,特朗普政府撤回了拨给CDC用于疫苗分发计划的7亿美元,并将其转向Operation Warp Speed,这是白宫主导的疫苗研究和开发工作。十月,彭博社报道称,拨给CDC用于监测、测试、改进数据系统等措施的10亿美元援助资金被搁置了五个月。
除了300名活跃志愿者外,Covid Tracking Project现在还有30名有薪员工。《大西洋》为其提供法律、传播和技术支持,并且至关重要的是,已经为其提供了来自Chan Zuckerberg Initiative、Rockefeller Foundation和Robert Wood Johnson Foundation等组织的142万美元捐款。但该杂志在其他方面保持距离。“我认为[该项目]不可能在研究机构或媒体组织的墙内建立起来,”该项目的主编基桑说。
在某种程度上,这是典型的疫情时代初创企业,几乎完全依赖于Slack这个工作场所消息平台。大多数员工和志愿者从未见过面,只通过数字化头像和Zoom聊天认识彼此。他们拥有各种各样的专业背景:现在是有薪团队领导的弗伦奇拥有英语博士学位。
最近,我被允许参加了一次志愿者培训课程,观看了一次数据转移,并亲自进行了一个下午的数据录入。志愿者从“核对员”开始,首先从州网站上提取数据。“双重核对员”对其进行审查,更有经验的员工帮助解决问题并做出判断。每天下午,该团队输入并核对来自56个州、领土和哥伦比亚特区近800个数据点。
在我十月初的观察轮班中,我看到各州的报告系统是多么分散。例如,夏威夷的医院数据通常由副州长乔什·格林首先在Twitter或Instagram上发布。但下午时间拖得很长,格林还没有发布——他一直在与安东尼·福奇进行在线直播聊天。“我觉得他对福奇太兴奋了,”有人在Slack上说。最终,当天的数据在他的Instagram故事中找到了,这是该平台上的即时消失帖子。
“副州长格林在处理医院数据时很狡猾。总是要检查故事!” 一位轮班老兵发帖说。这很迷人,但令人沮丧:州政府没有直接将关键的公共卫生数据发送给疾控中心、Covid追踪项目和其他组织,而是将这些数据放在一个以度假和美食照片闻名的社交媒体网站上。夏威夷后来开始在其网站上发布这些数据。
当轮到我晚上上班时,那些已经准备好数据的州开始在电子表格上排队显示。我发现堪萨斯州的数据有错误,其中一位轮班领导用一个迪斯科球表情符号标记了我的帖子。“发现得好!” 有人在Slack上告诉我。我在缅因州的数据上犯了一个错误,颠倒了一个数字,很快就被发现了。
通过与半打员工和志愿者的访谈,以及在项目的Slack上花时间,我感受到了对政府技术专家能力下降的失望。我问法国人,项目中有什么让她沮丧或生气的事情,因为它可以被视为政府的替代品。“让我感到困扰的是疾控中心未能向各州提供数据标准,” 她说,然后过了几分钟,又补充说,“这听起来像是一个非常书呆子的激进主义者会关心的事情。”
有迹象表明疾控中心正在做出改变。11月2日,该机构发布了一份信息请求,寻求一家公司帮助创建一个用于报告Covid-19检测结果的集中平台。该机构正在开发Covid电子实验室报告系统,该系统将收集美国进行的每次检测的详细信息。尹说,该系统已经在40多个州投入使用,并让该机构更仔细地了解病毒的传播情况:“我们已经能够在很短的时间内建立一个新系统,该系统将发送给各州的电子实验室数据反过来与我们在疾控中心分享。” 该机构还正在建立新的自动系统,可以直接从各州和一线卫生保健提供者那里提取数据。
当选总统乔·拜登表示,他的政府将创建一个“全国疫情仪表盘”,提供实时的本地数据,甚至到邮政编码级别。 Covid Tracking Project已经向过渡团队发布了一套建议。马德里加尔表示,“CTP网络中有许多人与拜登团队保持联系”,但该项目并不打算直接与新政府合作。
11月17日,该项目报告了一个令人沮丧的统计数据:76,830,这是美国因Covid-19住院的人数,是疫情爆发以来的最高点。随着病例激增,各州已经重新实施对企业的限制措施,官员们敦促人们通过Zoom举办感恩节。特朗普总统一直在宣传疫苗候选者,而拜登则警告称“我们距离疫情结束还有几个月的时间”。
潘查德萨拉姆表示,由于该国对这种疾病的应对已经变得如此政治化,因此有必要达成一致的事实标准。“我们拥有的共同现实将我们联系在一起,”他说。“如果我们不能就Covid发生的事情达成一致意见,那么我们就无法达成对接下来会发生什么的一致意见。”