技术可能拯救或毁灭2020年人口普查 - 彭博社
Kriston Capps
在1940年的人口普查中,超过120,000名普查员收集和处理数据。八十年后,2020年的人口普查将是首次在线进行。美联社/国家档案馆和记录管理局在下一个人口普查中,受访者将首次能够在线填写问卷。这标志着这一计数的重大转变,它指导国会席位的分配以及数千亿美元联邦资金的分配。让美国人可以通过笔记本电脑或智能手机填写2020年的人口普查,意味着将美国宪法第一条第二节拖入21世纪。无论好坏。
对即将到来的人口普查的担忧超出了对资金不足和 人手不足(尽管这些问题这次也让人紧张)。将人口普查放在线上打开了一个潘多拉的盒子,带来了新的风险,包括黑客和骗子的干扰,并且有证据表明掠夺者已经在盘旋。虽然首次在线人口普查给消费者保护和数据安全带来了挑战,但对人口普查本身最大的威胁可能是贫富不均——特别是数字鸿沟。
彭博社城市实验室仅使用公共交通的跨洲竞赛悉尼中央火车站现在成为了一个建筑目的地由于住房成本高,民主党人磨练YIMBY信息城市更新如何导致城市暴动“要求人们在手机上填写表格与要求人们使用社交媒体应用程序是完全不同且复杂的,”新学校数字公平实验室的联合主任格雷塔·比伦说。
当心人口普查骗局
首先,好消息是:美国绝大多数成年人知道人口普查并计划参与。根据 皮尤研究中心,这个品牌是强大的,尽管特朗普政府未能将一个 分裂的公民身份问题附加到问卷上。然而,它的(字面意义上的)家喻户晓的地位也使其成为那些意图误导人们的参与者的高价值目标。
例如,在十月,共和党全国委员会在博兹曼和蒙大拿州其他地区发布了一份邮件,声称自己是“2019年国会选区人口普查”。该文件实际上是对唐纳德·特朗普总统连任竞选的伪装请求,导致蒙大拿州官员谴责这份“仿冒人口普查”为虚假信息。
其他类似人口普查的表格旨在诱使人们访问一些可能要求提供个人身份信息或财务记录的网站(尽管人口普查并不要求这些细节)。“我们已经看到假邮件的案例,他们要求人们访问某个随机的URL,”Byrum说。她举了一个例子,讲述了一位来自纽约Canandaigua的图书馆读者,他带着一份仿冒邮件到当地图书馆询问这是否是官方的人口普查表。
当官方2020年人口普查在明年四月启动时,寄送到家庭的邮件将引导受访者访问一个网址,并提供一个独特的识别代码。这为欺诈打开了一个窗口:不法分子可能设计出看起来像官方人口普查门户的可信假冒网站,或者他们可能专注于(例如)为人口普查响应创建的wifi网络邻里完整计数委员会。所有通常困扰电子邮件的恶意软件问题都可能被用来攻击人口普查,而那些容易受到这些攻击的人——老年人和对在线互动不太熟悉的人——可能会成为受害者。其他骗子假装是人口普查局的工作人员,使用传统的欺骗手段诱使受害者通过电话或在门口交出社会安全号码和其他个人身份信息。像AARP这样的组织一直在警告会员如何更好地识别人口普查欺诈威胁和冒名顶替者。
美国人口普查局2020年的数据收集工作本身也可能成为目标。当澳大利亚在2016年推出其首次在线普查时,遭遇了分布式拒绝服务攻击,导致网站崩溃,迫使当局将其关闭。安全专家已警告局方,普查数据在传输和存储时都将面临脆弱性。今年早些时候,政府问责办公室的官员在众议院作证称,人口普查局已标记出500多项在网络安全风险评估中需要采取的纠正措施,其中近一半被认为是高风险。
“人口普查局对他们如何构建这些系统非常谨慎,”Byrum说。“由于[联邦政府]在2018-19年的停摆,这些合同的采购延迟很长时间。人口普查局在构建IT系统方面真的落后很多。”
延迟、预算不确定性以及领导层的缺失一直笼罩着普查。虽然计划进行了三次完整的试验以测试2020年普查的50多个新IT系统,但局方因资金短缺将准备工作缩减为在罗德岛的普罗维登斯县进行一次彩排。“当我们在2018年进入罗德岛的端到端试点时,几个系统尚未完成。我们还没有见到它们。它们没有在实地测试过。它们不会被测试。”
新技术与顽固的差距
即使是确保人口普查覆盖难以统计家庭的系统也是全新的。为了2010年的人口普查,局方雇用了大约160,000名被称为“列名员”的临时工,走访全国几乎每一个街区,生成该机构的主地址文件(作为一个 更大规模的临时劳动力)。作为一种节省成本的机制,人口普查局缩减了2020年的逐户走访工作。该机构将这项任务分为“现场”和“办公室”两部分。后者涉及复杂的数据分析技术,包括机器学习和卫星成像,以生成新增地址的地方的档案。
因此,人口普查局仅对上次普查覆盖的四分之一街区进行实地走访。在进行的唯一一次(也是唯一一次)人口普查端到端试验中,办公室(数字)走访的结果与现场(模拟)走访的结果在61%的测试街区中存在差异,依据一份 关于试验的最终内部报告。
“如果在家中有互联网的人群被过度代表,我们不知道现有的非响应跟进系统是否能够识别出哪些人没有被统计,”Byrum说。“我们不确定是否有任何纠正机制来识别或衡量漏报。”
在普查日(2020年4月1日)之前不会再进行一次彩排。根据罗德岛中央瀑布市市长詹姆斯·迪奥萨的说法,2018年在普罗维登斯县的演练并没有激发信心。外展几乎不存在。更糟糕的是,商务部长威尔伯·罗斯在2018年3月宣布了公民身份问题,这正是在测试进行中,增加了混乱。“在这个测试试运行中,普查局没有提供任何信息,没有广告,也没有讨论,”迪奥萨在今年早些时候告诉CityLab。
“人们宁愿不通过他们既不理解也不信任的系统传输他们的数据。”然而,外展对于2020年普查来说是一个巨大的障碍,这要归功于美国人在使用互联网方面的深刻分歧。例如,在纽约市,超过917,000个家庭在家中没有宽带接入——根据纽约市审计长办公室的一份关于普查的七月报告,这占该市的29%。这种数字鸿沟与定义边缘化人群的现有边界相吻合,包括种族、阶级和民族。在布鲁克林的博罗公园、肯辛顿和海洋公园大道,几乎一半的家庭在家中缺乏宽带接入,而在上东区,这一数字仅为15%。
纽约市没有宽带互联网接入的家庭比例。此地图严格显示缺乏家庭宽带的家庭,因此排除了拥有手机或平板电脑数据计划的家庭。纽约市审计长办公室宽带接入并不是数字鸿沟的唯一衡量标准。以纽约为例,大约38%的没有家庭互联网接入的家庭为移动设备支付数据费用。智能手机在有色人种社区中可能无处不在,特别是在低收入社区,但这并不能缩小数字鸿沟,纽约新学院教授、数字公平实验室创始人兼共同主任玛雅·怀利表示。“试着在手机上做作业,”她说。
依靠信任
根据皮尤的研究,黑人和西班牙裔成年人更可能在一开始就面临不可靠的互联网接入,同时对人口普查也持有更大的怀疑。而且这并不奇怪:特朗普政府费尽心思引入公民身份问题,以便给共和党和非西班牙裔白人带来优势。虽然增加公民身份问题的努力失败了,但不信任依然存在,而将人口普查在线化引发了全新的反对意见。
“人们宁愿不通过他们既不理解也不信任的系统传输他们的数据,”纽约更美好协会的执行副总裁梅尔瓦·M·米勒说,该非营利组织已将2020年人口普查的宣传作为优先事项。
最大化纽约市的自我响应率是她所在协会的 目标,因为这次人口普查可能导致整个州失去数十亿美元的联邦资金以及一个或多个国会席位。制定针对难以统计社区的信息传递策略意味着要想出最有可能接触到特定人群中可信赖人物的策略,无论是家庭主妇、宗教领袖还是社交媒体平台。而答案在不同地方会有所不同。
“我在一个会议上,与一位在阿肯色州组织工作的女性坐在一个小组上,她提到在阿肯色州的少数族裔社区中,填写在线表格存在一些犹豫。他们更倾向于通过电话填写表格,”米勒说。“在我们在纽约的焦点小组中,我们看到的恰恰相反。通过电话填写人口普查表是最不受欢迎的选项,即使在普查员敲门的情况下也是如此。”
公共图书馆很可能是人口普查宣传的前线:许多没有家庭互联网接入的人会去那里上网。根据公共图书馆协会(美国图书馆协会的一部分)政策副主任拉拉·克拉克的说法,作为不同社区中可信的信息仲裁者,图书馆员已经为2020年人口普查准备了至少两年。事实上,图书馆员已经在为2020年的人口普查做一些重要的准备:他们正在帮助图书馆用户申请和培训与人口普查局的工作,这些流程已经随着这次人口普查迁移到线上。
“每次我们看到政府活动在线上进行,无论是完全在线还是部分在线,每一次我们都看到对公共图书馆的影响,”克拉克说。“人口普查的很多内容与公共图书馆每天所做的工作有关,确保人们拥有安全和有效的在线体验。”
图书管理员、宗教领袖和其他标准承载者的工作非常艰巨。为了让2020年的人口普查成功,他们必须帮助全国各地的社区弥合数字文盲和缺乏可及性之间的鸿沟。成功假设政府未经测试的人口普查技术能够抵御来自海盗、黑客和外国政府的攻击。如果一切顺利——好吧,我们真的永远不会知道。人口普查局并没有进行对照试验来看看在线人口普查与过去的努力相比如何。
“如果我们的人口普查中有很大比例的人口对结果没有信心,”拜伦说,“那么在我们如何做出这些决定或如何在未来就这些非常重要的问题进行诉讼时,我们就处于一个非常糟糕的境地。”