路透社如何收集和分析监狱温度数据 | 路透社
Clare Farley,Disha Raychaudhuri
插图:Adolfo Arranz在报道一篇关于气温上升对美国监狱人口影响的专题时,路透社试图解答:有多少监狱为囚犯提供降温设施?监狱内部温度究竟多高?路透社向美国各州及联邦惩教部门提交了公共记录申请,要求获取监舍空调系统配置数据及室内温度记录副本。
监狱缺乏空调可能导致危险的高温环境,引发严重健康问题甚至极端情况下的死亡。
数据收集
2024年2月,路透社提交公共记录申请,要求提供各成人监狱监舍空调配置的电子表格或电子记录。35个州作出回应,其中29个州提供了记录,6个州拒绝请求或表示未保存相关记录。
广告·继续滚动管辖全美122所联邦监狱的联邦监狱管理局未回应路透社关于空调设施数量的问询。
2024年12月,路透社再次提交公共记录申请,要求获取2023年12月1日至2024年12月1日期间各成人监狱监舍区域的每日内部温度读数。根据对在押人员的采访,仅配备空调并不能确保监舍内部温度适宜。路透社确认全美有16个州处于易受高温影响区域或仅提供有限空调设施,本次申请未包含联邦监狱管理局数据。
对这些请求的回复以电子邮件、电子表格和PDF文件的形式呈现。
马里兰州公共安全与惩教服务部门提供的空调记录示例。### 空调记录
路透社根据各住房单元空调配置的反馈,制作了一份统一的标准电子表格。
每个监狱都被分配了一个唯一标识符(数据中的facility_id),与国土安全部(DHS)的监狱边界数据库相匹配。国土安全部的数据集包含监狱、拘留中心、重返社会设施、看守所和青少年拘留中心的地理边界及属性。广告·继续滚动如果某个facility_id在我们的电子表格中被标记为NA,可能是因为该设施是新建的,自国土安全部上次更新以来才开放。在其他情况下,某个设施可能被官方归类为其他类型,因此在国土安全部的数据库中无法找到。为了对空调状态进行分类,路透社创建了两个额外字段:ac_status和ac_status_details。对于ac_status,监狱被标记为:* 是:至少有一个住房单元配备空调。这包括机械空调和蒸发冷却系统(俗称沼泽冷却器)。
- 否:没有任何住房单元配备空调
- 不适用:无可用文件确定空调状态
字段 ac_status_details 提供额外信息:* FULL:所有住房单元均配备空调
- PARTIAL:至少有一个住房单元配备空调
- NONE:所有住房单元均无空调
- NA:无文件可确认空调状态
路透社调查发现,29个州近50%的州立监狱住房单元部分或完全无空调。德州刑事司法部报告称,其58个设施中有51个属于此类——在所有回应路透社的州中数量最多。马里兰州14所州立监狱均未安装空调。
设施内存在空调系统并不保证其正常运行。部分州提供了额外细节说明空调设备是否需要维护。若某州报告住房单元配备空调,路透社默认这些系统可正常为在押人员提供冷气。
广告·继续滚动此外,监狱可能在我们获取记录后已加装空调系统。
室内温度记录
路透社从五个州获得了室内温度记录副本,各州提供的文件均采用其特定记录格式。
例如,德州刑事司法部提供了无空调住房区域每日下午3点的温度数据,而有空调区域的数据则为隔几日记录的下午1点数据。
德克萨斯州刑事司法部提供的温度记录,显示无空调居住区每日下午3点测量的温度。加州惩教署以扫描PDF文件(包含手写记录)的形式提供了2024年5月至9月的温度记录。路透社共收到189份PDF文件,超过28,000页。其中,路透社确认20,326页与室内温度直接相关。
阿维纳尔州立监狱的室内温度记录样本。
加州药物滥用治疗所及州立监狱的室内温度记录样本。我们重点处理加州数据,因为该州部分惩教设施位列全美十大最热监狱——这些场所户外日均温度连续多日超过85华氏度(29摄氏度)。我们采访的大多数在押人员也集中在加州州立监狱。
为加速处理海量数据,路透社采用Gemini 2.5 Pro(谷歌最先进AI思维模型)读取并提取温度日志信息,最终输出JSON格式结果。广告 · 继续滚动PDF的每一页都上传至Gemini 2.5 Pro,并附有详细的数据提取指令。AI提取的数据经过人工清理后合并为单一数据集。我们进一步筛选该数据集,仅包含2024年6月至8月的室内温度记录,这些数据可在此处查看。2024年6月至8月期间,加州所有州立监狱的平均室内温度为76.2华氏度(24.6摄氏度)。最低和中等安全级别的Sierra Conservation Center监狱设施录得最高平均值84华氏度(29摄氏度)。多个设施出现危险高温,部分室内温度高达104华氏度(40摄氏度)。
加州洛杉矶县州立监狱的温度记录显示,室内温度曾达104°F(40°C)。### 数据验证
为验证加州内部温度记录的转换准确性,路透社通过计算精确匹配率(AI输出与原始手写PDF完全一致的条目百分比)及数值差异程度,评估了AI提取流程。
路透社从加州随机抽取384份温度记录样本。样本量采用费希尔公式:
费希尔公式其中:
- n = 样本量
- Z = 对应置信水平的z分数
- p = 预期比例
E = 误差范围或置信区间,用于表示不确定程度
不同置信水平对应的z分数值我们选择了95%的置信水平(95%置信度对应1.96的z分数),保守地采用0.5(50%)的比例以获得最大样本量,并设定5%(±5%对应0.05)的误差范围。由此计算得出样本量为384份。随后我们人工核对了这384份AI输出结果与加州惩教署原始PDF文件的匹配情况。
该模型正确读取和转录手写体温数据的准确率为95%,在95%置信水平下误差范围为±5%。不过大多数误差较小。当温度误差在±1华氏度(0.6摄氏度)范围内时,成功率升至97%。
在五次案例中,路透社在人工核查时无法辨认原始手写内容,或AI输出为空白。在既有可辨识记录温度又有AI提取结果的情况下,平均绝对误差(MAE)——即AI输出与实际记录的偏差——为2.6华氏度(1.4摄氏度)。均方根误差(RMSE)对较大偏差更为敏感,其值为3.5华氏度(1.9摄氏度)。这意味着AI提取的温度数据平均与实际记录温度相差约3.5华氏度。
这些结果表明模型表现可靠,且通常能生成接近原始结果的数据。
不匹配情况主要出现在PDF具有以下特征时:
- 难以辨认或潦草的手写内容
* 被划掉并重写的温度记录
* 缺失的条目
* 扫描质量差的文档
### 贡献声明
所有数据与方法论均公开于GitHub:https://github.com/reuters-graphics/prison-heat-records路透社关税观察简报是您获取全球贸易与关税新闻的每日指南。立即订阅
- 推荐主题:
- 美国