将数据密集型城市映射成山脉 - 彭博社
bloomberg
克里斯·赫维格纽约市警察局每年发布一个令人难以置信的 密集数据库,记录了全市警察与居民之间有争议的“盘问与搜查”事件的档案。在任何一年,城市街道上可能会有超过500,000次这样的盘问,警察会质问(有时会搜查)任何看起来可疑的人。将所有这些“盘问与搜查”绘制在地图上,使用它们的地理标记的纬度和经度坐标,图像看起来 像这样:
“它看起来有点像圣诞灯,”数据分析师克里斯·赫维格说,他在Mapbox工作。他使用2008年的城市数据创建了上述地图。盘问与搜查与城市的街道网络整齐重叠。但这张地图揭示的内容也就仅此而已。“问题在于我们谈论的是非常密集的数据,”赫维格说。“你真的看不到模式。你只看到这些与街道重合的线——没错。但很难从中获得某种分析洞察,了解模式来自哪里。”
彭博社城市实验室贝尔法斯特的中央车站为北爱尔兰的公共交通开创了新时代芝加哥应该考虑所有预算危机的解决方案,普利兹克说消除美国道路死亡的月球计划AOC提议300亿美元的社会住房管理局这是任何关于城市生活的密集数据集的一个常见问题,许多小的信息点挤在地图上——犯罪事件、311电话、学校入学——开始相互融合。在纽约市,停留搜查在某些社区发生的频率远高于其他地方。但这些案件的密度很难精确映射,因为它们相互重叠。
这给赫尔维格另一个想法,如何可视化本质上堆积在某个地方的数据点。“为什么我不把它们当作海拔来处理呢?”他说。密集的信息具有一种拓扑结构,就像物理地形一样。借用地理学家的等高线,赫尔维格最终将上述地图转化为这张地图:
在这里,他展示了关于一个本来平坦的地方的信息,借用了用于绘制山脉的方法,这个想法可能还有许多其他应用。“这似乎与密集的数据点、在其分布中相对密集的地理点很好地结合在一起,但在城市的各个地方又有些随机,”赫尔维格说。“最终你会看到其中的模式。”放大城市的某些角落,比如布鲁克林的这个社区,真正的高峰出现了:
赫尔维格最近也对2011年的停留与搜查数据进行了相同的处理,以作比较。作为这一理念更广泛应用的一个例子,数据记者杰拉尔德·里奇最近采用赫尔维格的方法,并用它来绘制一个完全不同的数据集,在国家层面上:冒犯性地名的密度。(里奇受到这段乔恩·斯图尔特的片段的启发,片段中提到的新罕布什尔州一个叫“犹太池”的小镇。)使用种族侮辱词汇的词典,里奇从美国地质调查局保留的地名中筛选出“母亲埃佛瑞斯”和“死黑人溪。”
这些名称在全国范围内展现出自己的密度,在某些地区出现得比其他地区更频繁(里奇指出,针对美洲原住民的侮辱词汇主要集中在阿巴拉契亚山脉周围)。这是他的地形图的信息高程:
在里奇的地图上,最有趣的是,一些肮脏地名的密度实际上与土地的真实地理有关系。这是阿巴拉契亚山脉的视图(真实的山脉显示在它们下面),一般来说,居住地——以及其中的肮脏地名——在山脉的某些部分密集聚集:
