《300万伦敦通勤者的一天,1分钟看完 - 彭博社》
bloomberg
杰伊·戈登每当伦敦的通勤者在上公交车或下地铁时刷一次牡蛎卡,这笔交易就会被记录为当天数百万数据点之一,追踪城市的舞蹈。总体而言,这个数据集庞大得令人难以置信,记录了成千上万的人在城镇之间的通勤和小动作。
你如何从如此庞大的数据集中提取一些有用的模式?首先,你要将其可视化。下面的动画来自交通规划师杰伊·戈登,他将2011年一个典型星期三伦敦公共交通的1600万笔交易转化为一个一分钟的时间推移动画:
彭博社城市实验室贝尔法斯特的中央车站为北爱尔兰公共交通开创了新时代芝加哥应考虑所有预算危机的解决方案,普利兹克说消除美国道路死亡的月球计划AOC提议300亿美元的社会住房管理局该动画基于来自伦敦交通局的私人牡蛎数据,这些数据与麻省理工学院的研究人员共享(这些数据并不公开,部分原因是它包含有关个人通勤模式的潜在敏感信息)。作为他在麻省理工学院的硕士论文的一部分,戈登设计了一种方法来推断通勤者的旅行模式,使用牡蛎数据(例如,公交通勤者只在上车时刷卡,而不是下车时,这使得学者们需要通过算法推断他们的完整通勤模式)。
在上述动画中,绿色点代表乘坐火车或公交车的乘客(点越亮,乘客越多)。蓝色点表示这些乘客在当天第一次乘车前或最后一次乘车后的位置——很可能是他们的家。红色点显示的是在两次交通旅行之间的持卡人——换句话说,就是在工作、在商场或使用其他交通工具如出租车的人。
在一天的时间里,从凌晨3点开始,我们可以看到伦敦人起床,从外区前往市中心,在午餐时间四处奔波,下午5点左右回家,然后在那些静态的蓝色位置上入睡。动画包含了一些粗略的近似值。例如,伦敦地铁的乘客似乎是从起点直接移动到目的地,而不是沿着地铁轨道的精确路线。动画还排除了使用纸质票的乘客(在系统中占少数)。但戈登的图像确实考虑了我们所知道的每个人进行交通旅行所需的时间(使用Oyster数据或GPS公交跟踪)。
戈登使用基本的红绿蓝色谱构建了动画,以允许所有这些发光点的重叠。例如,在一天的中间,市中心呈现黄色,因为那里的大多数人要么在交通中(绿色),要么我们假设他们在办公室(红色)。戈登解释道:“纯白色”是所有的——一切都是满的,很多人都在家里和工作之间通勤。
旅行模式无意中反映了城市的土地使用情况。白天市中心的活动节点揭示了伦敦的商业核心。从市中心向外,一些干道呈红色,而另一些则呈蓝色;红色的可能是繁忙的商业走廊,公交车流量较大。在更高的分辨率下,城市中的一些黑点甚至捕捉到了公共公园和泰晤士河,那里没有人通勤、工作或睡觉。
戈登的目标不仅仅是创造一个诱人的动画。像这样的可视化实际上可以被交通规划者使用。“一个规划者早上进来,”戈登设想道,“喝一杯咖啡,观看昨天的一分钟动画,寻找模式。如果有什么看起来奇怪,他们可以说‘昨天在国王十字地铁附近发生了什么?’”
也许是火车故障,或者公交车在交通中被堵住。然后,规划者可以在更高的分辨率下放大可视化,或者提取其他相关的数据报告。最初的过程显然需要一台计算机。“但这仍然依赖于规划者的专业知识,”戈登补充道,“去注意一些看起来奇怪的东西。”
在磁性交通卡出现之前,这一切都是不可能的。现在,它们允许交通系统不仅跟踪单独的乘车记录,还能跟踪个体在多次出行中的乘客模式。如果没有牡蛎卡,我们仍然可以看到早上的一阵出行,然后在下午更多。但我们无法将它们彼此连接或形成一个连贯的整体。
“即使你在10年前拥有一台强大的计算机,当时收集这些数据的唯一方法是通过调查,而人们仍然在这样做,”戈登说。“这真的很广泛,而且你得到的样本很小。这项工作的优势在于你每天都能获得大量样本。”
那一个由数百万数据点组成的动画仅代表一天的时间。明天的伦敦——或者星期六,或者在冬季风暴期间——可能看起来完全不同。