数据挖掘城市的视觉身份 - 彭博社
bloomberg
C. Doersch 等巴黎看起来就像,嗯,巴黎,和地球上其他地方完全不同,这也是法国首都魅力的很大一部分。作为游客,你甚至不需要参观埃菲尔铁塔就知道你已经来到了光之城。在任何住宅区的小巷中漫步,这座城市有着独特的外观和感觉,这源于从巴黎阳台的构造到城市街灯风格的无数小区别。
当面对巴黎的随机图像时,去过那里的人在识别这个地方方面出奇地准确(与巴塞罗那等其他地方相比)。一个来自卡内基梅隆大学和巴黎的INRIA/高等师范学校的有趣的研究项目正是尝试了这一点。研究人员向受试者展示了一些巴黎的图像样本,以及来自世界其他11个城市的诱饵图像。受试者正确识别巴黎的概率为79%。 (你可以在这里玩这个游戏。)
彭博社城市实验室解锁区域规划的隐藏力量,无论好坏美国地方选举官员面临的威胁正在上升,更多的工作人员选择辞职伦敦的超富人逃离税收上升的威胁贝尔法斯特的中央车站为北爱尔兰的公共交通开创了新时代“这表明人们对视觉环境中地理信息特征的敏感性非常高,”研究人员写道。“但这些特征是什么?”
这是一个人们不太擅长的问题:以某种科学准确性识别出是什么让巴黎看起来像巴黎。但研究人员怀疑计算机可能能够做到这一点。如今的计算机科学家正在对一切进行数据挖掘:推文中的语言、庞大数据集中的数字统计、Foursquare签到中的地理位置。然而,训练软件进行视觉信息的数据挖掘则要复杂一些。
任何一张街景照片都包含数百个独立元素(单独的门口、街道标志、路缘高度、建筑细节)。其中只有少数几个真正反映了一个城市的独特指纹。在巴黎的情况下,一些显而易见的选择是那些嵌在建筑侧面的著名街道标志、铸铁阳台和装饰性路灯。研究人员想看看他们是否可以使用算法自动(并更准确地)识别这些地理特征。
他们寻找的不是像埃菲尔铁塔这样的大型显著地标,而是“日常城市生活的视觉细节。”这些是建筑设计和街道生活中较小特征的模式,这些模式在整个城市中反复出现——但同时又与其他城市的模式微妙不同。
大量的视觉数据挖掘工作已经在Flickr上完成,但这些图像严重偏向于著名地标。相反,研究人员从Google街景中提取了大约10,000张巴黎及其他11个比较城市的图像(作为额外的好处,所有这些图像都是从Google街景车的同一视角拍摄的,这使得比较街景和建筑立面在不同社区和城市之间变得更加容易)。所有这些图像产生了数千万个独立的“补丁”,如上所示。
接下来,我们将让研究人员解释他们如何训练算法以聚焦于最具代表性的特征:
算法在提炼巴黎的视觉身份方面表现得相当不错。左侧是从Google街景随机捕捉到的城市图像。右侧的补丁代表算法找到的城市的顶级视觉元素。
类似地,这里是波士顿的比较:
还有旧金山:
研究人员指出,他们的算法在美国城市的表现要困难得多,其中一些最常被识别的元素是汽车品牌和道路特征。“这可能是由于美国城市在风格和独特性上的相对缺乏一致性(其风格和影响的熔炉),”他们写道,“以及汽车在美国街道上的至高无上的统治。”
他们的最终目标是“为一个地方的视觉体验提供一个风格叙事,”这样的叙事可以在社区层面、城市层面,甚至区域层面进行讲述。在最广泛的层面上,这种技术可以帮助识别不同文化和地区如何相互影响。你可以,或许,通过观察沿途的阳台和门道,追踪奥斯曼帝国在东欧、中东和北非的历史足迹。如果有人对在这个方向上推进这项研究感兴趣,作者甚至提供了一个他们所创造的新领域的建议名称:“计算地文化建模。”