餐厅评论揭示了城市的哪些信息 - 彭博社
Linda Poon
托马斯·彼得/路透社在线评论网站可以告诉你很多关于一个城市餐饮场景的信息,它们也能揭示很多关于这个城市本身的信息。
麻省理工学院的研究人员最近发现,从流行的评论网站收集的关于餐厅的信息可以用来揭示一个社区的多个社会经济因素,包括其就业率和居住、工作及旅行在那里的人的人口特征。
上周在 国家科学院院刊 上发表的一份报告解释了研究人员如何利用在大众点评网(中国的一个类似Yelp的网站)上找到的信息,以获取通常可以从官方政府人口普查中获得的信息。该模型可能特别有助于收集那些没有可靠或最新政府数据的城市的信息,尤其是在资源有限、无法定期进行调查的发展中国家。
彭博社城市实验室纳粹碉堡的绿意改造将丑陋的过去变成城市的眼球吸引器圣保罗的贫民窟如何帮助庇护南美洲最大城市仅使用公共交通的跨洲竞赛悉尼中央火车站现在成为建筑目的地“我们想探索一种新的方式,利用餐厅数据来预测那些非常小的社区级属性,如收入、人口、就业和消费,而不依赖于官方的人口普查数据,”麻省理工学院未来实验室的城市发展教授郑思齐说,他特别关注中国。
存在一个社会经济数据差距……“即使我们现在处于大数据时代。”郑和她的同事们使用来自九个不同规模的中国城市的餐厅数据测试了他们的机器学习模型——从像北京这样人口超过1000万的拥挤城市,到像保定这样人口不到300万的小城市。
他们从大众点评上提取了630,000家餐厅的数据,包括每家餐厅的位置、菜单价格、开业日期和顾客评分。然后,他们将这些数据与官方普查数据以及从手机和银行卡收集的匿名位置和消费数据一起输入机器学习模型。通过比较这些信息,他们能够确定餐厅数据在多大程度上反映了他们关于社区特征的其他数据。
他们发现,当地餐厅的情况可以以95%的准确率预测社区白天和夜晚的人口变化,这些变化是通过手机数据测量的。他们还可以分别以90%和93%的准确率预测商家的数量和消费者消费的总量。提供的菜系类型和可用餐饮场所的种类(例如咖啡馆与传统茶馆)也可以预测移民的比例或居民的年龄和收入分布。对于靠近城市中心的社区,预测的准确性更高,而对于靠近郊区的社区和较小城市,预测的准确性则较低,因为较小城市的社区变化不如大城市那样广泛。
根据这项研究,基于一个数据丰富城市的数据运行的模型足够准确,可以应用于一个国家内的不同城市。
综合来看,这些预测为城市规划者提供了最新的社会经济属性,以“做出提供公共服务的决策”,郑说。“他们需要了解需求方。”至于私营部门,关于白天活动的预测将告知他们在哪里设立零售或房地产市场。
当地餐饮场景能够描绘出其所在社区的情况是有道理的。“这是最分散和非管制的地方产业之一,尤其是在中国,”郑告诉CityLab。也就是说,它们几乎都是私营企业,并且由需求驱动,与其他行业相比,进入门槛较低。此外,餐馆随处可见,并且随着时间的推移,往往会变化以反映社区的变化。
在这个意义上,郑和她的团队认为这种方法可以应用于任何地方,尤其对低收入国家将特别有用。她说,各国之间以及一个国家内的城市之间存在社会经济数据差距,“即使我们现在处于大数据时代。”
虽然这些在线平台可能没有以科学的方式收集信息,但其丰富的数量使其成为政府数据的有用补充。例如,在美国,Yelp数据可以反映城市的经济健康,并揭示食物、种族和城市更新之间的联系。
郑承认该方法的局限性:首先必须有足够的餐厅数据输入机器学习模型,而这在所有国家可能并不可用。但如果仅来自少数城市的数据能够帮助预测一个国家内所有城市的特征——例如,中国有600多个城市——那么小型、资源不足的城市也能受益。也许未来的研究可以测试一个模型,使用仅来自一个国家城市的数据,是否能够预测全球任何城市的社区特征。