餐厅检查员正在阅读您的Yelp评论 - 彭博社
John Tozzi
三年前,纽约市卫生局试图追踪一起在某餐厅持续数周的疑似食源性疾病爆发。一位调查员是 Yelp 的粉丝,他在评级网站上查找了该餐厅的评论,发现 diners 报告称他们在那儿用餐后生病。该机构创建了一个 Yelp 账户,并向评论者发送消息,以获取更多关于他们和他们的同伴所吃食物的信息,以确定哪些食物导致了疾病。
不久之后,调查员们启动了一个项目,以发现 Yelp 评论是否能够提醒卫生与心理卫生部门有关它未通过电话和在线投诉得知的食源性疾病爆发。(当时的纽约市市长迈克尔·布隆伯格是 彭博商业周刊 母公司彭博 LP 的大股东。)该机构向 Yelp 请求了纽约餐厅公共评论的数据源,并与哥伦比亚大学的研究人员合作,开发算法来标记可疑评论——“呕吐”、“腹泻”和“食物中毒”等关键词是其中的一部分。
公共卫生官员多年来一直试图从社交媒体中获取有用的信息,成功程度各异。 谷歌 搜索查询似乎是季节性流感模式的早期指标, 直到它们不再是。公司们正在尝试利用社交网络和互联网论坛上的数据来 了解药物副作用。
挑战在于互联网数据充满了噪音和虚假信号——看起来像问题的事物实际上并不是——调查这些问题非常耗时。“我们只有有限的公共卫生资源来应对这些问题——大多数情况下它们不会是疫情,那么我们该如何缩小范围?”纽约市卫生局的医学流行病学家莎朗·巴尔特博士说。
根据周四发布的项目报告,在2012年和2013年的九个月里,该机构从Yelp收到了294,000条评论,软件识别出893条可能表明疫情的评论,疾病控制中心表示。流行病学家审查了这些评论,发现468条报告了可能近期的疾病。最终,该部门采访了27位回应其查询的Yelp评论者,并发现了三个之前未知的疑似疫情。该机构派遣检查员,发现了如用裸手接触食物、未洗的蔬菜被端上桌以及老鼠和蟑螂等违规行为。
巴尔特将这项工作描述为一个试点项目,并希望算法随着时间的推移变得更加精确。其他地方也在尝试类似的想法,尤其是芝加哥和犹他州。纽约也希望从其他评论网站获取数据。
该部门现在每天从Yelp收到一批评论,软件每周识别出大约23条需要进一步评估的评论。这与每周约60条投诉(每年3,000条)通过城市的311报告系统提交的情况相比,虽然其中一些与餐厅的啮齿动物有关,而不是食源性疾病,巴尔特说。