Bit by Bit:数字时代的社会研究_风闻
观察者网用户_241051-2019-04-23 16:15

这是社论前沿第S1273次推送
微信号:shelunqianyan

编者按:本书是为想要做更多数据科学的社会科学家、想做更多社会科学的数据科学家,以及对这两个领域感兴趣的人而写的。如果你认为你正在做的是社会研究,不管你在哪里工作,或者目前使用的是哪种技术,那么这本书就是写给你的。

作者认为,在数字时代,我们还处于社会研究的早期,且存在一些非常普遍的误区。如数据科学家存在两种常见误区。一是认为更多的数据可以自动解决问题。事实上,对于社会研究来说,更好的数据——而不是更多的数据——似乎更有帮助。二是科学家们认为社会科学只是一堆围绕常识的花哨言论。聪明人一直在努力理解人类的行为,忽视这些努力积累的智慧是不明智的。
同样社会学家也存在两种常见误区。一是一些人使用数字时代的工具写了一堆平庸的或错误的(或两者兼而有之)文章,但不代表所有数字时代的社会研究都很糟糕。作者将通过这本书向读者展示用数字时代的工具所做出的研究的魅力。二是把现在和未来混为一谈。当我们评价数字时代的社会研究时,要问两个截然不同的问题:“这种研究方式现在的效果如何?”和“这种研究方式在未来会有多好?”。研究者通常侧重于回答前者,但作者认为第二个问题更重要。也就是说,即使数字时代的社会研究还没有产生巨大的、改变范式的贡献,但数字时代研究的改进速度却是惊人的快。
社会科学和数据科学的交集有时被称为计算社会科学(computational social science)。有些人认为这是一个技术领域,但本书不是一本传统意义上的技术书籍。作者之所以选择以这种方式写书,在于他想对数字时代的社会研究提供一个全面的观点,包括大数据源、调查、实验、集体协作和伦理。事实上本书不可能涵盖所有主题,且提供每个主题的技术细节。但作者在每一章末尾的“下一步要读什么”一节中,给出了更多技术性材料的阅读建议。换句话说,本书不是为了教读者如何做任何具体的计算,而是为了改变读者对社会研究的看法。
欢迎来到数字时代
作者认为数字时代最重要的特征是无处不在的计算机。从只有政府和大公司才能使用的房间大小的机器开始,计算机的体积一直在缩小,且无处不在。自上世纪80年代以来,每十年都会出现一种新的计算方式:个人电脑、笔记本电脑、智能手机,到如今的“物联网”(即汽车、手表和恒温器等设备内部的电脑)的嵌入式处理器。这些无所不在的计算机不仅仅是计算:它们还能感知、存储和传输信息。
对研究人员来说,随处可见的计算机所带来的影响是最容易在网上看到的,这种环境是完全可测量的,也可以实验的。例如,在线商店可以轻松地收集关于数百万顾客购物模式的极其精确的数据。此外,它可以很容易地随机组合客户群体,以获得不同的购物经验。这种在追踪基础上随机化的能力意味着在线商店可以不断地进行随机对照实验。事实上,如果你曾经从网上商店买过任何东西,你的行为就会被跟踪,而且不管你是否知道,你几乎肯定是实验参与者。
这个完全可测量的、完全随机化的世界不仅发生在网上,而且越来越多地发生在任何地方。实体店已经收集了非常详细的采购数据,他们正在开发基础设施,以监控客户的购物行为,并将试验与日常业务实践相结合。“物联网”意味着物理世界中的行为将越来越多地被数字传感器捕获。换句话说,当你想到数字时代的社会研究时,不应该仅想到网络,而应该对身边的一切都进行思考。
除了能够测量行为和随机处理之外,数字时代还为人们创造了新的交流方式。这些新的交流形式使研究人员能够进行创新调查,并与其同事和公众建立大规模的合作关系。

图:信息存储能力和计算能力正在急剧增加。此外,信息存储现在几乎完全是数字化的。这些变化为社会研究人员创造了难以置信的机会。(图表来自原著)
本书主题:成品与定制相结合;伦理
成品与定制相结合以及伦理是本书的两个主题。
正如读者将看到的,本书中的一些例子涉及到对最初由公司和政府创建的大数据源的巧妙重新定位。在另一些例子中,研究人员从一个特定的问题开始,然后使用数字时代的工具来创建回答这个问题所需的数据。数字时代的社会研究将涉及成品和定制。
如果你一般使用的是现成的数据,作者希望这本书能向你展示定制数据的价值。同样,如果你通常使用定制数据,作者希望这本书将向你展示现成数据的价值。当然,作者也希望这本书能向你展示两种风格相结合的价值。
贯穿本书的第二个主题是道德。作者将展示利用数字时代机会的研究人员将如何面对艰难的伦理决策。本书的第六章是对该领域伦理的阐述,同时伦理问题也在其它章节有所讨论,作者认为在数字时代,伦理将成为研究设计中一个越来越重要的组成部分。他希望这本书能帮助每个人负责任地平衡数字时代社会研究所带来的风险和机遇。随着权力的增加,责任也必须增加。
本书大纲
第一章:引言。主要介绍了本书的源起、数字时代、研究设计、主题以及大纲。在每一章方法的介绍与讨论后,都会涉及该方法引起的伦理问题。每一章节都将以一个名为“下一步要读什么”的小节结束,其中包括重要的书目信息和更详细材料的指南。
第二章:观察行为。作者将描述研究人员从观察人们的行为中可以学到什么和如何学习。重点讨论由公司和政府创建的大数据源。从任意特定数据源的细节出发,他将描述大数据源的10个常见特征,以及这些特征如何影响研究人员使用这些数据源进行研究的能力。其后作者将阐述三种可以应用于大数据源学习的研究策略。
第三章:提出问题。首先描述了通过超越现有的大数据,研究人员可以学到什么。为了组织数字时代所创造的机会,作者将回顾传统调查的错误框架。然后展示数字时代如何为抽样和访谈提供新的方法。最后,作者描述了将调查数据与大数据源相结合的两种策略。
第四章:运行实验。首先介绍了研究人员在观察行为和提出调查问题之后可以学到什么。特别是,随机对照实验如何让研究人员了解因果关系。然后比较过去与现在能做的实验。在此背景下,作者将描述控制数字实验的两种主要策略所涉及的权衡。最后,他将给出一些关于如何利用数字实验的真正力量的设计建议,并描述这种能力带来的一些责任。
第五章:创建集体协作。本章将展示研究人员如何创建集体协作——如众包和公民科学——以便进行社会研究。通过描述成功的集体协作项目和提供一些关键的组织原则,作者希望能让读者相信两件事:第一,集体协作可以被用于社会研究;第二,使用集体协作的研究人员将能够解决以前似乎不可能解决的问题。
第六章:伦理。研究人员对参与者的权力迅速增加,而且这些能力的变化速度快于规范、规则和法律。权力的增加和缺乏如何使用权力的共识,使得善意的研究人员陷入困境。作者将描述四个既定的原则和两个道德框架,帮助指导研究人员的决定。最后,他将解释一些研究人员可能会面临的具体的伦理挑战,并提供一些实用的提示。
第7章:未来。回顾贯穿本书的主题,用其推测未来重要的主题。

文献来源:Matthew J. Salganik. Bit by Bit: Social Research in the Digital Age[M]. UK: Princeton University Press, 2018.
文献整理:杨阿诺