后记:站在沙堆旁边的人
“如果处理得当,基于互联网上面的传播和互动数据可以变革我们对人类群体行为的理解。” 邓肯·瓦茨(Watts,2007)
毫无疑问,寻找一个好的研究问题对于做研究而言至关重要。爱因斯坦老年时在一个自述中讨论了为什么他念了物理没有念数学。他说:“在数学领域里,我的直觉不够,不能辨别哪些是真正重要的研究,哪些只是不重要的。在物理领域里,我很快学到怎样找到基本的问题来下功夫。”处于数字媒介浪潮之中的时代议题是什么?我们应该研究一些什么问题?2010年9月,当我第一次来到香港城市大学,费尽全力拉着沉重的行李箱沿着山路踽踽而行的时候,显然没有意识到自己所面临的困境。
社交网站是一座无形的桥梁。2010年9月我与一个朋友同时来到香港城市大学读博,事实上我们在北京读研的时候就认识了。一个在人大,一个在北大,距离虽近却久未谋面。真正让我们两个所处的空间折叠的是社交媒体。豆瓣作为中国社交媒体中的重要一员,深刻地改变了很多人的生活。因为标记读过的书、写书评、写豆瓣日记、写豆瓣广播、玩豆瓣小组、参加线上和线下活动,很多有趣的人在豆瓣提前相遇。关系从线上延伸到线下。十年过去了,很多朋友已经离开豆瓣。但我直到今天依然在使用豆瓣,被固化在豆瓣的书影音之中,尤其非常活跃地使用豆瓣小组[1]。
在社交网络的使用过程中,人们也在不断积累和传递社会资本。相比于直接的物质资源,信息通过社交网络快速流动。从社会网络的角度分析人们的社交网站使用与社会资本的关系构成了2008至2010年我主要关注的问题。我完成了一篇“厚厚的”硕士论文《SNS:一条无形的桥梁》。此时,基于PageRank算法创业的谷歌已经存在了十余年,距离瓦茨发表他的小世界网络论文也已经过去了十余年。此时,正是拉泽尔等一批资深研究者在《科学》杂志上发表口号文章《计算社会科学》的时候。那个时候的人人网还叫校内网,正处于如日中天却即将快速衰落的阶段。与脸书不同,人人网未能褪去学生气进入中老年人的视野。正是这一阶段,网络科学的浪潮已经席卷而至。虽然那个时候我一直在看的是社会网络的理论和方法,但复杂网络已经成为一个重要的讨论话题。而恰好在此时,复杂性科学裹挟着社会物理学也开始成为我关注的重点。我经常关注北京师范大学张江老师所创建的集智俱乐部网站,也通过豆瓣关注了集智举办的很多线下活动。后来,自己也作为听众参加了几次。
在阅读社会网络的文献时,我注意到了格兰诺维特关于门槛模型的理论。1978年格兰诺维特在《美国社会学杂志》发表了他的第一篇介绍门槛模型的论文。在这篇论文当中,他提出了门槛的概念:当一个人做出某一个决策的时候,需要其他所有人做出相同决策的数量或比例。只有当周围人的参与比例高于某一个门槛值的时候,个体才会愿意参与其中。行动就面临着成本和风险。个体需要确保行动所带来的收益至少不小于成本或风险。从门槛理论出发分析人类传播行为对我具有天然的吸引力。
https://github.com/chengjun/thresholdbook/blob/master/Chapter4-Granovetter1978.ipynb
事实上,瓦伦特在20世纪90年代就已经开始采用这种方法分析网络门槛对于创新扩散的影响。
瓦茨在2002年发表的一篇题为“随机网络全局级联的一个简单模型”(“A simple model of global cascades on random networks”)的论文提出了基于网络门槛的Watts模型。对于数字媒介上的信息扩散是否可以采用相似的思路?这为本书的写作埋下了种子。
扩散是自然世界和生活世界当中最为普遍而重要的现象。它广泛地存在于各个学科中,并几乎都成为最重要也是研究得最彻底的、最吸引人注意力的领域。我自己对于扩散有着超乎寻常的兴趣。借用古希腊哲学家的话“万物皆流,万物皆变”。身在浩浩汤汤洪流中的个体很容易对“流”产生兴趣。因而,我将研究“流”的扩散,更具体地说是信息的扩散,作为了自己博士阶段研究的主要工作。在博士论文开题的过程中,往往面对诸多挑战,很多人会不断变换题目。我却非常笃定地坚持了下来,一直围绕着这个题目不断耕耘。
在人们还没有注意到的时候,数字媒介的新一波浪潮已然来到,微博作为一种新的社交网络的形式开始出现。2010年到2013年或许可以看作互联网发展的黄金阶段。当我2010年9月第一次走出九龙塘地铁站的时候,或许在记忆中有一刻,我站在炽热的阳光下,感到晕眩。香港城市大学媒体与传播系汇聚了一批重要的华人传播学研究者,但我们第一年所上的课程却仍然是传统的传播学理论和数据分析方法。老先生们执着地带领我们阅读经典,苦口婆心地希望我们安心学好传播学本领域的知识。他们深知本领域的衣钵传承才是研究者安身立命的根本。但是,网络科学、社会物理学、大数据时代、计算社会科学等诸多名词早已经随风潜入夜,让台下的年轻人坐不住了。
跨越学科首先面对的挑战是两种文化之间的冲击。有些人坐住了,他们只关注自己做的东西,非常快乐;有些人站起来了,他们不再满足于自己做的东西,充满痛苦。那个时候集智俱乐部在香港城市大学有两个重要的成员,一个是媒体与传播系的“计算士”吴令飞,另一个是电子工程系的“爱因思谈”王雄。王雄在他的一个手稿中详细地介绍了科学的四重境界的观点,从引力科学的角度介绍科学理论需要跨越数据、模式、机制、普适性的原则。这种物理学对于理论的理解自然不是独出心裁的自创,比如费曼在他的系列讲座和后来出版的《物理学的本质》(The Character of Physical Law)一书中均有提及。
如同后牛顿时代人们所看的物理学大厦一般,科学的四重境界具有异常坚固的结构,对于已经开始背弃传播学理论的年轻人而言更是充满蛊惑力。快乐的人手捧米尔斯的《社会学的想象力》(The Sociological Imagination),左拳击打宏大理论,右掌格挡抽象实证主义,沿着默顿大师规划好的中层理论的道路前进;痛苦的人皱着眉头阅读网络科学的一篇篇最新的论文,试图建立自己的物理学模型。两者之间几乎不存在中间道路。
我在走的似乎正是一条中间道路。游走在两个庞大的社区的边缘,试图寻找一个可以彼此对话的桥梁。想要成为桥节点并不容易,因为桥的下面是坑,一个庞大的“结构坑”。桥节点通常被认为是“结构洞”,似乎穿越这个“洞穴”你就可以到达一个崭新的世界。桥节点立于两大社区之间,因而具有了信息优势。然而桥节点也面对着来自两个社区的压力。这显然并不容易,我实际上远远低估了这些问题。2012年5月16日,在读过了《大自然如何工作》一书后,我写下了一篇读书笔记,名为“重返沙堆:通往理解信息扩散的实在之路”。在笔记中,我写道:
“任何一个学科都需要从其他学科学习其精髓,对于在走向可计算化道路的社会科学,尤其是传播学而言,这种开放性更是时代的压力和必然的结果。网络时代的到来带来传播关系的变革、数字化的行为痕迹、大规模的网络数据,推动了学科的变革。对于传播学而言,这无疑是一个必须抓住的机遇。”
后记的标题虽然是站在沙堆旁边的人,但在本书的写作过程中,我抑制着朝向沙堆模型的叙事。在沙堆模型当中,巴克等提出自组织临界性的概念。巴克曾说自己对自组织临界性的理解是压力的释放。比如,向沙堆上加沙子,推动系统重新演化到平衡状态。这种释放压力的系统被称为耗散系统(dissipative system)。这是一个很好的概念和视角,沙堆模型试图解释跨越自然与社会的各种纷繁复杂的现象。森林火灾、地震、河流涌动、信息传播、树叶中的营养输送,均可以之概括。流的规模分布和时间分布都具有幂律特征。
在《大自然如何工作》一书当中,巴克写了一句抱怨的话:
“令我困惑的是,地球物理学家对他们科学的基本原理不感兴趣。也许他们想当然地认为地球是如此的复杂和混乱以至于没有一般的原则适用。”
或许,这句话是留给社会科学家的。不要仅仅停留在表象,要深入到模式背后的普适性法则当中去。
事实上,费曼就曾在一次谈话中明确批评社会科学徒有科学的形式但缺乏科学的实质。但是,费曼的批评并不公允。人类生活世界内部的复杂性远高于物理世界或者说自然世界。人类社会不是石头等物体,人类有思想、有意识,可以对世界做出快速反应。这使得理解人类行为变得远比理解自然更加复杂。
而长期以来,社会科学家并没有太好的、研究人类行为的工具。实验室内部的实验、问卷调查和访谈构成了我们理解人类社会的主要方式。整个社会科学的发展历史也非常短暂。所投入的资源更难以同物理学等自然科学相媲美。想象一下人类在引力波研究方面的投入,再看一下在信息扩散研究方面的投入,不难理解二者之间的差距。另外,自然科学的发展思路依然严格遵循柏拉图的理念论。在理念论的视角下,最为完美的是理念世界或者说数学世界,而生活世界只是对理念世界不完美的模仿!而这恰恰是社会科学家所不能容忍的。我想请大家在合上这本书的时候可以回到苏格拉底,重新开始或者更加关注我们所居住的城市和乡村,关注活生生的人。事实上,如果每个人都如同理念一般是完美的、没有任何差异的,那么一次自然选择就会让整个人类种群覆灭。
计算社会科学是目前看来最好的中间道路。不必着急去否认生活世界不存在明确的模式和法则,也不要为了追求普适性的法则而回避生活世界当中的重要问题。从重要的问题出发,收集和分析多种来源、不同类型、大规模的数据,采用计算机算法进行测量,通过数学和物理学模型进行建模,更好地回答人们关心的问题。如有可能,不仅仅将数据背后的模式讲清楚,而且试图给出机制性的解释。这条道路当然不容易。正如瓦茨所抱怨的,社会科学内部存在太多相互矛盾的假设,而社会科学家过于依赖常识。事实上很多理论内部相互攻讦,令人莫衷一是,宛若进入了理论的丛林,反而照不到一丝理论的阳光。有没有什么好的解决方法?瓦茨的建议是做预测!当然,计算社会科学远非彻底的范式转型,更不是所谓数据驱动的简单相关,但它的确为解决众多现实问题和理论问题提供了更多的选择。更加重要的是,越是开展计算社会科学的研究,就越会重视内容分析的编码和问卷调查。传统的研究方法和计算的方法互为裨益。
本书只能看作一次初步的尝试,虽然用到了一些计算的方法,但远没有达到上述的理想。事实上,距离完成博士论文已经过去整整六年了。而从我开始关于信息扩散的研究算起,整整十年时间已经过去。在过去几年,我个人加入了推动计算传播学发展的洪流当中,目睹了计算传播产业在数字时代的崛起和计算传播研究的发展。本书第六章对公众注意力的研究使得我开始更多关注信息扩散背后的注意力流动网络,尤其是社会结构如何影响人类在数字媒介中的注意力流动。第七章则逐渐从信息扩散、注意力流动转向计算叙事。数字媒介的演化依然让人看不到边际,智能媒体已经呼之欲出。会有更多有趣的话题出现,有更多重要的数据需要分析。虽然存在诸多挑战,我依然愿意相信瓦茨的乐观预见。
整本书在最后的写作阶段,也逐渐从煎熬变成了一种自我反思的快乐。我开始偏离刻板的学术写作的方式,将对自我研究脉络的总结以及未来研究方向的可能性放了进来。因此,这本书最终变成了一种认识自我的方式。每个人内心当中都有一座万神殿。我也在误打误撞当中找到了我自己的“YYDS”(永远的神)—苏格拉底。两千年前,苏格拉底来到德尔斐神庙,目睹着断壁残垣。立柱上尘封已久的铭文仍清晰可见:
“认识你自己。”
苏格拉底深爱着自己所在的城市,曾三次参军并且作战英勇。但他更喜欢与人讨论问题,尤其是向别人提问、追问、反问、修正、总结。他常常站在雅典城邦的广场上思考重要的问题,比如什么是正义。后人将这种认识世界、传授知识的方式称为“精神助产术”。然而,他却因为不敬神和败坏青年的罪名被捕,迫于多数人暴力而饮下毒酒。苏格拉底成为人类的殉道者。我希望可以建立一个苏格拉底学园,引导人们认识自己、热爱智慧并点燃内心的火焰。
[1] 欢迎大家关注笔者负责维护的计算传播学豆瓣小组 https://www.douban.com/group/webmining/ ,这是本书隐藏的一个彩蛋,感谢你耐心地读到了这里。当然,笔者也知道很多读者最开始读的也是后记。
- Github代码仓库 https://github.com/chengjun/thresholdbook/
- 参考文献Zotero仓库:https://www.zotero.org/wangchj2020/collections/AEYS2R5X
- 欢迎在issue页面提问 https://github.com/chengjun/thresholdbook/issues