序
本书是张伦、王成军、许小可继《社交网络上的计算传播学》之后的又一著作。张伦和成军是我们香港城市大学互联网挖掘实验室的博士毕业生,而小可则来实验室做过访问学者。于公(事关传播学发展之大计)于私,我都很乐意遵嘱写个简序。
也许有些读者会问,本书与前书有何区别?一种简单粗暴的区分是,本书为教科书而前书为专题研究。在此我就计算传播学教科书讨论(其实仅能提及)几个问题。首先,有无必要和可能为计算传播学这个新兴领域写教科书?我原本的看法是有其必要但条件尚未成熟。不料三位作者居然写出一本,其内容虽然还没达到我心目中的标准(因为这个领域整体上还在引进、模仿和探索的初期),但也是言之有物、自成一体的,对于广大亟需一本入门级教科书的传播学子来说,实为及时雨。因此,我郑重地向读者们推荐此书。
也许有些读者(或者也包括本书作者)会问,本书哪些方面需要加强?我觉得最需要的是以下三个方面:研究设计、与传统方法和线下数据的融合、研究伦理道德问题。研究设计指什么?艾尔·巴比(Earl Babbie)在《社会研究方法》中有单独章节详细讲述了实证研究的设计问题,如分析单元(unit of analysis)、组间(between-subjects)组内(within-subjects)比较、时间维度等。我认为这些原理,虽然技术含量不高,但同样适用计算传播学,而又不为来自计算科学(包括数据、网络等的一个统称)的学者所熟悉,所以需要介绍给初学者,以填补理论/研究问题与数据/算法之间的断层
地带。
与传统方法和线下数据的融合,似乎是个流行的口号,人人都会喊,但真正实行的并不多。究其原因,客观上有困难,使用传统方法和收集线下数据耗时耗财;主观上也有疑虑,觉得旧方法、旧数据过时、老土。我10年前也是这么想的,但随着对计算方法和大数据接触的逐渐深入,越来越觉察到其中的局限和陷阱。旧方法、旧数据虽然不能解决所有新问题,但是如果能在最需要的地方,富有创意地引入一些已被反复验证的旧方法(如随机抽样)、旧数据,往往能收到“四两拨千斤”“化腐朽为神奇”之效。这是一个内涵丰富的话题,值得我们大家反复实验、不断总结。
计算传播学研究中的伦理道德问题涉及面极其广泛,从个人隐私和网络安全到数据产权和社会责任等。更棘手的是,大多数相关问题迄今并无明文法规可循,学界、业界更无共识。但是,这些问题个个都是躲不过、绕不开的,稍不注意即有可能误踩雷区。当然,入门级的教科书既无可能也无必要长篇大论地论述有关问题,但是确有必要在最易犯规的环节(如数据抓取、在线实验等)提醒初学者以及提供一些操作清单,列明哪些是严禁的黑色地带和哪些是应避免的灰色地带。
党的十八大以来,以习近平同志为核心的党中央将哲学社会科学工作放在党和国家全局工作中的重要位置。习近平总书记指出:“加快构建中国特色哲学社会科学,归根结底是建构中国自主的知识体系……要以中国为观照、以时代为观照,立足中国实际,解决中国问题,不断推动中华优秀传统文化创造性转化、创新性发展,不断推进知识创新、理论创新、方法创新,使中国特色哲学社会科学真正屹立于世界学术之林。”随着新一轮科技革命的突飞猛进,科学研究范式也在不断转变,多学科交叉会聚与多技术跨界融合将成为常态,并不断催生新学科前沿、新科技领域和新创新形态,计算传播学在国家重大战略需求的驱动下应运而生。
计算传播学作为计算社会学科的分支之一,以传播网络分析、传播文本挖掘、数据科学等为主要分析工具,自觉以回答中国之问、时代之问为学术己任,以彰显中国之路、中国之治、中国之理为思想追求,不断探索新技术发展背景下未来新闻传播学建设的逻辑与目标,助力中国特色新闻传播学在世界范围内做出引领性贡献。
祝建华
2018年9月20日
自.序
1998年,Watts[1][1] 编辑注:本书中引用的英文著作、论文等的作者,有一些在国内相关领域还没有统一的中文译名,为了读者查找资料方便,本书中涉及的一些作者直接使用英文名,不再加注中文名。
和Strogatz在《自然》(Nature)上面发表重要论文《“小世界”网络集体动力学 》(“Collective Dynamics of ‘Small-World’ Networks”),标志着网络科学的诞生。社会网络研究和复杂网络研究在研究议题和研究方法层面第一次合流。2008年
我进入香港城市大学媒体与传播系,跟随祝建华老师攻读博士学位,当时跨学科为主导的网络科学研究方兴未艾。2009年,我从“校内网”(后来改名为“人人网”)提取了该平台建立前两年的全网数据,将博士论文的选题定为“在线社交媒体好友关系构建及演化研究”。第一次面对着4万个注册用户、几亿条好友关系记录的“大”数据,我惶恐不安。只写过SPSS代码的我,就这样莽莽撞撞地迈进了“计算社会科学”的大门,从此走上了计算社会科学研究的“不归路”。
转眼间,我进入这个领域已有近二十年,做过的研究题目也陆续在国内外一些学术期刊上发表。只是偶尔回头看时,当时的那份惶恐犹在。作为一个“过来人”,对于进入“计算传播学”领域的初学者,我觉得有几点经验有必要与大家分享。进入这个领域,需要跨越“三座大山”:定位理论问题、理解分析方法与掌握数据处理技术。第一,定位理论问题。计算传播学的核心任务是立足本学科,回答传播学研究中的重要问题。虽然这是一个需要进行跨学科合作的研究领域,但交叉学科合作研究的意义在于如何更深入地回答传播学的重要问题,而非跨入另一个学科,最终抛弃传播学研究。虽然现在“计算”“智能”之风甚猛,但纵观顶级期刊发表的论文,无不是在回答传播学研究中的核心和重要理论问题。第二,理解分析方法,以“应用”为最终目的。我经常告诉刚开始学习统计分析的同学,学习数据分析方法,要以“会用”为学习目的。统计原理之于统计方法,就好比汽车制动原理之于汽车驾驶。在学习之初,你只需要学会如何驾驶汽车,能够安全地把车开上路即可;而不需要在汽车动力原理层面花太多时间和精力去理解。随着学习的深入,对于数据分析方法的反复应用和学习,学习者自然会逐渐深入理解数据分析方法背后的数学原理。而如果在入门阶段执着于完全理解分析方法原理(如如何迭代、如何估计参数等),可能方法还没学会,就已经信心全无准备“跑路”了。当然我并不认为学习者不需要理解数据分析方法原理。只是从“效率”角度出发,建议初学者对数据分析方法先学会应用,后学习原理,这将更有助于尽快入门。第三,掌握数据处理技术。我是一名文科生,编程曾经是我内心深处的终极恐惧。读博士期间,祝建华老师在实验室里的教导是我迈过这座大山的重要信念。祝老师说,这个世界上没有学不会的东西,差别只在于用多长时间学会。祝老师还引用了“一万小时定律”来“安慰”我们。作家格拉德威尔认为,“人们眼中的天才之所以卓越非凡,并非天资超人一等,而是付出了持续不断的努力。1万小时的锤炼是任何人从平凡变成世界级大师的必要条件”。 的确,在没有付出必要的努力之前,我们甚至没有资格怀疑自己的智商。所以简单而言,学习和练习就是了。
在过去的十几年间,每当遇到技术瓶颈需要去翻阅技术论文时,我都在想,什么时候能有一本教材,专门写给初学者?这便是本书的写作初衷之一——站在文科视角,为没有太多数理编程背景的同学写一本通俗易懂的教材。
本书适合致力于计算传播学研究的学生和青年教师自学与教学。本书对读者的基本先修要求是,了解社会科学定量研究的基本范式。对于高年级本科生和研究生同学,建议大家在自学过程中,在读懂每个章节的基础上,学习Python编程技术,并学习如何实现书中所有命令。同时,尽量阅读每个章节所引用的论文原文。本书所引用的大部分研究案例,大多发表在《自然》、《科学》(Science)、《美国国家科学院院刊》(Proceedings of the National Academy of Sciences of the United States of America,PNAS)
等国际顶尖学术期刊上。建议同学们阅读时仔细想一想,为什么这篇文章能够发表在顶尖学术期刊上?其研究问题的重要性、理论贡献和方法贡献各是什么?对于用于教学的青年教师,建议大家利用本书为基本提纲;同时按图索骥,找到自己研究子领域中具有代表性的研究问题,并指导学生,根据每个章节的基本代码,让学生实践相关的数据分析和研究。总而言之,“计算传播学”最有效的学习路径是“实践”,必须要亲手操作,才能体会和明白关键概念和关键步骤。仅仅通过概念的讲解和论文阅读,犹如隔岸观火,无法有效地投入“计算传播学”研究中。
此外,需要说明的是,“计算传播学”自提出之时起,就是一个跨学科的研究领域。知识和研究问题并无绝对的学科之分,重要的社会科学研究问题往往需要跨越学科合作。例如,信息的传播问题是传播学和物理学共同感兴趣的话题;社会的公平与分配问题是社会学和经济学共同感兴趣的问题。因此,从这个意义上而言,我们很难对某一篇文章进行唯一的学科划分。传播学者认为某一个研究属于传播学研究,而相关领域的学者或许认为该研究同样属于其他学科,这并不奇怪。因此,本书中所列举的经典研究,并未仅限制在传播学领域学术期刊发表的文章,而是首选在上述综合性学术期刊中寻找研究案例。
本书的写作,得益于我们在过去四五年间积累的相关教学实践经验。在本书的写作中,第一章至第四章、第七章和第十一章由张伦主笔,第五章、第六章和第八章由许小可主笔,第九章和第十章由王成军主笔。而向更早追溯,本书的写作得益于我们早年在香港城市大学互联网挖掘实验室的科研经历。我们在相关领域的科研工作中,逐渐习得“计算传播学”的基本研究方法,深深理解文科或者社会科学背景的同学学习相关领域知识时的难点和痛点。希望这本教材能够作为“踏脚石”,帮助各位同学和教师顺利踏上“计算传播学”科研之路,护送各位披荆斩棘。
最后,我谨代表三位作者,衷心感谢北师大出版社编辑们的大力支持。他们对本书成稿和顺利出版倾注了大量的心血。他们对书稿提出了诸多细致的修订建议,使得本书行文更为流畅和规范,并对本书的推广给予了大力支持。没有他们的帮助和投入,此书不可能如此顺利和迅速地出版。
张.伦
2024年8月