在给定学科中,研究科学知识的发展、传播和学术交流结构的分析框架有很多种,包括文献计量分析方法(bibliometric analysis)、社会网络分析方法(social network analysis)和语义网络分析方法(semantic network analysis)。文献计量分析方法是一套研究学术传播的结构和过程的定量测量方法,包括词频、引用和共词分析方法等,通常有评价型文献计量学和关系型文献计量学两个主要应用。其中,关系型文献计量学研究包括作者、期刊、学术团体、学科领域,以及国家之间在学术方面的联系、联系强度和科学的流动等。尽管传统意义上的关系型文献计量学研究科学之间的关系主要通过美国科学信息研究所(Institute for Scientific Information,ISI)提供的重要学术文献资源库Web of Science,但是随着更多新的学术文献资源的出现和全球范围的广泛传播(如Web网页),以及在线论文数据库[如Scopus、谷歌学术(Google Scholar)]等,文献计量分析方法研究发生了革命性的变化。1997年,阿尔明(Almind)和英沃森(Ingwersen)在《万维网上的信息计量分析:网络计量学的方法》(Informetric analyses on the world wide web:methodological approaches to webometrics)中首次提出网络计量学(webometrics),并将文献计量分析方法应用到万维网的信息分析中。网络计量学作为一种新型的文献计量学就这样诞生了。现在网络计量学已经被广泛理解为研究基于网络内容和网络现象,以实现社会科学研究目标的定量研究方法。该方法通常研究与传统文献计量学相关的问题,研究范围包括网站链接、网站引用和搜索引擎评估分析方法等。网络计量学利用更广泛的学术对象,如专利、网页、社交媒体等。网络计量学已被广泛用于研究学科的学术交流结构。
网络计量分析很复杂,因为它需要多个步骤,这些步骤通常需要使用大量多样且仅在商业许可证下可用的分析和绘图软件工具,如Ucinet。此外,很少有研究人员和从业人员接受过如何审查文献和识别循证实践的培训。这些过程的烦琐性在实际工作中也影响了网络计量学研究的可能性和潜力,特别是对于没有一般编程技能的学者。
网络超链接分析需要使用专用的工具,如Webometric Analyst,提取和分析网页的网址(URL)。网络链接分析无疑是网络计量学中运用最广泛的方法,起初用于构建网络影响因子,后来引申了大量相关概念和技术,其根本目的是基于网络链接数据揭示不同层次和内涵的信息,入链(inlink)分析和共链(co-link)分析就是两种实用的网络链接分析方法。随着商业搜索引擎逐渐减少甚至取消了对链接搜索的支持,可用的链接数据源逐渐减少,经典的Altavista、Alltheweb、雅虎等搜索引擎都不复存在或者取消了对链接搜索的支持,谷歌搜索也只是返回链接搜索的样本数据,因而不能用于链接数据收集,这极大地阻碍了共链分析的进一步发展。为了解决链接分析数据源缺失的问题,学者积极探索新的解决方案,目前主要从两个方向出发:(1)不再使用商业搜索引擎,而设计爬虫程序自行爬取链接数据;(2)不再使用链接数据,而寻找和链接数据具备同样分析功能的其他类型数据。网络关键词共现是替代共链分析的一种可能方法,URL引用数据分析是替代网络链接分析的另一种可能方法。
除了这些专用的工具软件,近些年,R语言编程环境得到了广大数据分析和网络分析爱好者的青睐。R语言的官方存储库CRAN(网址为https://cran.r-project.org/)提供了大量的R软件包供使用,其中每个R软件包都提供了特定的分析功能。
通过互联网超文本链接,无数的个人、团体、公司、政府等不同组织形态的主体均深深嵌入互联网世界,在网络世界中留下了大量的文本。社会、管理、经济、营销、金融等不同学科,均可以研究网络上海量的文本,扩宽自己的研究对象和研究领域。文本不仅可以反映某些显性特征,而且可以反映人的特定立场、观点、价值和利益等隐藏特征。文本分析法指的是从文本的表层深入文本的深层,从而发现那些不能为普通阅读者所把握的深层意义。计算文本分析就是对文本数据(textual data)使用计算机进行分析的方法,它已经形成一个令人兴奋的研究领域,在多个研究领域都有大量应用。然而,它可能是一种难以应用的方法,因为它需要各种技术和知识,并且实施这些技术所需的大多数软件在常见的统计软件包中并不容易获得。R语言是计算文本分析的强大平台,可以成为计算文本分析的宝贵工具。
在过去的几十年里,网络分析已成为社会、健康和物理科学家分析工具箱中越来越重要的一部分。网络分析作为一个独特的科学领域,其有自身的理论和方法,源于许多其他学科的发展,特别是数学中的图论和拓扑学、人类学中的亲属关系系统研究,以及社会学和心理学中的社会群体和过程。网络分析作为一种实证实践受到了许多网络特定软件工具和软件包的开发的推动,包括UCINet、Gephi、Negopy和Pajek。在过去的二三十年中,学者们网络分析的兴趣呈爆炸式增长,至少受到三个不同因素的推动。首先,数学家、物理学家和其他领域的研究人员开发了许多有影响力的网络结构并形成理论,这些理论为网络分析科学带来了关注和活力。其次,计算能力和速度的进步使网络分析方法可以应用于大型和超大型网络,例如互联网、地球人口以及人脑。最后,统计网络理论的进步使分析人员第一次超越了简单的网络描述,能够建立和测试网络结构和过程的统计模型。R语言环境包括许多帮助完成特定网络分析任务的软件包。分析人员不仅可以在R语言环境中执行网络分析任务,还可以利用R语言的很多其他功能。
本书内容是在“网络计量分析”的教学实践中使用的教学内容,这些内容包含了部分开放的网络资源,如网络数据、R语言代码以及使用手册等。使用的开放网络资源在相关内容的正文部分都有明确的引用,并在参考文献中列出。