统计方法是语言研究的重要基础。经几代学者的努力,统计方法在我国外语界已得到很大普及,很多外语院系在研究生阶段开设了与统计相关的课程。近二十年的数种优秀教材,如桂诗春、宁春岩(1997)的《语言学方法论》,杨端和、李强(1998)的《语言统计学》,李绍山(1999)的《语言研究中的统计学》,韩宝成(2000)的《外语教学科研中的统计方法》,马广惠(2003)的《外国语言学及应用语言学统计方法》,秦晓晴(2003)的《外语教学研究中的定量数据分析》,秦晓晴、毕劲(2015)的《外语教学定量研究方法及数据分析》等,为在外语界普及统计方法起到了巨大的推动作用。本书拟在已有研究成果的基础上继续努力,为从事语言学研究的高校外语教师、研究生和科研人员提供相关参考。本书的特点是基于R而不是SPSS。R作为统计软件相当年轻,但已风靡国际,是国外很多大学公用计算机上预装的统计工具。它是开源软件,对个人完全免费,但统计功能一点也不少,而且有许多独特的优势,比如制图功能非常强大,这对撰写论文、编写教材和专著等无疑是个好消息。随着国际学术交流日益频繁,越来越多的学者将R带回国内,个别外语院系开始基于R开设统计课程;近年有些硕士学位论文也提到或用到了R。随着学术研究跨学科、跨专业的趋势日渐明显,外语界应该对R投入足够的注意。这不只是为了多一种选择,更重要的是R提供的巨大灵活性使之有更大的发展潜力,非常有助于激发研究者的创造性。如今外语界掌握R的人士越来越多,相信不久以后R将成为国内外语界的主要统计工具。国内已经出版的R教程大部分都是面向理工科读者,与语言研究相关的仅有2018年商务印书馆翻译出版的StefanTh. Gries的著名教程《语言研究中的统计学——R软件应用入门》(Statistics for Linguistics with R: APractical Introduction),因此编者认为编写一本基于R的语言学统计教程非常有必要。当今我国外语界除少数几个子领域外,多数并不重视统计,统计方法在研究生培养方案中所占的比例极小;多数人只求入门,偏爱"快餐"式的教程,对详读大部头教程没有兴趣,所以本教程力求简洁明了。不过本书也有自足性,可以作为高校应用语言学领域的统计方法入门教材。本书并不试图说服已经熟悉SPSS的读者再学习R,因为只要熟练掌握一种统计软件就够用了。本书分三篇。上篇前三章是对R的介绍,包括R的基本知识、安装与设置以及基本操作方式。第四章介绍如何用R做随机抽样,第五章介绍用R制图的主要方法,这些是R相对于SPSS的重要特色。中篇讲解主要的统计方法,包括描述统计的原理与方法、推断统计的重要概念,并介绍常用的推断统计方法以及如何用R实现。为帮助读者更好地理解内容,每章前面用尽量简短的篇幅介绍基本概念与原理,后面还附有一些练习题。下篇主要介绍统计在探索性语言研究中的应用,尤其在第十四章介绍了一些比较复杂的方法,这些已经成为量化语言研究的重要手段。当然由于可能的应用方式是无限的,本章只介绍其中几种。第十五章讲解认知语言学界已经用得非常多的搭配构式分析(collostructional analysis)方法。虽然该章的主体内容并不是R,但这种分析的计算部分主要是用R实现的,能体现出R的优势;另外编者认为这种方法有很大的发展潜力,为帮助读者更好地了解搭配构式分析,专门用一章的篇幅做基本介绍。最后一章是本书的结语,指出了外语界统计分析应用中很少被注意到的几个问题,意在促使读者在使用统计方法的同时保持清醒,关注方法本身的合理性。书后有若干个附录,但不提供各类教程中常见的统计表,这是因为统计类软件的计算结果中都已经给出了相应的统计量和p值,查统计表其实是早期手工计算的需要。不过如果读者确实需要查各种关键值,本书的附录二也介绍了怎样用R命令来查表。另外由于R的最大优势之一是允许用户自己编写脚本,我们鼓励读者学习一些基本的R编程方法,附录二和附录三中有一些简单演示。其他几个附录介绍与语言研究有关的一些包和脚本,意在提示R的强大性和实用性。欢迎本书的读者向编者(arthur0421@163.com)发邮件索要本书提到的数据表、脚本等电子文档,包括习题所用的数据以及除公式外所有图的制图脚本。编者认为,硕士研究生阶段学习的最重要的内容是科研方法,而不在于记住多少理论和术语。虽然在阅读文献过程中也可以学到一些方法,但对初学者来说,文献中的研究方法和思维方法一般过于复杂,要真正领悟很不容易,必须有显式的研究方法指导。任何领域的研究方法都是多元的,只读一两本教程远远不够,必须将方法论与大量的研究实践相结合,在不断的探索中学习研究方法,持续不断地加深认识。研究方法从来不是自足的,再好的研究方法也必须是建立在正确的逻辑思维基础上才有意义。学习研究方法的目的不是给自己