前言自然语言处理(Natural Language Processing,NLP)是人工智能领域的重要分支,是一门集语言、数学、计算机科学和认知科学等于一体的综合性交叉学科。随着人工智能的迅猛发展,自然语言处理技术的应用需求急剧增加,人们迫切需要实用的自然语言处理技术来为人机之间的信息交流提供便捷、自然、有效的人性化服务,同时,自然语言处理领域吸引了越来越多的优秀人才投身其中。但是自然语言处理中还有若干科学问题和技术难题尚未得到解决,有待来自不同领域的学者深入研究和探索。中文自然语言处理所面临的困难既有其他自然语言处理会遇到的共性问题,例如生词识别、歧义消减等,也有中文处理特有的问题,例如中文分词等。因此,中文自然语言处理更具有挑战性。本书是中文自然语言处理领域的入门教程,在内容选材上尽量涵盖了中文自然语言处理的基础知识,从初学者的角度深入浅出地介绍了自然语言处理的基本概念、基础知识以及常用的理论方法和经典算法,通过生动的示例说明、简洁的理论讲解和典型的应用案例,帮助学生快速理解并掌握自然语言处理的知识体系。本书共10个单元,单元1介绍了自然语言处理的相关概念、基础知识、Python工具包以及正则表达式等;单元2和单元3介绍了自然语言处理的词法层面技术,具体包括中文分词、词性标注和命名实体识别;单元4介绍了自然语言处理的句法分析技术;单元5介绍了自然语言处理中常用的一些深度学习算法;单元6介绍了常用的向量化方法;单元7~单元10通过综合案例讲解了自然语言处理的具体处理过程。本书内容适合64学时,教学建议如下:单元名称建议学时单元1自然语言处理基础3单元2中文分词3单元3词性标注和命名实体识别4单元4句法分析6(续)单元名称建议学时单元5NLP中的深度学习8单元6文本向量化6单元7关键词提取10单元8文本分类6单元9文本情感分析12单元10聊天机器人6本书由国基北盛(南京)科技发展有限公司组编,由丁爱萍、张卫婷、余云峰任主编,由于倩、屈毅、曹建春、张传勇任副主编,参与编写的还有王春莲、张震、王妍、李永亮、刘信杰。由于编者水平有限,书中难免存在疏漏和不足之处,恳请读者批评指正。编者