新書推薦:
《
突破不可能:用特工思维提升领导力
》
售價:NT$
352.0
《
王阳明大传:知行合一的心学智慧(精装典藏版)
》
售價:NT$
1010.0
《
失衡与重塑——百年变局下的中国与世界经济
》
售價:NT$
602.0
《
不被定义的年龄:积极年龄观让我们更快乐、健康、长寿
》
售價:NT$
352.0
《
南方谈话:邓小平在1992
》
售價:NT$
367.0
《
纷纭万端 : 近代中国的思想与社会
》
售價:NT$
500.0
《
中国古代文体形态研究(第四版)(中华当代学术著作辑要)
》
售價:NT$
765.0
《
朋党之争与北宋政治·大学问
》
售價:NT$
454.0
|
內容簡介: |
本书是作者在多年科学研究的基础上整理完善而成的,是自然语言处理技术在文本分类领域应用的综述和总结,本书专业性较强,注重对技术理论依据和解决思路的精细讲解,读者可通过对本书的学习了解和掌握人工智能相关技术在网络文本处理时的实现方法和操作流程。本书的内容包括:文本预处理、特征表示与降维、文本分类算法、多标签文本分类技术、短文本分类与应用等。每个章节里对关键的知识点进行细致讲解,并通过举例叙述的方式强化相关理论的直观印象,将理论阐述和实例演示紧密联系起来,方便初学者对深奥枯涩理论知识的理解和掌握,本书对提高学生理论联系实际的能力具有较大帮助。本书可作为本科院校智能科学与技术、计算机科学与技术等专业的教材,也可供从事自然语言处理研究的人员进行参考。
|
目錄:
|
第1章 绪论 1
1.1 智能语言处理 1
1.1.1 NLP与文本处理 1
1.1.2 文本信息抽取 3
1.2 网络文本分类应用 6
1.2.1 常见的应用领域 6
1.2.2 相关技术领域 11
1.3 文本分类步骤 15
1.3.1 文本预处理 15
1.3.2 文本分词 18
1.3.3 特征选择 18
1.3.4 数值化表示 19
1.3.5 分类器分类 21
1.4 本章小结 27
第2章 文本预处理 28
2.1 预处理环节 28
2.1.1 标记化 28
2.1.2 规范化 29
2.2 分词技术应用 33
2.2.1 常见应用领域 33
2.2.2 应用中涉及的主要问题 36
2.3 中文分词方法 40
2.3.1 基于词典匹配的分词 40
2.3.2 基于统计的序列标注技术 43
2.3.3 基于深度学习的分词 53
2.4 分词工具 54
2.4.1 Python中文分词工具 54
2.4.2 java中文分词工具 55
2.5 本章小结 57
第3章 特征表示与降维 58
3.1 文本表示模型 58
3.1.1 One-hot独热模型 58
3.1.2 向量空间模型 59
3.1.3 主题模型 60
3.1.4 神经网络语言模型 67
3.2 特征空间降维 78
3.2.1 特征选择 79
3.2.2 特征提取 83
3.3 小结 85
|
內容試閱:
|
文本分类是机器自然语言处理的一个重要研究方向,具有广阔的应用领域和科学研究价值。本书理论性强,读者需要有扎实的数学和统计学基础,部分内容对于初学者来说比较难以理解。全书以文本分类的处理流程为主线组织叙述框架:对文本预处理、特征选择与降维、常用分类算法、多标签文本分类技术、短文本分类技术等进行了详细的讲解,围绕文本分类处理中涉及相关技术的理论依据、实现思路、优劣势等问题展开阐述,并将一些重要的知识点通过举例的方式直观讲解,加深读者的理解。
|
|