新書推薦:
《
历史的严妆:解读道学阴影下的南宋史学(中华学术·有道)
》
售價:NT$
500.0
《
海外中国研究·江南:中国文雅的源流
》
售價:NT$
347.0
《
迟缓的巨人:“大而不能倒”的反思与人性化转向
》
售價:NT$
352.0
《
我们去往何方:身体、身份和个人价值
》
售價:NT$
305.0
《
大学问·批判的武器:罗莎·卢森堡与同时代思想者的论争
》
售價:NT$
449.0
《
低薪困境:剖析日本经济低迷的根本原因
》
售價:NT$
301.0
《
穷人的银行家(诺贝尔和平奖获得者穆罕默德·尤努斯自传)
》
售價:NT$
347.0
《
绵延:文明分野与文化演进
》
售價:NT$
301.0
|
編輯推薦: |
本书不仅全面介绍文本信息抽取技术在古籍文本处理方面的应用,还着重介绍文本信息抽取与知识挖掘的基本概念、原理和方法,理论与实践相结合,帮助读者掌握相关技能。
|
內容簡介: |
本书在全面介绍文本信息抽取技术在古籍文本处理方面应用的基础上,着重介绍文本信息抽取与知识挖掘的基本概念、原理和方法,包括文本预处理、特征提取、命名实体识别、信息抽取、语义分析、知识表示等关键技术。
全书共3部分: 第1部分(第1、2章)着重介绍古籍文本信息抽取的相关背景知识; 第2部分(第3~8章)着重讨论命名实体识别、关系抽取和事件抽取的具体方法,同时介绍对应的实验应用及结果分析; 第3部分(第9章)基于对当前实体抽取领域研究现状的分析与总结,展望未来。同时,全书也提供了大量应用实例。
本书适合作为高等院校计算机、软件工程及相关专业本科生、研究生的参考书,也可供对自然语言处理比较熟悉并且对信息抽取有所了解的开发人员、广大科技工作者和研究人员学习使用。
|
目錄:
|
第1章绪论
1.1研究背景与意义
1.1.1古籍文本信息抽取的重要性
1.1.2古籍文本信息抽取的应用领域
1.1.3古籍文本信息抽取的目的
1.2信息抽取与知识挖掘的基本概念
1.2.1NER
1.2.2RE
1.2.3EE
1.3NER技术
1.3.1基于规则方法的NER技术
1.3.2基于统计模型的NER技术
1.3.3基于深度学习方法的NER技术
第2章古籍文本信息抽取概述与基础理论
2.1古籍文本信息抽取的挑战与难点
2.1.1信息抽取
2.1.2古籍文本中的信息抽取
2.2古籍文本信息抽取的任务
2.3古籍文本信息抽取相关技术
2.3.1词汇语义表示
2.3.2CRF模型
2.3.3CNN信息抽取模型
2.3.4RNN信息抽取
2.3.5图卷积信息抽取模型
2.3.6迁移学习信息抽取模型
2.4古籍文本信息抽取的应用领域
2.4.1古籍数字化
2.4.2古籍文本分析
2.4.3文化遗产保护
2.4.4古籍知识图谱构建
第3章基于Transformer模型的NER
3.1引言
3.2问题引入
3.3基于分层Transformer模型的NER
3.3.1引言
3.3.2实现原理与步骤
3.3.3基本结构与训练方法
3.3.4示例
3.3.5实验分析
3.4基于BERTCRF的NER
3.4.1引言
3.4.2问题引入
3.4.3相关工作
3.4.4模型结构
3.4.5实验结果
3.5基于迁移学习的细粒度BERT的NER
3.5.1引言
3.5.2问题引入
3.5.3实验过程
3.5.4实验结果
第4章基于提示学习的NER
4.1引言
4.2问题引入
4.3基于模板的提示学习NER
4.3.1引言
4.3.2相关工作
4.3.3使用BART基于模板的NER
4.3.4实验结果
4.4融合注意力层的提示学习NER
4.4.1引言
4.4.2低资源NER实验过程
4.4.3实验结果
4.5基于问答的提示学习NER
4.5.1引言
4.5.2相关工作
4.5.3方法
4.5.4实验结果
第5章基于远程监督的RE
5.1引言
5.2问题引入
5.3基于对抗学习的远程监督RE
5.3.1引言
5.3.2相关工作
5.3.3方法
5.3.4实验设置
5.4基于深度强化学习的远程监督RE
5.4.1引言
5.4.2相关工作
5.4.3实验过程
5.5基于句子级别注意力机制的远程监督RE
5.5.1引言
5.5.2相关工作
5.5.3方法
5.5.4实验结果
5.5.5比较
5.6基于实体级别注意力机制的远程监督RE
5.6.1引言
5.6.2相关工作
5.6.3融入多实例学习的基于分段CNN的RE
5.6.4实验结果
5.7基于图卷积的远程监督RE
5.7.1引言
5.7.2相关工作
5.7.3利用辅助信息进行远程监督神经RE
5.7.4实验结果
第6章基于迁移学习的实体RE
6.1引言
6.2问题引入
6.3基于样本迁移的实体RE
6.3.1引言
6.3.2问题引入
6.3.3实验分析
6.3.4实验结果
6.4基于特征迁移的实体RE
6.4.1引言
6.4.2相关工作
6.4.3学习深度简约表示
6.4.4基于聚类的正则化方法应用于实体RE
6.5基于关系迁移的实体RE
6.5.1基于关系迁移的实体RE的概念
6.5.2基于关系迁移的实体RE的步骤
6.5.3基于关系迁移的实体RE的模型结构
6.5.4基于关系迁移的实体RE的相关工作
6.5.5实验分析
第7章联合模型的EE
7.1引言
7.2问题引入
7.3级联解码联合学习的EE方法
7.3.1引言
7.3.2问题引入
7.3.3模型介绍
7.3.4实验过程
7.4共享隐藏表示方式的EE方法
7.4.1引言
7.4.2问题引入
7.4.3模型
7.4.4模型实验表现
7.5基于转换的神经网络的EE方法
7.5.1引言
7.5.2转换系统介绍
7.5.3基于转换的神经网络模型介绍
7.5.4实验结果
第8章篇章级的EE
8.1引言
8.2问题引入
8.3中心语引导的篇章级EE
8.3.1引言
8.3.2相关工作
8.3.3方法
8.3.4实验结果
8.3.5比较
8.4跨句论元抽取的篇章级EE
8.4.1引言
8.4.2相关工作
8.4.3角色填充实体提取任务和评估指标
8.4.4将REE作为序列生成任务
8.4.5GRIT模型
8.4.6实验设置及结果
8.5多粒度阅读的篇章级EE
8.5.1引言
8.5.2相关工作
8.5.3实验方法
8.5.4实验结果
第9章总结与展望
9.1总结
9.2展望
9.2.1NER技术未来发展展望
9.2.2RE技术未来发展展望
9.2.3EE技术未来发展展望
参考文献
|
內容試閱:
|
古籍文本信息抽取与挖掘的重要性在于保护和传承人类的文化遗产,以及促进学术研究和历史探索。古籍文本是记录了古代知识、思想、文化和历史的宝贵资源。通过对古籍文本进行信息抽取,可以从大量的文字资料中提取出有用的信息,为人们的研究和了解相关题材提供重要的线索和指引。
本书全面介绍文本信息抽取与知识挖掘的基本概念、原理和方法,包括文本预处理、特征提取、命名实体识别(NER)、信息抽取、语义分析、知识表示等关键技术。读者可了解每种实施方法及其执行流程。
本书中提供一系列实用的方法和工具,指导读者在实际应用中进行文本信息抽取和知识挖掘。这些方法和工具包括基于规则的抽取、统计方法、机器学习和深度学习技术等。读者可以通过实例和案例学习如何选择适当的方法和工具,并将其应用于自己的项目实践中。
本书以文本信息抽取的基础知识为基点,通过理论与实践相结合,重点介绍实体抽取与关系抽取(RE)的技术方法,及其在“中国少数民族古籍总目提要”数据集上的实际应用; 针对NER,介绍基于Transformer模型的方法和基于提示学习的方法; 针对RE,介绍基于远程监督的方法和基于迁移学习的方法; 针对事件抽取(EE),介绍联合模型的EE和篇章级的EE。
全书共9章。第1章为绪论,介绍古籍文本信息抽取的研究背景与意义,以及信息抽取的相关定义和基本方法。第2章详细介绍信息抽取的概念和基础理论,并浅析古籍文本信息抽取的应用领域。第3、4章介绍NER的核心方法,分别是基于Transformer模型的方法和基于提示学习的方法。第5、6章介绍实体RE的核心方法,分别是基于远程监督的方法和基于迁移学习的方法。第7、8章介绍EE的核心方法,分别是联合模型的EE和篇章级的EE方法。在第3~8章中,每一个方法都提供了相应的实验及对实验结果的分析。第9章为总结与展望,主要内容是对当前在实体RE领域相关技术的总结及对于此领域内技术未来发展方向的展望。
本书可以作为计算机、软件工程及相关专业学生“实体抽取”“文本信息抽取”“信息挖掘”等课程的参考书,同时也可作为计算机从业人员实体RE、EE、文本信息挖掘相关知识的入门学习资料。读者最好在学习过“人工智能”“机器学习”“深度学习”等相关课程后再学习本书及自然语言处理的相应课程。
本书在编写过程中得到中央民族大学信息工程学院的研究生穆日亘、毛宁静、丁福森、李蕊、王文涵、张小苗、仪超、金明哲的大力支持,在此表示衷心的感谢。同时,还需感谢本书后参考文献的作者,感谢他们的资料对本书的指导。感谢清华大学出版社编辑们对本书的出版给予的宝贵建议。
在本书的撰写和相关技术的研究中,由于编者受知识水平所限及时间仓促,书中错误与疏漏之处在所难免,敬请广大读者批评指正。
卢勇
2024年8月
|
|