新書推薦:
《
锂电储能产品设计及案例详解
》
售價:NT$
505.0
《
首辅养成手册(全三册)
》
售價:NT$
551.0
《
清洁
》
售價:NT$
296.0
《
组队:超级个体时代的协作方式
》
售價:NT$
352.0
《
第十三位陪审员
》
售價:NT$
245.0
《
微观经济学(第三版)【2024诺贝尔经济学奖获奖者作品】
》
售價:NT$
709.0
《
Python贝叶斯深度学习
》
售價:NT$
407.0
《
文本的密码:社会语境中的宋代文学
》
售價:NT$
306.0
|
編輯推薦: |
国内首套面向共融机器人的智能信息处理基础理论与关键实现技术论著。l 深度探讨了面向开放领域的命名实体识别和关系抽取技术;
l 深度探讨了实现鲁棒性的命名实体识别和关系抽取方法与实现策略;l 系统论述了深度人工智能时代共融机器人自然交互的基础理论与实现方法
|
內容簡介: |
共融机器人是能够与作业环境、人和其他机器人自然交互、自主适应复杂动态环境并协同作业的机器人。“敏锐体贴型”的自然交互是共融服务机器人的研究热点之一,业内当前迫切需要共融机器人具备理解复杂语义信息的能力。本书立足于深度学习方法的信息与知识抽取领域,从学习文本表示出发,系统地介绍了用于获取现实世界知识信息中命名实体和实体关系的方法,并深入探讨了如何在开放领域实现鲁棒的实体关系分析。 本书是国内共融机器人自然交互领域第一本系统介绍深度学习的命名实体识别和关系抽取的专业书籍,可为读者掌握共融机器人研究领域信息与知识抽取的关键技术和基础知识,追踪该领域的发展前沿提供参考,适合人工智能科学与技术、人工智能等专业的学生及相关研究者阅读。
|
目錄:
|
第1篇引言
第1章对话信息中的命名实体识别3
1.1命名实体识别概述3
1.2相关研究方法概述5
1.2.1词嵌入表示方法5
1.2.2上下文编码架构7
1.2.3标签解码网络8
1.3本章小结8
第2章垂直领域的实体关系分析10
2.1抽取垂直领域的实体关系11
2.1.1基于有监督方法的关系抽取11
2.1.2基于远程监督方法的关系抽取12
2.1.3基于小样本学习方法的关系抽取13
2.1.4实体和关系联合抽取13
2.2相关研究方法综述14
2.2.1卷积神经网络14
2.2.2注意力机制14
2.2.3图神经网络15
2.2.4对抗训练15
2.3本章小结16
第3章开放领域的实体关系分析17
3.1开放领域的实体关系抽取17
3.2相关研究方法综述18
3.2.1自监督学习18
3.2.2开放世界分类18
3.2.3无监督聚类19
3.2.4深度度量学习19
3.2.5持续学习19
3.2.6对比学习20
3.3本章小结20
本篇小结21
目录 面向共融机器人的自然交互——命名实体识别与关系抽取〖2〗〖2〗 〖1〗 第2篇对话信息中的命名实体识别
第4章基于SLSTM的上下文词状态与句子状态表示模型25
4.1概述25
4.2基于GloVe的词嵌入25
4.3基于双向LSTM的字符级向量表示26
4.3.1LSTM神经网络26
4.3.2双向LSTM神经网络29
4.3.3字符级向量表示模型29
4.4基于Attention机制的词向量与字符向量连接30
4.5预训练的额外词表示31
4.5.1双向语言模型31
4.5.2ELMo32
4.6上下文词状态表示33
4.7基于SLSTM构建面向命名实体识别的新的句子状态表示33
4.8基于改进SLSTM构建面向命名实体识别的新的上下文词状态35
4.9标签预测36
4.10实验与分析37
4.10.1数据集37
4.10.2超参数38
4.10.3评估指标39
4.10.4实验分析39
4.11本章小结43
第5章基于句子语义与SelfAttention机制的中文和英文NER模型44
5.1概述44
5.2模型的总体结构44
5.3词嵌入层45
5.3.1英文词嵌入层45
5.3.2中文词嵌入层46
5.4SelfAttention机制47
5.4.1Attention机制48
5.4.2MultiHead Attention49
5.4.3SelfAttention50
5.5句子表示模型51
5.5.1基于双向LSTM的句子表示模型51
5.5.2基于多通道CNN的句子表示模型51
5.6实验与分析52
5.6.1数据集52
5.6.2超参数53
5.6.3模型探索53
5.6.4模型的横向对比54
5.6.5模型的纵向对比56
5.7本章小结57
第6章融合了拼音嵌入与五笔嵌入的中文NER模型58
6.1概述58
6.2字符嵌入58
6.3拼音嵌入58
6.4五笔嵌入60
6.5融合多种嵌入的模型结构61
6.6实验与分析62
6.6.1数据集62
6.6.2超参数63
6.6.3模型的横向对比63
6.6.4消融实验64
6.7本章小结65
本篇小结65
第3篇垂直领域的实体关系分析
第7章基于远程监督方法的关系抽取69
7.1概述69
7.2深度卷积神经网络70
7.2.1文本向量化表示70
7.2.2残差神经网络70
7.2.3补偿机制72
7.2.4注意力机制73
7.3对抗训练74
7.4实验与分析74
7.4.1数据集和评估指标75
7.4.2实验设置75
7.4.3补偿机制的有效性76
7.4.4对抗训练的有效性78
7.4.5与先进基线方法对比78
7.5不足和展望81
7.6本章小结81
第8章基于小样本学习的关系抽取82
8.1概述82
8.2异构图神经网络83
8.2.1任务定义83
8.2.2节点的向量化表示83
8.2.3异构图神经网络中的节点84
8.2.4异构图神经网络中的边85
8.2.5异构图神经网络中的状态表示86
8.3异构图神经网络中的对抗训练87
8.4实验与分析87
8.4.1数据集和评估指标88
8.4.2实验设置88
8.4.3异构图神经网络的有效性89
8.4.4异构图神经网络对噪声数据的鲁棒性90
8.4.5节点可视化表示91
8.4.6案例分析92
8.5不足与展望93
8.6本章小结94
第9章文档级别的关系抽取方法95
9.1概述95
9.2文档的向量化表示95
9.3“注意力”机制在文档级别关系抽取中的应用98
9.4实验与分析100
9.4.1数据集和评估指标100
9.4.2实验设置101
9.4.3“注意力”机制的有效性102
9.5不足与展望103
9.6本章小结103
第10章基于表示迭代融合的实体和关系联合抽取104
10.1概述104
10.2任务定义105
10.3表示迭代融合方法106
10.3.1节点向量化106
10.3.2异构图神经网络层107
10.3.3实体关系抽取108
10.4实验与分析110
10.4.1数据集和评估指标110
10.4.2训练细节和参数设置111
10.4.3模型对比实验111
10.4.4不同类型的句子上的详细的结果113
10.4.5分析和讨论114
10.5本章小结118
本篇小结119
第4篇开放领域的实体关系分析
第11章基于动态阈值的开放关系检测123
11.1概述123
11.2任务定义125
11.3基于生成式负样本的动态阈值方法125
11.3.1关系表示125
11.3.2动态阈值126
11.3.3生成式负样本127
11.4实验与分析128
11.4.1数据集128
11.4.2评价指标128
11.4.3基线模型129
11.4.4参数设置和训练细节129
11.4.5结果与讨论129
11.5本章小结135
第12章基于自加权损失的开放关系抽取136
12.1概述136
12.2任务定义137
12.3基于自加权损失的半监督学习框架137
12.3.1关系表示抽取模块138
12.3.2基于深度度量学习的知识迁移138
12.3.3基于聚类的开放关系发现139
12.4实验与分析140
12.4.1数据集140
12.4.2评价指标140
12.4.3基线模型140
12.4.4参数设置和训练细节141
12.4.5结果和讨论141
12.5本章小结146
第13章基于一致性表示学习的持续关系抽取147
13.1概述147
13.2任务定义148
13.3一致性表示学习方法148
13.3.1编码器149
13.3.2新任务的初始训练150
13.3.3为记忆选择代表性样本150
13.3.4一致性表示学习150
13.3.5基于类均值的预测152
13.4实验与分析152
13.4.1数据集153
13.4.2评价指标153
13.4.3基线模型153
13.4.4训练细节和参数设置153
13.4.5结果和讨论154
13.5本章小结158
第14章开放域文本关系抽取的可扩展可视化平台159
14.1概述159
14.2文本开放关系抽取系统160
14.2.1数据集管理161
14.2.2模型管理161
14.2.3可视化模块162
14.2.4开放关系抽取流水线162
14.3本章小结164
本篇小结164
参考文献165
附录A英文缩写对照表180
附录B图片索引183
附录C表格索引185
结束语187
|
內容試閱:
|
党的二十大报告指出: 教育、科技、人才是全面建设社会主义现代化国家的基础性、战略性支撑。必须坚持科技是第一生产力、人才是第一资源、创新是第一动力,深入实施科教兴国战略、人才强国战略、创新驱动发展战略。这三大战略共同服务于创新型国家的建设。报告同时强调: 推动战略性新兴产业融合集群发展,构建新一代信息技术、人工智能、生物技术、新能源、新材料、高端装备、绿色环保等一批新的增长引擎。
当前,人工智能日益成为引领新一轮科技革命和产业变革的核心技术。其中,命名实体识别与关系抽取作为自然语言处理的重要领域,正展现出令人瞩目的前景和巨大的潜力,特别在共融机器人的自然交互领域中,其应用广泛且具有重要意义。
共融机器人自然交互主要是针对机器人与人共融的应用场景,实现机器人与人、机器人与环境、机器人与机器人自然性的交互共融。从共融服务机器人实际应用的角度而言,机器人与人之间的自然交互能力是其关键核心技术之一。机器人与人之间的自然交互能力主要涉及人机对话能力、人的多模态情感感知能力、人机协同能力等方面。为了实现共融服务机器人此处共融服务机器人包括实体服务机器人、在线虚拟(软)机器人、智能客服等系统或者产品形态。高效的对话能力,需要在人机交互的过程中让机器人具备强大的交互信息的语义理解能力,这是实现高效人机对话的关键核心技术之一。2021年12月,中华人民共和国工业和信息化部、中华人民共和国国家发展和改革委员会等十五部门联合印发的《“十四五”机器人产业发展规划》中将“人机自然交互技术”“情感识别技术”等列为机器人核心技术攻关行动的前沿技术,足见共融机器人的自然交互技术在未来机器人产业发展中的重要性。本系列专著面向产业前沿、技术前沿和国际研究前沿对机器人自然交互技术中的重要问题与方法开展了系统化论述。
当前,面向人机自然交互文本信息中命名实体识别、实体关系理解这一领域主要包括如下几个层次的研发内容: 命名实体识别、实体关系识别、新实体关系检测、新实体关系发现等。面向自然交互文本信息的实体识别与关系理解是涉及自然语言处理、深度学习、传统机器学习、模式识别、算法、机器人系统、人机交互等方面相互融合的综合性研究领域,近年来笔者所在的清华大学计算机科学与技术系智能技术与系统国家重点实验室研究团队,在面向智能机器人自然交互文本信息的语义理解方面开展了大量有开创性的研究与应用工作,特别是在深度学习模型的命名实体识别、实体关系分类、新实体关系的检测与发现等方面取得了一定的研究成果,相关成果具体成果可查询清华大学计算机系THUIAR研究组官网或与作者联系。也已经以系列化研究论文的形式陆续发表在近年来人工智能领域的顶级国际会议ACL和知名国际期刊Knowledge based Systems上。为了能够系统化地呈现学术界和笔者团队近年来在人机交互文本信息的实体识别与关系理解方面的最新研究成果,笔者特别系统地梳理了相关工作成果内容,将其以系列化学术专著的形式呈现在读者面前。
本书是“面向共融机器人的自然交互”系列化学术专著的第3部,笔者的研究团队后续将及时梳理和归纳总结相关的最新成果,以系列图书的形式分享给读者。本书可以作为智能机器人自然交互、智能问答(客服)、自然语言处理、人机交互等领域的教材,也可以作为智能机器人及其智能系统、自然语言处理、人机交互等方面系统与产品研发的重要技术参考书。本书相关的内容资料(算法、代码、数据集等)可查阅清华大学计算机科学与技术系THUIAR研究组官网或与作者联系。
最后感谢国家自然科学基金项目(62173195)与河北省自然科学基金项目(F2022208006)对本学术专著类图书写作工作的支持,感谢在本书的编写过程中,清华大学计算机科学与技术系智能技术与系统国家重点实验室赵康、李晓腾、陈小飞、赵少杰、仇元喆等同学对于书稿整理所付出的艰辛努力,以及谢宇翔、杨聪聪、赵康等同学在相关研究方向上不断持续的合作创新工作。没有各位团队成员的努力,本书将无法以系列化的形式呈现在读者面前。
由于共融机器人的自然交互是一个崭新的、快速发展的研究领域,受限于笔者的学识和知识,书中错误和不足之处在所难免,衷心希望广大读者能给笔者的图书提出宝贵的意见和建议。
作者2023年5月1日于清华园
|
|