新書推薦:
《
大单元教学设计20讲
》
售價:NT$
347.0
《
儿童自我关怀练习册:做自己最好的朋友
》
售價:NT$
316.0
《
高敏感女性的力量(意大利心理学家FSP博士重磅力作。高敏感是优势,更是力量)
》
售價:NT$
286.0
《
元好问与他的时代(中华学术译丛)
》
售價:NT$
398.0
《
汽车传感器结构·原理·检测·维修
》
售價:NT$
500.0
《
怪谈百物语:不能开的门(“日本文学史上的奇迹”宫部美雪重要代表作!日本妖怪物语集大成之作,系列累销突破200万册!)
》
售價:NT$
296.0
《
罗马政治观念中的自由
》
售價:NT$
230.0
《
中国王朝内争实录:宠位厮杀
》
售價:NT$
281.0
|
編輯推薦: |
本书构建了语音和文本信息融合的阿尔兹海默病智能辅助诊断模型,为开发家庭监护系统奠定核心技术基础。从中医“治未病”思想和健康管理的角度出发,在理论层面上探讨基于语音语言学和影像学诊断阿尔兹海默症的理论基础及途径,采用人工智能的方法对医学波士顿失语症检测的语言学描述,进行建模分析,建立AD智能辅助诊断模型,为AD的早评估、早诊断奠定了基础。
|
內容簡介: |
针对阿尔茨海默病患者言语信息的早期诊断问题,本文通过提出问题、制定研究方案、方案实施及调整、评价反馈的方式展开研究。在制定、实施及调整研究方案的过程中,以前期研究为基础,结合文献检索及专家咨询方案,制定实验的实施方案。本文基于“治未病”思想和健康管理的理念,采用基于“波士顿失语症检测”图片描述任务中的患者言语信息建立AD智能辅助诊断模型,实验数据集包括语音信号和转录文本两种模态,本文的4、5、6章实验都是采用此方法建立的中文或英文公开数据集。基于此,本研究构建了语音和文本信息融合的阿尔兹海默病智能辅助诊断模型,为开发家庭监护系统奠定核心技术基础。本文主要研究内容如下: ,提出了一种“治未病”理念下AD智能辅助诊断和健康管理方案。第二,构建了一种基于语音和文本特征的AD智能辅助诊断模型。第三,采用迁移学习解决AD智能辅助诊断中的小样本问题。第四,提出一种AD智能辅助诊断的可解释性学习方法。第五,通过磁共振成像诊断AD。第六,基于“认知者健康云”家庭监护系统设计的临床小样本实证分析。
|
關於作者: |
刘宁,1980-,杭州师范大学治未病与健康管理专业博士毕业,主要研究内容包括基于语音、文本和脑影像的阿尔兹海默病的诊断,博士期间发表多篇与本文研究有关的SCI论文,申请多项研究课题。
|
目錄:
|
第1章 绪 论 001
1.1 研究背景 001
1.1.1 流行病学研究 002
1.1.2 临床表现 002
1.1.3 精神行为和神经系统症状 004
1.1.4 实验室及辅助检查 005
1.1.5 诊断与鉴别诊断 007
1.2 研究意义 008
1.3 选题依据 009
1.4 研究内容 010
1.5 研究思路 011
1.6 文章的组织结构 013
第2章 国内外研究现状 015
2.1 阿尔茨海默病临床诊断方法 015
2.2 波士顿诊断性失语检测 016
2.2.1 语言功能语料库 017
2.2.2 语料库文本标注 018
2.3 基于语言学的阿尔茨海默患者工智能辅助诊断 018
2.3.1 语音信号特征分析 020
2.3.2 文本信息特征分析 022
2.3.3 基于深度学习的辅助诊断 026
2.3.4 结合知识的深度学习辅助诊断 028
2.3.5 目前研究存在的问题 028
2.4 小结 029
第3章 基于“治未病”思想的阿尔茨海默病辅助诊断与健康管理 030
3.1 基于“治未病”思想的阿尔茨海默病早期诊断 030
3.2 基于语言表达的阿尔茨海默病认知功能障碍研究 032
3.3 基于智能辅助诊断的阿尔茨海默病健康管理方法 033
3.4 中医“治未病”健康管理解决方案 035
3.5 小结 036
第4章 基于语音和文本特征的阿尔茨海默病智能辅助诊断模型 037
4.1 研究背景 037
4.2 资料与方法 039
4.2.1 研究设计 039
4.2.2 观察对象 039
4.2.3 实验分组 039
4.2.4 数据清洗与预处理 039
4.2.5 实验过程 040
4.3 特征提取 040
4.3.1 语音学特征提取 041
4.3.2 文本特征探索 043
4.3.3 特征提取 047
4.3.4 特征降维 047
4.4 模型构建 048
4.5 实验结果与讨论 051
4.5.1 实验结果 051
4.5.2 模型可解释性实验 053
4.5.3 结果讨论 054
4.6 小结 055
第5章 阿尔茨海默病智能辅助诊断的小样本迁移学习 057
5.1 研究背景 057
5.2 迁移学习 058
5.3 相关工作 059
5.4 迁移学习模型 061
5.4.1 数据集 061
5.4.2 模型结构 062
5.4.3 网格搜索(Grid Search)策略 063
5.5 实验结果与讨论 063
5.5.1 实验设置 063
5.5.2 实验结果 064
5.5.3 讨论 065
5.6 未来展望 066
5.7 小结 067
第6章 阿尔茨海默病智能辅助诊断的可解释性学习 068
6.1 引言 068
6.2 可解释的阿尔茨海默病的诊治 069
6.3 相关工作 070
6.4 模型构建 070
6.4.1 建模数据集 070
6.4.2 建模分析 071
6.4.3 文本相似度计算 072
6.5 实验结果与讨论 073
6.5.1 模型效能评价 073
6.5.2 模型对比评价 074
6.6 模型的可解释性 074
6.7 小结 077
第7章 使用多模态特征诊断轻度认知障碍和阿尔茨海默病 078
7.1 背景 078
7.2 数据预处理 079
7.3 特征抽取方法 080
7.3.1 语音学特征 081
7.3.2 人口统计学特征 081
7.3.3 语言学特征 082
7.4 分类器 083
7.5 不同分类特征下的性能 083
7.6 结论 086
第8章 基于特征净化网络的阿尔茨海默病检测的改进 087
8.1 相关研究 088
8.2 数据采集与预处理 090
8.3 特征净化网络模型GP-Net 090
8.3.1 词嵌入 091
8.3.2 G-Net模块提取共同特征 092
8.3.3 利用P-Net模型计算净化特征 092
8.3.4 实验参数及结果 093
8.4 讨论 095
8.5 结论 096
第9章 基于上下文注意力特征的阿尔茨海默病隐式情感分析 097
9.1 背景 097
9.2 基于声学及其转录文本的AD智能诊断 100
9.3 注意力网络 102
9.3.1 基于GRU的网络架构 102
9.3.2 Word编码器 103
9.3.3 词注意力 103
9.3.4 句子编码器 103
9.3.5 句子注意力 104
9.3.6 文档分类 104
9.4 实验 104
9.4.1 Pitt语料库 104
9.4.2 模型配置和结构 105
9.4.3 结果和分析 105
9.5 基于注意力网络的消融研究 107
9.6 注意特征的可视化 107
9.7 结论 108
第10章 基于“波士顿失语症检测”的临床小样本实证分析 110
10.1 实验内容 110
10.2 数据采集及预处理 110
10.2.1 研究对象 111
10.2.2 痴呆严重程度分级 111
10.2.3 统计学分析 112
10.2.4 特征提取 112
10.2.5 分类结果 112
10.3 小结 114
第11章 总结与展望 116
11.1 人工智能未来发展趋势分析 116
11.2 深度学习原理 120
11.3 结论 121
11.4 研究的不足之处 122
11.5 今后研究的建议 123
11.6 工作展望 123
参考文献 125
重要名词缩写 143
|
內容試閱:
|
随着人口老龄化的发展,阿尔茨海默病(Alzheimer’s disease,AD)患者的比例也越来越高,给个人、家庭和国家带来沉重的社会和经济负担,已经成为一个迫切需要解决的公共卫生问题。AD是一种潜在的、不可逆的神经退行性疾病,对AD高风险人群进行早期诊断和预防可以延缓病情发展,符合“上工治未病”思想,是最经济有效的健康策略。我国中医自古就有通过听声音辨识疾病的方法,临床研究也发现高风险人群在发展到严重的AD阶段前就已经表现出语言障碍,所以利用声音和语言学特征来对AD早期进行智能辅助诊断是一种可行的方案。笔者通过人工智能方法构建AD早期智能辅助诊断模型,在多个公共数据集和实证研究数据集上证明模型的有效性。通过人工智能自动分析高风险人群的语言障碍,推广使用基于声音和文本信息的AD早期诊断家庭监护系统,可以为AD的“早筛查、早诊断、早干预”健康管理提供经济、安全、可靠的方法,这对AD患者的早期诊断和干预具有重要现实意义。
针对AD患者言语信息的早期诊断问题,通过提出问题、制订研究方案、方案实施及调整、评价反馈的方式展开研究。在制订、实施及调整研究方案的过程中,以前期研究为基础,结合文献检索及专家咨询方案,制订实验的实施方案。本研究秉承“治未病”思想和健康管理的理念,基于波士顿诊断性失语症检测图片描述任务中的患者言语信息建立AD智能辅助诊断模型,实验数据集包括语音信号和转录文本两种模态,本书第4~9章的实验都是采用此方法建立的中文或英文公开数据集。基于此,本研究构建了语音和文本信息融合的AD智能辅助诊断模型,为开发家庭监护系统奠定核心技术基础。本书研究内容如下。
第一,提出了一种“治未病”理念下AD智能辅助诊断和健康管理方案。
预防是中医治未病管理的核心,早期诊断是AD健康管理的切入口,也是后期个性化分级诊疗的基础。本研究采用人工智能方法建立的AD辅助诊断模型是健康风险评估的重要手段之一,可以在疾病还未发生或者还未加重、可治愈的阶段进行早期的诊断、治疗和康复,体现“治未病”的思想理念。
第二,构建了一种基于语音和文本特征的AD智能辅助诊断模型。
围绕健康管理理念的健康监测、健康评估方法建立AD智能辅助诊断模型。健康监测即数据的收集和预处理工作,本研究采用基于图片描述任务的公共数据集。健康评估方法即通过建立AD智能辅助诊断模型进行认知等级分类。通过调查研究发现前期研究缺乏基于时间的语音和语言学特征提取方法,尤其是基于语言学的中文数据的特征提取方法较少。本研究开创性地提出了一种基于时间标记的语音和中文文本特征的提取方法。通过数据探索分析找到数据隐藏的内在规律,并提取可解释性的特征参数,将这些特征参数加上人口学特征放入人工智能分类算法中,AD识别的最高准确率为80%,F1值为0.75,高于F1的基线值为0.667。同时研究发现年龄对评估模型的影响力最大。
第三,采用迁移学习解决了AD智能辅助诊断中的小样本问题。
大数据集的匮乏限制了复杂模型的使用,迁移学习可以有效解决这一难题。本研究首先在大数据集上训练通用预训练语言模型,再将模型迁移到小样本数据集上,微调模型的少量参数并进行文本分类任务。基于此方法构建的预训练模型得到AD诊断的准确率为88%,几乎与公开数据集当年比赛的冠军分数相当,较设定的75%的基线准确率有很大提高。本研究的迁移学习方法改进了AD辅助诊断的表现,不仅减少了特征工程的需求,而且有效解决了数据集不足的问题。
第四,提出了一种AD智能辅助诊断的可解释性学习方法。
针对深度学习常见的不可解释性问题,提出了一种能有效提高模型可解释性的方法。本研究尝试将转录文本的对话内容按照类别分类,采用TF-IDF算法提取转录文本的关键词。通过余弦距离分别计算新样本关键词与两类人群关键词的相似度,基于KNN算法思想,距离近者类别相同。所提出的方法得到令人满意的准确率(97.77%)和F1值(0.98)。较基线准确率(66.7%)有很大的提高,训练过程简单高效。同时,对模型的可解释性学习进行研究,通过分析患者的语言学表现,发现AD患者比正常对照组使用较少的名词和动词。
第五,AD是一种常见的痴呆,影响患者的语言功能、记忆、认知和视觉空间能
力。越来越多的研究在寻找无创、可及、经济有效的方法来检测AD,语音被证明与AD有关系,所以在医生办公室诊断AD的时代即将到来。利用2020年ADReSS数据集检测性别和年龄平衡的AD。首先,笔者提取了三类特征参数:用Opensmile软件提取的声学特征,自动Bert嵌入和人工提取的复杂语言特征。语言特征主要体现在词性标记、词汇丰富性、流畅性、语义特征等方面。其次,使用7种不同的分类器,包括SVM、Logistic回归、随机森林、额外树、Adaboost、LightGBM和一种带有多数投票策略的新型集成方法来克服基分类器造成的误差。最后,采用十倍交叉验证法对此方法进行评价。此外,将单个特征及其组合特征输入到6个基分类器中,进行分类器集成。在分类器集成的测试集上得到了最好的分类结果,最佳准确率为85.4%。特征集的性能最好的是语言特征,使用LightGBM分类器的准确率为85.6%,使用SFS方法表现了7个区分性语言特征。统计和实验结果表明,基于语音和语言特征参数有效地预测AD是可行的。更强的分类器和区分特征是至关重要的最终结果。我们强调预测AD的最佳语言特征是基于词性标签、词汇丰富度、流利度和语义特征。分类器集成通常比单个分类器具有更好的性能。 ?
第六,AD是一种神经退行性疾病,随着病情的发展,认知能力会下降。目前AD的诊断主要依靠医生对患者的面谈,但整个过程往往缓慢、价格昂贵且具有主观性。因此,寻求一种比单纯依靠神经心理学检查更好的方法来诊断AD是至关重要的。最近的研究表明,语言分析在AD诊断方面具有潜力。在本研究中,笔者提出了一种新的特征净化网络,可以进一步改善Transformer模型的表示学习。虽然Transformer凭借其远程推理能力在产生判别特征方面取得了很大的进展,但仍有改进的空间。由于存在许多不代表任何特定类的共同特征,笔者将Transformer编码器提取的传统特征中所包含的共同特征进行了剔除,以获得更具辨别力的特征进行分类。基于3个公共痴呆数据集,笔者将该方法应用于Transformer的性能改进,在分类方面取得了显著的改进,特别是在Pitt数据集上获得的最先进的SOTA。
第七,通过语音学和文本提取特征是早期AD识别的有效方法,可以构建早期AD分类预测模型。本研究通过提取语言学、声学和人口学的多模态特征,采用人工智能的算法识别AD和MCI患者,并对各个不同的特征组合及机器学习算法分别进行对比研究。在2019年科大讯飞举办的“阿尔茨海默病预测挑战赛”中的数据集,LightGBM算法识别效果最好,并通过研究发现,年龄是AD识别最重要的影响因素。
第八,语言障碍可能是痴呆患者重要的早期表现。通过引入带有注意力机制的Transformer,其效果好于传统的RNN和CNN模型。但是,对于隐式情感的表达,其仍有可以提升的空间。本研究提出的一种新的特征净化网络模型,针对不同词语的重要性赋予不同的权重,通过持续改进Transformer模型的表征学习,可以生成更有区别力的特征。
第九,基于波士顿失语症检测的转录文本因为是隐式情感表达,目前常见的深度学习模型很难提取有效的特征参数。本研究利用注意力机制对不同的信息词汇和句子进行定性选择。即采用一种两层注意力模型,将重要的单词聚集到句子,将重要的句子汇聚到文档中构建。本研究为隐式情感的分类任务提供了借鉴和参考的价值。
第十,基于“波士顿失语症检测”的临床小样本实证分析。为了验证本研究提出的模型在临床实际中的效果,本书基于“波士顿失语症检测”,在医院、养老院所采集的临床数据进行临床小样本量的验证以证明前期提出模型的有效性,对真实世界的数据进行实证分析。通过数据预处理、特征的统计学分析、特征提取等一系列操作,最终有效地识别AD患者。
第十一,对本论文内容进行分析和总结,并指出研究存在的问题,并对后续工作做了进一步的分析和展望。
著 者
2023年3月
|
|