新書推薦:
《
别纠结啦:不被情绪牵着走的通透生活指南(“当代一休”小池龙之介治愈新作!附赠精美书签!)
》
售價:NT$
295.0
《
第二人生:找到重新定义人生的智慧
》
售價:NT$
440.0
《
唐朝三百年
》
售價:NT$
490.0
《
反操纵心理学:夺回人生主导权 拒绝被操纵
》
售價:NT$
249.0
《
同工异曲:跨文化阅读的启示(修订版)(师承钱锺书先生,比较文学入门,体量小但内容丰,案例文笔皆精彩)
》
售價:NT$
199.0
《
牛津立法研究手册
》
售價:NT$
1630.0
《
制度为什么重要:政治科学中的新制度主义(人文社科悦读坊)
》
售價:NT$
290.0
《
梦醒子:一位华北乡居者的人生(1857—1942))(第2版)
》
售價:NT$
340.0
|
內容簡介: |
本书由国际数据挖掘领域泰斗、UIUC韩家玮教授和其学生张超博士(现为佐治亚理工学院助理教授)合著。介绍了将非结构化文本数据转换为多维知识的数据挖掘技术,并讲解了他们开发的文本多维数据集框架的原理和使用方法。
|
關於作者: |
译者简介
第1章 引言1
1.1 概述1
1.2 主要部分3
1.2.1 第一部分:立方体构造3
1.2.2 第二部分:立方体开发5
1.2.3 示例应用5
1.3 技术路线6
1.3.1 任务1:分类器生成7
1.3.2 任务2:文档分配8
1.3.3 任务3:多维摘要8
1.3.4 任务4:跨维度预测9译者序
作者简介
译者简介
第1章 引言1
1.1 概述1
1.2 主要部分3
1.2.1 第一部分:立方体构造3
1.2.2 第二部分:立方体开发5
1.2.3 示例应用5
1.3 技术路线6
1.3.1 任务1:分类器生成7
1.3.2 任务2:文档分配8
1.3.3 任务3:多维摘要8
1.3.4 任务4:跨维度预测9
1.3.5 任务5:异常事件检测9
1.3.6 小结9
1.4 本书大纲10
第一部分 立方体构造算法
第2章 主题级分类器生成12
2.1 概述12
2.2 相关工作15
2.2.1 监督分类器学习15
2.2.2 基于模式的提取15
2.2.3 基于聚类的分类器构建16
2.3 准备工作17
2.3.1 问题定义17
2.3.2 方法概述17
2.4 自适应词聚类18
2.4.1 划分主题的球形聚类18
2.4.2 识别代表性词语20
2.5 自适应词嵌入21
2.5.1 分布式词语表示21
2.5.2 学习局部词嵌入21
2.6 实验评估22
2.6.1 实验设计22
2.6.2 定性结果24
2.6.3 定量分析27
2.7 小结29
第3章 词语级分类器生成30
3.1 概述30
3.2 相关工作32
3.3 问题定义33
3.4 HiExpan框架33
3.4.1 框架概述33
3.4.2 关键词提取34
3.4.3 层次树扩展34
3.4.4 分类器全局优化41
3.5 实验42
3.5.1 实验设计42
3.5.2 定性结果43
3.5.3 定量结果44
3.6 小结47
第4章 弱监督文本分类48
4.1 概述48
4.2 相关工作51
4.2.1 潜在变量模型51
4.2.2 基于嵌入的模型51
4.3 准备工作52
4.3.1 问题定义52
4.3.2 方法概述53
4.4 伪文档生成53
4.4.1 建模类分布53
4.4.2 生成伪文档55
4.5 自训练的神经模型56
4.5.1 神经模型预训练56
4.5.2 神经模型自训练57
4.5.3 基于CNN和RNN的实例化58
4.6 实验59
4.6.1 数据集59
4.6.2 基线59
4.6.3 实验设计60
4.6.4 实验结果61
4.6.5 参数研究65
4.6.6 案例研究67
4.7 小结68
第5章 弱监督层次文本分类69
5.1 概述69
5.2 相关工作71
5.2.1 弱监督文本分类71
5.2.2 层次文本分类71
5.3 问题定义72
5.4 伪文档生成72
5.5 层次分类模型74
5.5.1 局部分类器预训练75
5.5.2 全局分类器自训练75
5.5.3 阻断机制77
5.5.4 推导77
5.5.5 算法概述77
5.6 实验78
5.6.1 实验设计78
5.6.2 定量比较80
5.6.3 组件评估82
5.7 小结84
第二部分 立方体开发算法
第6章 多维摘要86
6.1 概述86
6.2 相关工作89
6.3 准备工作90
6.3.1 文本立方体准备90
6.3.2 问题定义91
6.4 排名度量91
6.4.1 普遍性和完整性92
6.4.2 邻域敏感的独特性92
6.5 RepPhrase方法96
6.5.1 简介96
6.5.2 混合离线物化97
6.5.3 最优在线处理100
6.6 实验101
6.6.1 实验设计101
6.6.2 有效性评估103
6.6.3 效率评估107
6.7 小结111
第7章 立方体空间中的跨维度预测112
7.1 概述112
7.2 相关工作114
7.3 准备工作115
7.3.1 问题描述115
7.3.2 方法概述115
7.4 半监督多模态嵌入117
7.4.1 无监督重构任务117
7.4.2 监督分类任务119
7.4.3 优化程序119
7.5 多模态嵌入的在线更新120
7.5.1 生命衰减学习120
7.5.2 基于约束的学习121
7.5.3 复杂度分析124
7.6 实验124
7.6.1 实验设计124
7.6.2 定量比较127
7.6.3 案例研究129
7.6.4 参数影响132
7.6.5 下游应用134
7.7 小结135
第8章 立方体空间中的事件检测136
8.1 概述136
8.2 相关工作138
8.2.1 突发事件检测138
8.2.2 时空事件检测139
8.3 准备工作140
8.3.1 问题定义140
8.3.2 方法概述140
8.3.3 多模态嵌入142
8.4 候选生成143
8.4.1 贝叶斯混合聚类模型144
8.4.2 参数评估145
8.5 候选分类146
8.5.1 多模态嵌入的特征推导146
8.5.2 分类过程147
8.6 支持持续的事件检测147
8.7 复杂度分析148
8.8 实验148
8.8.1 实验设计148
8.8.2 定性结果150
8.8.3 定量结果153
8.8.4 可扩展性研究154
8.8.5 特征的重要性155
8.9 小结156
第9章 结论157
9.1 总结157
9.2 未来工作158
参考文献160
|
目錄:
|
译者序
作者简介
译者简介
第1章 引言1
1.1 概述1
1.2 主要部分3
1.2.1 第一部分:立方体构造3
1.2.2 第二部分:立方体开发5
1.2.3 示例应用5
1.3 技术路线6
1.3.1 任务1:分类器生成7
1.3.2 任务2:文档分配8
1.3.3 任务3:多维摘要8
1.3.4 任务4:跨维度预测9
1.3.5 任务5:异常事件检测9
1.3.6 小结9
1.4 本书大纲10
第一部分 立方体构造算法
第2章 主题级分类器生成12
2.1 概述12
2.2 相关工作15
2.2.1 监督分类器学习15
2.2.2 基于模式的提取15
2.2.3 基于聚类的分类器构建16
2.3 准备工作17
2.3.1 问题定义17
2.3.2 方法概述17
2.4 自适应词聚类18
2.4.1 划分主题的球形聚类18
2.4.2 识别代表性词语20
2.5 自适应词嵌入21
2.5.1 分布式词语表示21
2.5.2 学习局部词嵌入21
2.6 实验评估22
2.6.1 实验设计22
2.6.2 定性结果24
2.6.3 定量分析27
2.7 小结29
第3章 词语级分类器生成30
3.1 概述30
3.2 相关工作32
3.3 问题定义33
3.4 HiExpan框架33
3.4.1 框架概述33
3.4.2 关键词提取34
3.4.3 层次树扩展34
3.4.4 分类器全局优化41
3.5 实验42
3.5.1 实验设计42
3.5.2 定性结果43
3.5.3 定量结果44
3.6 小结47
第4章 弱监督文本分类48
4.1 概述48
4.2 相关工作51
4.2.1 潜在变量模型51
4.2.2 基于嵌入的模型51
4.3 准备工作52
4.3.1 问题定义52
4.3.2 方法概述53
4.4 伪文档生成53
4.4.1 建模类分布53
4.4.2 生成伪文档55
4.5 自训练的神经模型56
4.5.1 神经模型预训练56
4.5.2 神经模型自训练57
4.5.3 基于CNN和RNN的实例化58
4.6 实验59
4.6.1 数据集59
4.6.2 基线59
4.6.3 实验设计60
4.6.4 实验结果61
4.6.5 参数研究65
4.6.6 案例研究67
4.7 小结68
第5章 弱监督层次文本分类69
5.1 概述69
5.2 相关工作71
5.2.1 弱监督文本分类71
5.2.2 层次文本分类71
5.3 问题定义72
5.4 伪文档生成72
5.5 层次分类模型74
5.5.1 局部分类器预训练75
5.5.2 全局分类器自训练75
5.5.3 阻断机制77
5.5.4 推导77
5.5.5 算法概述77
5.6 实验78
5.6.1 实验设计78
5.6.2 定量比较80
5.6.3 组件评估82
5.7 小结84
第二部分 立方体开发算法
第6章 多维摘要86
6.1 概述86
6.2 相关工作89
6.3 准备工作90
6.3.1 文本立方体准备90
6.3.2 问题定义91
6.4 排名度量91
6.4.1 普遍性和完整性92
6.4.2 邻域敏感的独特性92
6.5 RepPhrase方法96
6.5.1 简介96
6.5.2 混合离线物化97
6.5.3 最优在线处理100
6.6 实验101
6.6.1 实验设计101
6.6.2 有效性评估103
6.6.3 效率评估107
6.7 小结111
第7章 立方体空间中的跨维度预测112
7.1 概述112
7.2 相关工作114
7.3 准备工作115
7.3.1 问题描述115
7.3.2 方法概述115
7.4 半监督多模态嵌入117
7.4.1 无监督重构任务117
7.4.2 监督分类任务119
7.4.3 优化程序119
7.5 多模态嵌入的在线更新120
7.5.1 生命衰减学习120
7.5.2 基于约束的学习121
7.5.3 复杂度分析124
7.6 实验124
7.6.1 实验设计124
7.6.2 定量比较127
7.6.3 案例研究129
7.6.4 参数影响132
7.6.5 下游应用134
7.7 小结135
第8章 立方体空间中的事件检测136
8.1 概述136
8.2 相关工作138
8.2.1 突发事件检测138
8.2.2 时空事件检测139
8.3 准备工作140
8.3.1 问题定义140
8.3.2 方法概述140
8.3.3 多模态嵌入142
8.4 候选生成143
8.4.1 贝叶斯混合聚类模型144
8.4.2 参数评估145
8.5 候选分类146
8.5.1 多模态嵌入的特征推导146
8.5.2 分类过程147
8.6 支持持续的事件检测147
8.7 复杂度分析148
8.8 实验148
8.8.1 实验设计148
8.8.2 定性结果150
8.8.3 定量结果153
8.8.4 可扩展性研究154
8.8.5 特征的重要性155
8.9 小结156
第9章 结论157
9.1 总结157
9.2 未来工作158
参考文献160
|
|