新書推薦:
《
大单元教学设计20讲
》
售價:NT$
347.0
《
儿童自我关怀练习册:做自己最好的朋友
》
售價:NT$
316.0
《
高敏感女性的力量(意大利心理学家FSP博士重磅力作。高敏感是优势,更是力量)
》
售價:NT$
286.0
《
元好问与他的时代(中华学术译丛)
》
售價:NT$
398.0
《
汽车传感器结构·原理·检测·维修
》
售價:NT$
500.0
《
怪谈百物语:不能开的门(“日本文学史上的奇迹”宫部美雪重要代表作!日本妖怪物语集大成之作,系列累销突破200万册!)
》
售價:NT$
296.0
《
罗马政治观念中的自由
》
售價:NT$
230.0
《
中国王朝内争实录:宠位厮杀
》
售價:NT$
281.0
|
內容簡介: |
对从事人工智能算法研究与算法开发的人来说,模型的学习与使用必不可少。尤其是在目前如日中天的人工智能领域里,人人谈模型,模型也是层出不穷,让人眼花缭乱。本书将人工智能在现实生活场景中解决的问题分类,并根据这个分类来介绍各种人工智能模型。书中将人工智能问题分为权重问题、状态问题、序列问题、表示问题、相似问题和分类问题六大类,方便读者了解各个模型之间的关系,也方便读者理解各个模型的适用场景。本书不仅适合希望学习和运用人工智能模型到具体应用场景的企业工程师、科研院所的学生和科研人员,也适合对人工智能模型感兴趣的读者,使其将模型思维应用到生活中。
|
關於作者: |
龚才春毕业于中国科学院计算技术研究所,工学博士学位;教授,博士生导师;长期从事人工智能与人力资源等领域的研究。中关村科金技术人工智能研究院院长,职品汇创始人,大街网原首席科学家,阿里巴巴原搜索研发专家。在大数据挖掘方面有许多成功经验,创办了大数据虚假简历识别平台职品汇;在自然语言处理,尤其是语义理解、知识图谱等方面有深刻理解,中文幽默识别是其一个有特色的研究工作;曾负责淘宝评论的情感分析等工作。
|
目錄:
|
第1篇 模型为什么这么神奇
模型是一个很常见的名词。与人力资源管理相关的有漏斗模型、人才模型、定级模型等;与工程师相关的有线性回归模型、隐马尔可夫模型、LDA模型等;与业务相关的有价格预测模型、销量预测模型等;与销售相关的有SSM模型、销售漏斗模型、销售能力模型等;与营销相关的有市场冲突矩阵模型、品牌五力模型、区域营销模型等……但到底什么是模型、怎么选择合适的模型、怎么创新模型,则是仁者见仁,智者见智。
第1章 为什么要建立模型 2
1.1 什么是模型 2
1.2 无处不在的模型 4
1.3 模型的意义 4
1.3.1 万有引力定律 4
1.3.2 大陆漂移假说 5
1.3.3 日心说 5
1.4 模型都是对的吗 6
1.4.1 模型可以是错的 6
1.4.2 模型可以是未被证实的 7
1.4.3 模型可以是互相矛盾的 7
1.5 什么模型是好模型 8
1.5.1 表示客观事物的能力 8
1.5.2 简化客观事物的能力 9
1.5.3 评价模型好坏的模型 9
1.6 模型的演化 9
1.7 正确看待模型的价值与缺陷 10
1.7.1 正确看待模型的局限性 10
1.7.2 用历史的观点看模型 10
1.7.3 抛弃对模型的阶级观点 11
1.7.4 用发展的观点看模型 11
1.8 本书的特点 12
1.8.1 对读者的基础要求 12
1.8.2 从场景出发讲模型 12
1.8.3 从方法论的视角讲模型 13
1.8.4 用类比的技巧讲模型 13
1.8.5 避免读者被数学公式吓倒 13
1.8.6 避免“知识的诅咒” 14
1.9 本书主要内容 14
1.9.1 权重模型 15
1.9.2 状态模型 15
1.9.3 序列模型 15
1.9.4 表示模型 16
1.9.5 相似模型 16
1.9.6 分类模型 16
第2章 模型的运用 18
2.1 用知识图谱表示问题 18
2.1.1 知识图谱的基本理念 18
2.1.2 建立知识图谱的一般步骤 19
2.1.3 问题的属性研究 19
2.1.4 问题的关系研究 20
2.2 问题分析的示例 20
2.2.1 前提假设分析 20
2.2.2 已有数据的分析 21
2.2.3 待求数据的分析 21
2.2.4 关系分析 21
2.3 权重问题的判断 22
2.4 状态问题的判断 24
2.5 序列问题的判断 25
2.6 表示问题的判断 25
2.7 相似问题的判断 26
2.8 分类问题的判断 26
2.9 模型之间的关系 27
第2篇 权重模型:计算你的分量
世界上的万事万物,纷繁复杂,让人眼花缭乱。几千年来,人类一直在试图发现事物背后的共性规律。在计算机学者眼里,世界上几乎所有问题,终都可以归结为权重计算的问题。
权重问题是一个通用问题,在各个学科都已经有许多深入的研究,也已经整理了许多计算各种各样权重的方法。将这些权重计算方法进行整理并抽象,就简化为模型了。
第3章 TF-IDF模型 33
3.1 应用场景 33
3.2 词频率—逆文档频率模型的计算 34
3.2.1 词频率模型 34
3.2.2 逆文档频率模型 37
3.2.3 TF-IDF模型 39
3.3 词权重模型的平滑 40
3.4 引申阅读 40
3.4.1 发明历史 41
3.4.2 发明人简介 41
3.4.3 研究 42
3.5 本章总结 42
第4章 线性回归模型 43
4.1 应用场景 43
4.2 直观理解回归问题 44
4.3 一元线性回归问题 45
4.3.1 钢轨长度与温度的关系直线 45
4.3.2 判断合适直线的两个原则 47
4.3.3 小二乘法 50
4.4 多元线性回归问题 52
4.5 标准方程法 53
4.5.1 一些符号定义 53
4.5.2 矩阵表示 54
4.5.3 参数求解 55
4.5.4 用标准方程法计算银行授信
额度 58
4.6 梯度下降法 60
4.6.1 梯度下降法的直观理解 60
4.6.2 坡度陡下山法 63
4.6.3 坡度陡下山法的类比 64
4.6.4 梯度下降法的计算 66
4.6.5 银行授信额度的计算 67
4.7 梯度下降法与标准方程法的区别 68
4.8 引申阅读 69
4.8.1 小二乘法的发明 69
4.8.2 梯度下降法的发明 69
4.8.3 研究 69
4.9 本章总结 71
第5章 PageRank模型 73
5.1 应用场景 73
5.2 PageRank的直观算法 74
5.2.1 PageRank模型的直观理解 75
5.2.2 模型的初始化 77
5.2.3 模型的迭代 79
5.3 直观算法的漏洞修复 81
5.3.1 非连通漏洞 81
5.3.2 过河拆桥型漏洞 82
5.3.3 孤芳自赏型漏洞 85
5.3.4 过分谦虚型漏洞 85
5.3.5 随机游走模型 86
5.4 PageRank模型的计算 88
5.4.1 链接关系表 88
5.4.2 链接浏览矩阵 88
5.4.3 直接浏览矩阵 89
5.4.4 状态转移矩阵 89
5.4.5 迭代计算 90
5.4.6 计算示例 91
5.5 引申阅读 92
5.5.1 收敛性证明 93
5.5.2 发明历史 94
5.5.3 发明人简介 94
5.5.4 相关研究 95
5.6 本章总结 95
第3篇 状态模型:加官进爵的模型
事物是变化的,我们也要从意识形态上跟上客观事物的变化,否则就会犯“刻舟求剑”的笑话。目前,好的描述事物状态改变的模型是自动机模型,又被称为有限状态自动机模型。
在计算机领域,有很多自动机模型的应用场景。例如常见的正向匹配分词算法其实就是一个自动机模型;在自然语言处理中,中文分词、语音识别、词性标注、字符串查找、拼写纠错、模糊匹配等都是自动机模型的变种;在网络安全领域中,我们熟悉的病毒扫描场景,很多都使用了AC自动机模型,这也是一种状态转移自动机模型。
第6章 有限状态自动机模型 100
6.1 应用场景 100
6.1.1 Java词法分析 100
6.1.2 Java词法分析示例 101
6.2 直观理解与形式化描述 103
6.2.1 自动机模型的直观理解 103
6.2.2 形式化描述 105
6.4 词法分析自动机模型 105
6.4.1 注释识别自动机 105
6.4.2 保留字识别自动机 107
6.5 地址解析自动机模型 108
6.5.1 地址解析场景概述 108
6.5.2 地址解析的难度 109
6.5.3 标准地址库建设 110
6.5.4 地址识别自动机模型 111
6.6 引申阅读 113
6.6.1 发明历史 113
6.6.2 发明人简介 114
6.6.3 研究 114
6.7 本章总结 115
第7章 模式匹配自动机模型 116
7.1 应用场景 116
7.2 形式化描述 118
7.3 BF模式匹配算法 118
7.3.1 BF算法的直观理解 118
7.3.2 BF算法的匹配过程示例 119
7.3.3 BF算法的伪码表示 121
7.3.4 BF算法的自动机模型 121
7.4 RK模式匹配算法 122
7.5 KMP模式匹配算法 123
7.5.1 KMP算法的直观理解 123
7.5.2 KMP算法的匹配过程示例 125
7.5.3 移动长度的计算 127
7.5.4 KMP算法的自动机模型 129
7.5.5 KMP算法的总结 129
7.6 BM模式匹配算法 129
7.6.1 后向BF算法 130
7.6.2 实现跳跃式匹配 131
7.6.3 基于坏字符的模式匹配过程 132
7.6.4 坏字符匹配算法的缺陷 137
7.6.5 好后缀的匹配规则 138
7.6.6 BM模式匹配算法介绍 141
7.6.7 BM算法的自动机模型 143
7.7 AC模式匹配算法 143
7.7.1 TRIE树的使用 144
7.7.2 TRIE树的构建 145
7.7.3 失效指针的直观理解 146
7.7.4 失效指针的设置示例 147
7.7.5 失效指针的设置算法 150
7.7.6 AC算法的匹配过程示例 152
7.8 Wu-Manber模式匹配算法 153
7.8.1 Wu-Manber算法的直观理解 153
7.8.2 Wu-Manber算法的总体思路 155
7.8.3 字符块 156
7.8.4 后移长度数组 157
7.8.5 字符块的哈希值 159
7.8.6 倒排链表 159
7.8.7 前缀哈希值 160
7.8.8 Wu-Manber算法的匹配过程
示例 161
7.9 引申阅读 163
7.10 本章总结 166
第4篇 序列模型:揭示现象背后的规律
序列模型,就是根据可观察的现象序列,探索其背后不可观察的神秘序列。我们能够想到的需要探索现象背后的逻辑、本质、规律、定律、天道等,都可以归结为序列模型。
第8章 隐马尔可夫模型 170
8.1 应用场景 171
8.2 马尔可夫链 171
8.3 隐马尔可夫模型的定义 173
8.3.1 直观定义 173
8.3.2 形式化定义 174
8.3.3 盲人与苔藓的例子 174
8.4 两个假设 176
8.4.1 齐次马尔可夫假设 176
8.4.2 观察独立性假设 176
8.5 评估问题 177
8.5.1 评估问题的应用价值 177
8.5.2 暴力求解法 178
8.5.3 前向算法 179
8.5.4 前向算法的形式化描述 185
8.5.5 前向算法的算法描述 186
8.5.6 后向算法 187
8.6 解码问题 190
8.6.1 暴力求解法 190
8.6.2 维特比算法 190
8.6.3 维特比算法的形式化描述 197
8.7 学习问题 198
8.7.1 监督学习 199
8.7.2 非监督学习 201
8.7.3 一个更简单的EM算法例子 202
8.7.4 更好一点的算法 205
8.7.5 直观方法 206
8.7.6 Baum-Welch算法 207
8.7.7 Baum-Welch算法的伪码描述 212
8.8 引申阅读 213
8.8.1 发明人简介 213
8.8.2 研究 214
8.9 本章总结 215
第9章 熵模型 216
9.1 应用场景 216
9.1.1 语义消歧 216
9.1.2 音字转换 217
9.1.3 其他常见场景 217
9.2 直观理解熵 217
9.2.1 熵增加原理 217
9.2.2 熵的定义 218
9.2.3 不要把鸡蛋放在同一个篮子里 219
9.2.4 不要随意添加主观假设 219
9.3 简单的熵计算示例 220
9.3.1 方程组求解 220
9.3.2 熵化 221
9.3.3 拉格朗日乘子法 221
9.3.4 骰子的概率计算 223
9.3
|
|