新書推薦:
《
南方谈话:邓小平在1992
》
售價:NT$
367.0
《
纷纭万端 : 近代中国的思想与社会
》
售價:NT$
500.0
《
中国古代文体形态研究(第四版)(中华当代学术著作辑要)
》
售價:NT$
765.0
《
朋党之争与北宋政治·大学问
》
售價:NT$
454.0
《
甲骨文丛书·波斯的中古时代(1040-1797年)
》
售價:NT$
403.0
《
以爱为名的支配
》
售價:NT$
286.0
《
台风天(大吴作品,每一种生活都有被看见的意义)
》
售價:NT$
245.0
《
打好你手里的牌(斯多葛主义+现代认知疗法,提升当代人的心理韧性!)
》
售價:NT$
301.0
|
編輯推薦: |
整合R语言深藏不漏的强大威力,决胜数据分析之巅
且听我将统计学之精髓娓娓道来,助你砥砺大数据时代的掘金技法
探寻数据挖掘之术,拨开机器学习迷雾,点破公式背后的层层玄机
|
內容簡介: |
经典统计理论和机器学习方法为数据挖掘提供了必要的分析技术。本书系统地介绍统计分析和机器学习领域中最为重要和流行的多种技术及其基本原理,在详解有关算法的基础上,结合大量R语言实例演示了这些理论在实践中的使用方法。具体内容被分成三个部分,即R语言编程基础、基于统计的数据分析方法以及机器学习理论。统计分析与机器学习部分又具体介绍了参数估计、假设检验、极大似然估计、非参数检验方法(包括列联分析、符号检验、符号秩检验等)、方差分析、线性回归(包括岭回归和Lasso方法)、逻辑回归、支持向量机、聚类分析(包括K均值算法和EM算法)和人工神经网络等内容。同时,统计理论的介绍也为深化读者对于后续机器学习部分的理解提供了很大助益。知识结构和阅读进度的安排上既兼顾了循序渐进的学习规律,亦统筹考虑了夯实基础的必要性。本书内容与实际应用结合紧密,又力求突出深入浅出、系统翔实之特色,对算法原理的解释更是细致入微。
|
目錄:
|
目录
第1章 初识R语言1
1.1 R语言简介1
1.2 安装与运行3
1.3 开始使用R5
1.4 包的使用7
1.5 使用帮助8
第2章 探索R数据10
2.1 向量的创建10
2.2 向量的运算13
2.3 向量的筛选15
2.4 矩阵的创建17
2.5 矩阵的使用20
2.5.1 矩阵的代数运算20
2.5.2 修改矩阵的行列22
2.5.3 对行列调用函数23
2.6 矩阵的筛选25
第3章 编写R程序28
3.1 流程的控制28
3.1.1 条件选择结构的概念28
3.1.2 条件选择结构的语法29
3.1.3 循环结构的基本概念30
3.1.4 循环结构的基本语法31
3.2 算术与逻辑33
3.3 使用函数34
3.3.1 函数式语言34
3.3.2 默认参数值35
3.3.3 自定义函数36
3.3.4 递归的实现38
3.4 编写代码40
第4章 概率统计基础42
4.1 概率论的基本概念42
4.2 随机变量数字特征45
4.2.1 期望45
4.2.2 方差46
4.3 基本概率分布模型48
4.3.1 离散概率分布48
4.3.2 连续概率分布52
4.3.3 使用内嵌分布55
4.4 大数定理及其意义59
4.5 中央极限定理62
4.6 随机采样分布65
第5章 实用统计图形71
5.1 饼状图71
5.2 直方图74
5.3 核密图78
5.4 箱线图81
5.4.1 箱线图与分位数81
5.4.2 使用并列箱线图84
5.5 条形图87
5.5.1 基本条形图及调整87
5.5.2 堆砌与分组条形图88
5.6 分位数与QQ图91
第6章 数据输入输出99
6.1 数据的载入99
6.1.1 基本的数据导入方法99
6.1.2 处理其他软件的格式103
6.1.3 读取来自网页的数据104
6.1.4 从数据库中读取数据106
6.2 数据的保存108
6.3 数据预处理109
6.3.1 常用数学函数110
6.3.2 修改数据标签113
6.3.3 缺失值的处理114
第7章 高级数据结构118
7.1 列表118
7.1.1 列表的创建118
7.1.2 列表元素的访问120
7.1.3 增删列表元素121
7.1.4 拼接列表123
7.1.5 列表转化为向量123
7.1.6 列表上的运算124
7.1.7 列表的递归125
7.2 数据框126
7.2.1 数据框的创建126
7.2.2 数据框元素的访问128
7.2.3 提取子数据框129
7.2.4 数据框行列的添加130
7.2.5 数据框的合并132
7.2.6 数据框的其他操作134
7.3 因子135
7.3.1 因子的创建136
7.3.2 因子中插入水平137
7.3.3 因子和常用函数138
7.4 表140
7.4.1 表的创建141
7.4.2 表中元素的访问143
7.4.3 表中变量的边际值143
第8章 统计推断146
8.1 参数估计146
8.1.1 参数估计的基本原理146
8.1.2 单总体参数区间估计149
8.1.3 双总体均值差的估计155
8.1.4 双总体比例差的估计161
8.2 假设检验162
8.2.1 基本概念162
8.2.2 两类错误166
8.2.3 均值检验167
8.3 极大似然估计172
8.3.1 极大似然法的基本原理172
8.3.2 求极大似然估计的方法174
8.3.3 极大似然估计应用举例176
第9章 非参数检验方法181
9.1 列联分析181
9.1.1 类别数据与列联表181
9.1.2 皮尔逊(Pearson)的卡方检验182
9.1.3 列联分析应用条件186
9.1.4 费希尔(Fisher)的确切检验188
9.2 符号检验190
9.3 威尔科克森(Wilcoxon)符号秩检验195
9.4 威尔科克森(Wilcoxon)的秩和检验199
9.5 克鲁斯卡尔-沃利斯(Kruskal-Wallis)检验204
第10章 一元线性回归208
10.1 回归分析的性质208
10.2 回归的基本概念210
10.2.1 总体的回归函数210
10.2.2 随机干扰的意义211
10.2.3 样本的回归函数213
10.3 回归模型的估计214
10.3.1 普通最小二乘法原理214
10.3.2 一元线性回归的应用216
10.3.3 经典模型的基本假定218
10.3.4 总体方差的无偏估计222
10.3.5 估计参数的概率分布225
10.4 正态条件下的模型检验227
10.4.1 拟合优度的检验227
10.4.2 整体性假定检验231
10.4.3 单个参数的检验233
10.5 一元线性回归模型预测234
10.5.1 点预测234
10.5.2 区间预测235
第11章 线性回归进阶239
11.1 多元线性回归模型239
11.2 多元回归模型估计241
11.2.1 最小二乘估计量241
11.2.2 多元回归的实例242
11.2.3 总体参数估计量245
11.3 多元回归模型检验247
11.3.1 线性回归的显著性247
11.3.2 回归系数的显著性249
11.4 多元线性回归模型预测250
11.5 其他回归模型函数形式253
11.5.1 双对数模型以及生产函数253
11.5.2 倒数模型与菲利普斯曲线255
11.5.3 多项式回归模型及其分析258
11.6 回归模型的评估与选择260
11.6.1 嵌套模型选择261
11.6.2 赤池信息准则262
11.6.3 逐步回归方法265
11.7 现代回归方法的新进展269
11.7.1 多重共线性269
11.7.2 岭回归270
11.7.3 从岭回归到Lasso271
第12章 方差分析方法275
12.1 方差分析的基本概念275
12.2 单因素方差分析方法278
12.2.1 基本原理278
12.2.2 分析步骤279
12.2.3 强度测量280
12.3 双因素方差分析方法281
12.3.1 无交互作用的分析281
12.3.2 有交互作用的分析286
12.4 多重比较289
12.4.1 多重t检验290
12.4.2 "Dunnett" 检验291
12.4.3 "Tukey" 的"HSD" 检验294
12.4.4 "Newman" -"Keuls" 检验298
12.5 方差齐性的检验方法301
12.5.1 "Bartlett" 检验法301
12.5.2 "Levene" 检验法303
第13章 聚类分析307
13.1 聚类的概念307
13.2 K均值算法308
13.2.1 距离度量309
13.2.2 算法描述310
13.2.3 应用实例312
13.3 最大期望算法314
13.3.1 算法原理314
13.3.2 收敛探讨319
13.4 高斯混合模型320
13.4.1 模型推导320
13.4.2 应用实例323
第14章 支持向量机326
14.1 从逻辑回归到线性分类326
14.2 线性可分的支持向量机330
14.2.1 函数距离与几何距离330
14.2.2 最大间隔分类器332
14.2.3 拉格朗日乘数法334
14.2.4 对偶问题的求解339
14.3 松弛因子与软间隔模型343
14.4 非线性支持向量机方法345
14.4.1 从更高维度上分类345
14.4.2 非线性核函数方法347
14.4.3 默瑟定理与核函数350
14.5 对数据进行分类的实践350
14.5.1 基本建模函数351
14.5.2 分析建模结果355
第15章 人工神经网络358
15.1 从感知机开始358
15.1.1 感知机模型358
15.1.2 感知机学习360
15.1.3 多层感知机362
15.2 基本神经网络365
15.2.1 神经网络结构365
15.2.2 符号标记说明366
15.2.3 后向传播算法368
15.3 神经网络实践370
15.3.1 核心函数介绍370
15.3.2 应用分析实践372
参考文献375
|
|