新書推薦:
《
图解机械工程入门
》
售價:NT$
440.0
《
中文版SOLIDWORKS 2024机械设计从入门到精通(实战案例版)
》
售價:NT$
450.0
《
旷野人生:吉姆·罗杰斯的全球投资探险
》
售價:NT$
345.0
《
希腊人(伊恩·莫里斯文明史系列)
》
售價:NT$
845.0
《
世界巨变:严复的角色(王中江著作系列)
》
售價:NT$
500.0
《
宋初三先生集(中国思想史资料丛刊)
》
售價:NT$
990.0
《
天生坏种:罪犯与犯罪心理分析
》
售價:NT$
445.0
《
新能源材料
》
售價:NT$
290.0
|
編輯推薦: |
本书详细讲解了统计机器学习与R语言相关专业知识,配套资源丰富
|
內容簡介: |
本书全面介绍了统计机器学习的主要算法,内容涉及多元线性回归、对数线性回归、逻辑斯蒂回归、岭回归、Lasso回归、判别分析和聚类分析等传统方法,也涉及支持向量机、深度神经网络以及集成学习等比较热门的算法,并给出相应算法的R语言实现。本书还给出了向量和矩阵函数求导以及拉格朗日对偶等数学基础,便于读者理解相关算法推导。 本书可以作为统计机器学习等相关专业的教材和参考书,也可供从事相关领域研究的人员参考。
|
目錄:
|
第1章R语言基础
1.1R的下载与安装
1.2辅助性操作命令
1.3基本运算与赋值
1.4向量
1.4.1向量定义
1.4.2向量运算
1.4.3向量元素的获取
1.4.4向量主要运算函数
1.5矩阵
1.5.1生成对角矩阵和单位阵
1.5.2矩阵元素取出
1.5.3矩阵行和列的维数
1.5.4矩阵的主要运算函数
1.5.5矩阵合并
1.5.6矩阵apply()运算函数
1.6因子(factor)和有序因子(ordered factor)
1.6.1创建一个因子
1.6.2创建一个有序因子
1.6.3用cut()函数将一般的数据转换成因子或有序因子
1.7数组
1.7.1产生一个三维和四维数组
1.7.2dim()函数可将向量转化成数组或矩阵
1.7.3张量的三个关键属性
1.7.4数据张量
1.7.5张量重塑
1.8列表
1.9数据框
1.9.1生成一个数据框
1.9.2合并数据框
1.9.3判断数据对象是否为数据框
1.9.4数据框的行名和列名
1.9.5连接函数
1.9.6数据框的数据抽取
1.10数据读取
1.10.1读取外部数据
1.10.2数据保存
1.11数据类型查看及环境设置
1.11.1数据类型
1.11.2数据查看
1.11.3环境设置函数options()
1.12绘图
1.12.1绘图参数命令
1.12.2常用的绘图命令
1.12.3绘图函数辅助
1.12.4三维绘图
1.13随机数产生
1.14编程基础
1.14.1条件语句
1.14.2循环语句
1.14.3自定义函数
1.15R语言的更新
第2章多元分布
2.1一元分布
2.1.1样本
2.1.2常用统计量
2.1.3常用分布
2.1.4重要定理
2.2多元分布
2.2.1p维总体
2.2.2随机向量X的数字特征
2.2.3多元分布的参数估计
2.3R语言相关操作
2.3.1一元正态随机数
2.3.2多元正态随机数
第3章线性模型
3.1线性回归
3.1.1基本形式
3.1.2一元线性回归
3.1.3多元线性回归
3.1.4多重共线对回归模型的影响
3.1.5回归模型检验
3.2对数线性回归
3.3逻辑斯蒂回归
3.4多项逻辑回归
3.5岭回归
3.6Lasso回归
3.7模型的评估标准
3.7.1分类模型的评估
3.7.2回归模型的评估
3.8R语言实现
3.8.1线性回归
3.8.2逻辑斯蒂回归
3.8.3岭回归
3.8.4Lasso回归
第4章判别分析
4.1距离判别法
4.1.1常用距离
4.1.2判别方法
4.2贝叶斯判别法
4.2.1贝叶斯公式
4.2.2基于最小错误率的贝叶斯决策
4.2.3朴素贝叶斯法的学习与分类
4.2.4连续场合下贝叶斯决策的参数估计
4.3Fisher判别分析
4.3.1两类分类
4.3.2多类分类
4.4R语言实例
4.4.1线性判别分析
4.4.2朴素贝叶斯判别分析
4.4.3二次判别分析
第5章支持向量机
5.1小样本统计学习理论
5.2两类支持向量机
5.2.1线性可分情况
5.2.2线性不可分情况
5.3一类分类支持向量机
5.4多类支持向量机
5.4.1一对多法
5.4.2一对一法
5.4.3SVM决策树法
5.4.4ECC-SVM方法
5.4.5基于一类分类的多类分类算法
5.5基于线性规划的支持向量机分类
5.5.1数学背景
5.5.2线性规划的分类算法
5.5.3线性规划下的一类分类算法
5.6支持向量回归
5.6.1二次规划下的支持向量回归
5.6.2几种线性规划下的支持向量回归
5.6.3最小二乘支持向量回归
5.7R语言实验
5.7.1分类问题
5.7.2回归问题
第6章决策树
6.1决策树的概念
6.2决策树分类器设计
6.2.1ID3算法
6.2.2C4.5算法
6.2.3决策树剪枝
6.2.4从决策树提取分类规则
6.3决策树的CART算法实现
6.3.1分类树
6.3.2回归树
6.4R语言实验
6.4.1分类树
6.4.2回归树
第7章集成学习
7.1个体与集成
7.2自适应提升算法
7.3梯度提升算法
7.4提升树
7.4.1提升树模型
7.4.2提升树算法
7.5Bagging与随机森林
7.5.1Bagging
7.5.2随机森林
7.5.3结合策略
7.6R语言实验
7.6.1装袋法回归
7.6.2随机森林分类
7.6.3提升法
第8章主成分分析与因子分析
8.1主成分分析
8.1.1基本原理
8.1.2主成分应用
8.2因子分析
8.2.1因子分析模型
8.2.2因子分析模型的计算
8.3R语言试验
8.3.1主成分分析
8.3.2因子分析
第9章降维
9.1k近邻学习
9.2低维嵌入
9.3流形学习
9.3.1等度量映射
9.3.2局部线性嵌入
9.3.3随机近邻嵌入
9.3.4t分布随机近邻嵌入
9.4R语言实验
9.4.1LLE降维
9.4.2MDS降维
9.4.3qkIsomap函数实现Isomap
9.4.4”Rtsne”包实现tSNE
第10章聚类分析
10.1基于距离的聚类
10.1.1相似性度量
10.1.2层次聚类
10.1.3k均值聚类
10.2基于密度的聚类
10.3R语言实验
10.3.1k均值聚类
10.3.2层次聚类
10.3.3基于密度的聚类
第11章偏最小二乘回归
11.1基本思想
11.2基本算法
11.3模型成分个数的确定
11.4R语言实现
第12章深度神经网络
12.1感知机
12.1.1定义
12.1.2基本思想
12.1.3算法
12.2人工神经网络的基本思想
12.2.1神经元
12.2.2激活函数
12.3前馈神经网络
12.3.1网络结构
12.3.2BP算法
12.3.3BP算法总结
12.4自动编码器网络
12.5受限玻尔兹曼机
12.6深度置信网络
12.7卷积神经网络
12.7.1卷积
12.7.2池化
12.7.3全连接层
12.7.4训练算法
12.7.5典型网络
12.8循环神经网络
12.8.1基本概念
12.8.2网络的训练
12.8.3Elman神经网络
12.8.4Jordan神经网络
12.8.5LSTM网络
12.8.6GRU网络
12.9R语言实现
12.9.1neuralnet包实现前馈神经网络
12.9.2Keras包创建神经网络
12.9.3循环神经网络
12.9.4自编码器网络
12.9.5受限玻尔兹曼机
12.9.6深度信念网
12.9.7Jordan网络
12.9.8Elman网络
附录A向量和矩阵函数的导数
附录B拉格朗日对偶性
参考文献
|
內容試閱:
|
随着大数据时代的到来,统计机器学习近年来引起了人们的广泛关注。统计机器学习内容涵盖统计学、计算机科学、数学等多个学科,形成交叉学科研究,其应用范围越来越广。
本书的特点是均衡相关理论阐述和相关算法的具体实现,尽可能用最精简的语言阐明基本理论,用最简单的实例说明算法实现过程,使读者既能领会理论内涵又能学会算法的实际操作。书中数据几乎都由相关工具包提供,或者是模拟产生,这样会省去读者加载相关数据的麻烦,相关算法的代码也很容易推广到其他数据应用中。
本书共分12章和两个附录。第1章主要介绍R语言基本操作,是后面各章节算法实现的基础。第2章介绍多元分布,主要阐述多元分布的均值向量和协方差矩阵等基本内容及性质。第3章介绍线性回归、对数线性回归、岭回归和Lasso回归等线性模型。第4章阐述贝叶斯判别分析、Fisher判别分析和基于距离的判别分析等内容。第5章给出支持向量机分类和回归等相关算法,并给出算法的详细推导。第6章内容是决策树理论及实现方法。第7章介绍提升算法、装袋算法和随机森林分类等集成学习方法。第8章介绍主成分分析和因子分析。第9章介绍多维缩放和等度量映射、局部线性嵌入、随机近邻嵌入等流形学习降维方法。第10章给出几种常用的聚类算法,包括k均值聚类、层次聚类和基于密度的聚类算法。第11章介绍一组因变量和一组自变量之间的偏最小二乘回归算法。第12章主要介绍前馈神经网络以及比较流行的卷积神经网络和LSTM等几种深度神经网络模型,并给出比较详细的算法推导。附录给出向量和矩阵函数的导数以及拉格朗日对偶性等相关数学基础,作为相关章节算法推导的理论基础。
R是一款开源的免费统计软件,提供了广泛的统计计算和作图技术,并且随时在扩展更新,已经成为最常用的数据分析和数据处理工具。为了更方便地搭建深度神经网络模型,R语言建立了与Python语言的接口,可以借助Keras和TensorFlow等技术实现复杂的神经网络。Keras由纯Python语言编写而成,是神经网络的高层API。为R语言安装Keras包之前,需要先安装Python。本书安装的是Python的发行版Anaconda 3.8和R语言的4.1.1版本,书中的所有代码都可以在这个环境下实现。
本书除了参考文献中列出的文献外,还参考了许多网络资源,在此对所涉及的专家学者表示衷心的感谢。同时感谢辽宁省教育厅项目的资助(编号: LJKMZ20221424)。由于编者水平有限,书中难免存在疏漏和不妥之处,敬请广大读者不吝指正。
编者2023年1月
|
|