新書推薦:
《
律令国家与隋唐文明
》
售價:NT$
358.0
《
紫云村(史杰鹏笔下大唐小吏的生死逃亡,新历史主义小说见微之作,附赠5张与小说内容高度契合的宣纸彩插)
》
售價:NT$
449.0
《
现代吴语的研究(中华现代学术名著3)
》
售價:NT$
296.0
《
天下的当代性:世界秩序的实践与想象(新版)
》
售價:NT$
352.0
《
德国天才4:断裂与承续
》
售價:NT$
500.0
《
妈妈的情绪,决定孩子的未来
》
售價:NT$
194.0
《
推拿纲目
》
售價:NT$
1836.0
《
精致考古--山东大学实验室考古项目论文集(一)
》
售價:NT$
1112.0
|
編輯推薦: |
本书内容丰富,覆盖面广,囊括了监督机器学习和无监督机器学习的主要内容。对模型所涉及的理论进行了深入浅出的介绍。
提供了大量的习题。本书的习题不仅可以帮助读者理解相关的基本概念,而且还能帮助读者进一步熟悉机器学习模型的实现和使用过程。
通过视频来介绍每一章的主要内容和习题,主便读者自学。
注意培养读者良好的机器学习建模方法和对应用问题的抽象能力、编程能力。
与计算机视觉,自然语言处理,深度学习等课程之间有良好的衔接支撑。
|
內容簡介: |
《机器学习实用教程》将根据高等院校所开设的《机器学习》教学实践的要求,结合重庆工商大学教学实践情况,重点讲授重要的机器学习理论以及相关算法的实现。
|
關於作者: |
刘波 博士,重庆工商大学人工智能学院副教授。主要研究兴机器学习、计算机视觉,大数据分析等。发表论文10余篇,以第一作者出版译者8部,比如所译的《 opencv 3计算机视觉:python语言实现》的销量上万册,出版专著2部(其中一部为第一作者,一部为第二作者),教材1部,作为第一完成人获得发明专利1项。完成重庆市教委研究项目一项,重庆工商大学研究项目2项。
|
目錄:
|
第1章机器学习概述1
1.1机器学习的定义1
1.2机器学习的发展历史3
1.3机器学习的主要分支5
1.3.1监督学习5
1.3.2无监督学习7
1.3.3半监督学习8
1.3.4强化学习9
1.3.5深度学习10
1.4机器学习的应用12
1.4.1大数据分析12
1.4.2计算机视觉12
1.4.3自然语言处理13
1.4.4推荐系统13
1.5机器学习与其他学科的关系13
1.5.1与概率统计、矩阵计算、最优化的关系14
1.5.2与人工智能、大数据、数据科学之间的关系14
1.6总结15
1.7习题15
参考文献16
第2章线性回归17
2.1一元线性回归18
2.2多元线性回归21
2.2.1模型及求解21
2.2.2多元线性回归应用举例22
2.2.3解释线性回归模型24
2.3线性回归的正则化25
2.3.1Lasso26
2.3.2Lasso的应用举例28
2.4弹性网29机器学习实用教程微课版目录2.5总结31
2.6习题31
参考文献31
第3章感知机33
3.1分类的定义及应用33
3.2评价分类模型的指标34
3.3感知机原理37
3.3.1感知机的结构38
3.3.2感知机模型的数学表示38
3.3.3感知机算法41
3.4多层感知机44
3.4.1认知机44
3.4.2神经认知机45
3.5实例应用46
3.5.1感知机对线性可分数据集进行分类47
3.5.2感知机对线性不可分数据集进行分类47
3.5.3用多层感知机进行图像分类47
3.6总结49
3.7习题49
参考文献50
第4章logistic回归51
4.1线性回归与logistic回归的关系51
4.2从统计的角度建立logistic回归模型54
4.3训练logistic回归模型54
4.3.1拉格朗日法55
4.3.2梯度下降法55
4.4logistic回归模型的三种解释58
4.4.1基于概率的解释58
4.4.2基于最大熵原理的解释58
4.4.3基于贝叶斯原理的解释60
4.5logistic回归模型应用举例61
4.6softmax回归模型63
4.7总结64
4.8习题64
参考文献65
第5章贝叶斯分类66
5.1高斯判别分析68
5.2朴素贝叶斯70
5.3改进的朴素贝叶斯74
5.4总结75
5.5习题75
参考文献76
第6章决策树78
6.1决策树的基本概念78
6.2构建决策树82
6.2.1不纯度函数的定义82
6.2.2常用不纯度函数83
6.3典型的决策树算法85
6.3.1CART算法86
6.3.2ID3算法86
6.4决策树的构建策略及预测87
6.5决策树的停止标准与剪枝技术87
6.5.1停止标准88
6.5.2剪枝技术88
6.6决策树的优缺点90
6.7总结91
6.8习题91
参考文献92
第7章集成学习93
7.1集成学习的基本原理93
7.2AdaBoost95
7.2.1AdaBoost算法的实现96
7.2.2AdaBoost示例98
7.2.3用最优化的观点解释AdaBoost99
7.3随机森林101
7.4总结104
7.5习题104
参考文献105
第8章k近邻算法107
8.1引言107
8.2k近邻算法的原理及应用108
8.2.1k近邻算法的工作原理109
8.2.2k近邻算法在图像检索中的应用111
8.2.3k近邻算法的优缺点113
8.3近似最近邻算法113
8.3.1KD树算法113
8.3.2KD树算法的实现114
8.4k近邻算法的应用117
8.5总结120
8.6习题120
参考文献120
第9章主成分分析122
9.1维度灾难122
9.2相关特征与冗余特征124
9.3主成分分析的原理127
9.3.1用回归的观点解释PCA128
9.3.2用消除相关性来解释PCA128
9.3.3图像数据的降维处理130
9.3.4主成分分析在数据分析中的应用131
9.4总结133
9.5习题133
参考文献133
第10章无监督学习135
10.1无监督学习概述135
10.2聚类算法136
10.2.1聚类算法概述136
10.2.2聚类算法的评价指标137
10.3kmeans聚类算法141
10.3.1kmeans聚类算法原理141
10.3.2kmeans聚类算法的示例143
10.3.3改进的kmeans聚类算法146
10.4谱聚类算法150
10.4.1谱聚类算法的原理151
10.4.2谱聚类算法的实现155
10.4.3谱聚类算法的缺点156
10.5总结156
10.6习题157
参考文献157
附录A用Boston数据集解释简单线性回归158
附录B多元线性回归应用159
附录C岭回归应用160
附录D感知机对线性可分数据集的分类161
附录E多层感知机的实现163
附录Flogistic回归的实现164
|
內容試閱:
|
在过去的20年,计算机和互联网的飞速发展使人们的生活方式发生了巨大变化,同时也产生了海量的数据,大数据时代已经到来!近几年,以大数据为基础的人工智能成为万众瞩目的焦点,人工智能正在影响人们生活的各个方面。在人工智能的研究过程中,人们发现机器学习是实现让计算机智能化的最有效手段。
目前,很多高校都开设了智能科学与技术专业。机器学习是该专业的核心课程。国内外已经出版了多本关于机器学习的书籍,例如,James的An Introduction to Statistical Learning,该书对机器学习的各个方面进行了非常全面、细致的介绍。机器学习所涉及的内容众多,很难通过一本书将所有问题都介绍清楚。本书从机器学习最基本的模型出发,介绍机器学习的基本概念、模型和方法。这些内容是学习后续课程(如计算机视觉自然语言处理深度学习等)的基础。
本书力求简洁、直观地介绍机器学习的方法。在内容的选择上,侧重介绍广泛使用的方法,特别是监督学习和无监督学习的经典方法。在介绍这些内容时,通过第1章介绍机器学习的基本概念和主要分支,让读者对机器学习有一个全面的了解。其余各章内容相对独立、完整,同时也注重各章节内容的连贯性,如将贝叶斯分类安排在线性回归、感知机、logistic回归之后介绍,其原因在于这些模型都与贝叶斯分类模型有联系。决策树是很多集成算法(如随机森林等)的基础,因此本书在介绍完决策树后再介绍集成学习;在介绍线性回归的原理时,会通过投影的观点来理解该模型,这一观点在后面理解主成分分析时也会用到。在介绍具体的机器学习模型时,都会给出具体的应用,同时还会基于sklearn框架介绍如何实现这些应用,而且对于一些比较困难的内容,会通过微课的方式对其进行介绍。在每章的后面都给出了内容总结、习题和参考文献,以方便读者进一步学习。
在本书的出版过程中,清华大学出版社的白立军编辑、杨帆编辑给予了很多帮助,在此向他们表示感谢。本书的出版也得到了重庆工商大学研究生教改项目基于二维码的研究生互动教学改革(2015YJG0205),重庆市教育科学规划项目(2018CX348),教育部产学合作协同育人项目(201902100005),教育部产学合作协同育人项目(201902016028)的支持。
由于作者水平所限,书中难免有错误或不妥之处,欢迎读者批评指正。
刘波2020年10月
|
|