新書推薦:
《
我的心理医生是只猫
》
售價:NT$
225.0
《
股权控制战略:如何实现公司控制和有效激励(第2版)
》
售價:NT$
449.0
《
汉译名著·哲学经典十种
》
售價:NT$
3460.0
《
成吉思汗传:看历代帝王将相谋略 修炼安身成事之根本
》
售價:NT$
280.0
《
爱丁堡古罗马史-罗马城的起源和共和国的崛起
》
售價:NT$
349.0
《
大宋悬疑录:貔貅刑
》
售價:NT$
340.0
《
人生解忧:佛学入门四十讲
》
售價:NT$
490.0
《
东野圭吾:分身(东野圭吾无法再现的双女主之作 奇绝瑰丽、残忍又温情)
》
售價:NT$
295.0
|
編輯推薦: |
本书详细阐述机器学习的数据特征与分类算法,高效利用Python 3代码详解机器学习核心算法及其工具的场景应用,并在机器学习平台Kaggle与PaddlePaddle上实现分类、预测及推荐等实战操作。
|
內容簡介: |
本书理论与实践相结合,详细阐述机器学习数据特征与分类算法,基于Python 3精心编排大量的机器学习场景与开源平台应用,高效利用Python 3代码翔实地阐释机器学习核心算法及其工具的场景应用。 本书分为6章,主要内容包括机器学习概述、数据特征、分类算法、项目,以及在机器学习平台Kaggle与PaddlePaddle上实现分类、预测及推荐等实战操作。 本书适合机器学习的研究人员、计算机或数学等相关从业者参考学习,也可以作为计算机或数学等专业本科高年级或研究生专业用书。
|
關於作者: |
邓立国,东北大学计算机应用博士毕业。2005年开始在沈阳师范大学软件学院、教育技术学院任教,主要研究方向:数据挖掘、知识工程、大数据处理、云计算、分布式计算等。以第一作者发表学术论文30多篇(26篇EI),主编教材 1 部,主持科研课题6项,经费10余万元,多次获得校级科研优秀奖,作为九三社员提出的智慧城市提案被市政府采纳,研究成果被教育厅等单位采用。
|
目錄:
|
第1章 机器学习概述 1
1.1 机器学习定义 1
1.2 机器学习的发展 2
1.3 机器学习的分类 3
1.4 机器学习的研究领域 6
1.5 本章小结 8
第2章 机器学习数据特征 9
2.1 数据分布性 9
2.1.1 数据分布集中趋势的测定 9
2.1.2 数据分布离散程度的测定 14
2.1.3 数据分布偏态与峰度的测定 17
2.2 数据相关性 19
2.2.1 相关关系 19
2.2.2 相关分析 22
2.3 数据聚类性 24
2.4 数据主成分分析 27
2.4.1 主成分分析的原理及模型 27
2.4.2 主成分分析的几何解释 29
2.4.3 主成分的导出 30
2.4.4 证明主成分的方差是依次递减 31
2.4.5 主成分分析的计算 32
2.5 数据动态性 34
2.6 数据可视化 37
2.7 本章小结 39
第3章 机器学习分类算法 40
3.1 数据清洗和特征选择 40
3.1.1 数据清洗 40
3.1.2 特征选择 42
3.1.3 回归分析 45
3.2 决策树、随机森林 47
3.3 SVM 51
3.3.1 最优分类面和广义最优分类面 52
3.3.2 SVM的非线性映射 55
3.3.3 核函数 56
3.4 聚类算法 56
3.5 EM算法 61
3.6 贝叶斯算法 63
3.7 隐马尔可夫模型 63
3.8 LDA主题模型 66
3.9 人工神经网络 69
3.10 KNN算法 73
3.11 本章小结 76
第4章 Python机器学习项目 77
4.1 SKlearn 78
4.1.1 SKlearn包含的机器学习方式 78
4.1.2 SKlearn的强大数据库 79
4.1.3 鸢尾花数据集举例 80
4.1.4 Boston房价数据集的示例 83
4.2 TensorFlow 85
4.2.1 TensorFlow简介 86
4.2.2 TensorFlow的下载与安装 88
4.2.3 TensorFlow的基本使用 91
4.3 Theano 96
4.4 Caffe 115
4.4.1 Caffe框架与运行环境 115
4.4.2 网络模型 119
4.5 Gensim 125
4.5.1 Gensim特性与核心概念 125
4.5.2 训练语料的预处理 125
4.5.3 主题向量的变换 126
4.5.4 文档相似度的计算 127
4.6 Pylearn2 134
4.7 Shogun 135
4.8 Chainer 136
4.9 NuPIC 143
4.10 Neon 160
4.11 Nilearn 165
4.12 Orange3 168
4.13 PyMC与PyMC3 171
4.14 PyBrain 175
4.15 Fuel 181
4.16 PyMVPA 184
4.17 Annoy 186
4.18 Deap 190
4.19 Pattern 191
4.20 Requests 195
4.21 Seaborn 199
4.22 本章小结 206
第5章 Kaggle平台机器学习实战 207
5.1 Kaggle信用卡欺诈检测 207
5.1.1 Kaggle信用卡欺诈检测准备 207
5.1.2 Kaggle信用卡欺诈检测实例 210
5.2 Kaggle机器学习案例 228
5.2.1 Kaggle机器学习概况 229
5.2.2 自行车租赁数据分析与可视化案例 230
5.3 本章小结 241
第6章 PaddlePaddle平台机器学习实战 242
6.1 PaddlePaddle平台安装 242
6.2 PaddlePaddle平台手写体数字识别 243
6.3 PaddlePaddle平台图像分类 261
6.4 PaddlePaddle平台词向量 277
6.5 PaddlePaddle平台个性化推荐 289
6.6 PaddlePaddle平台情感分析 302
6.7 本章小结 311
参考文献312
|
內容試閱:
|
机器学习是人工智能领域核心的研究方向,其应用遍及人工智能的各个领域。机器学习已经有了十分广泛的应用,例如数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、检测信用卡欺诈、证券市场分析、DNA序列测序、语音和手写识别、战略游戏和机器人运用等。机器学习是人工智能和神经计算的核心研究课题之一,解决计算机程序如何随着经验积累自动提高性能。
作者在工作中接触和应用机器学习的相关算法过程中,发现目前没有比较完备的基于Python 3语言的机器学习专业图书,所以写了这本以Python 3为基础实践语言的机器学习工具书,仅供从事机器学习人员参阅。
本书内容
本书的目的是展现基于Python 3机器学习中核心的算法与实践,重点介绍与机器学习相关的知识理论与Python实例。
本书分为6章,系统地讲解机器学习的典型算法:第1章简要介绍有关机器学习的基础知识,第2章讲解机器学习的数据特征,第3章介绍机器学习的分类算法,第4章主要介绍机器学习开源项目场景应用,第5、6章在机器学习平台Kaggle与PaddlePaddle上进行算法应用。本书的例子都是在Python 3集成开发环境Anaconda 3中经过实际调试通过的典型案例,大部分实验数据来源于GitHub,并且很多例子源程序都给出了网址地址,读者可以参考实现。
本书读者
本书可以作为计算机科学与工程、计算统计学和社会科学等专业的大学生或研究生的专业参考书,也可作为软件研究人员或从业人员的参考资料。由于机器学习专业素材的多学科性,读者可以根据对应的知识背景参考对应的专业书籍。
源码下载
本书配套源码下载地址请扫描下方二维码获得。如果下载有问题,请联系booksaga@163.com,邮件主题为Python机器学习算法与应用。
致谢
本书完成之际,要感谢家人的支持与关爱。同时也要感谢同事,与他们的交流、探讨使得本书得以修正和完善。
由于作者水平有限,书中纰漏之处在所难免,恳请读者不吝赐教。本书中参考的网络资源均在参考文献中给出出处。
邓立国
2020年3月
|
|