新書推薦:
《
万千心理·儿童心理治疗中的心智化:临床实践指导
》
售價:NT$
398.0
《
自我囚禁的人:完美主义的心理成因与自我松绑(破除你对完美主义的迷思,尝试打破自我评价过低与焦虑的恶性循环)
》
售價:NT$
301.0
《
周易
》
售價:NT$
203.0
《
东南亚的传统与发展
》
售價:NT$
306.0
《
乾隆制造
》
售價:NT$
398.0
《
资治通鉴臣光曰辑存 资治通鉴目录(司马光全集)(全二册)
》
售價:NT$
1316.0
《
明代社会变迁时期生活质量研究
》
售價:NT$
1367.0
《
律令国家与隋唐文明
》
售價:NT$
332.0
|
內容簡介: |
本书对大数据挖掘与应用的基本算法进行了系统的介绍,每种算法不仅包括对算法基本原理的介绍,而且配有大量的例题以及基于阿里云数加平台的演示,这种理论与实践相结合的方式极大地方便了读者对抽象的数据挖掘算法的理解和掌握。本书共17章,内容覆盖了数据预处理、关联规则挖掘算法、分类算法和聚类算法及常见的数据挖掘应用,具体章节包括大数据简介、数据预处理技术、关联规则挖掘、逻辑回归方法、KNN算法、朴素贝叶斯分类算法、*森林分类算法、支持向量机、人工神经网络算法、决策树分类算法、Kmeans聚类算法、K中心点聚类算法、自组织神经网络聚类算法、DBSCAN聚类算法以及社交网络分析方法及应用、文本分析方法及应用和推荐系统方法及应用等内容。本书可作为高等院校数据挖掘课程的教材,也可作为从事数据挖掘工作及其他相关工程技术工作的人员的参考书。
|
目錄:
|
第一篇基础篇
第一章大数据简介
1.1大数据
1.1.1大数据的定义
1.1.2大数据的特点
1.1.3大数据处理的挑战
1.2大数据挖掘
1.2.1大数据挖掘的定义
1.2.2大数据挖掘的特点
1.3大数据挖掘的相关方法
1.3.1数据预处理技术
1.3.2关联规则挖掘
1.3.3分类
1.3.4聚类
1.3.5孤立点挖掘
1.3.6演变分析
1.3.7特异群组分析
1.4大数据挖掘类型
1.4.1Web数据挖掘
1.4.2空间数据挖掘
1.4.3流数据挖掘
1.5大数据挖掘的常见应用
1.5.1社交网络分析
1.5.2文本分析
1.5.3推荐系统
1.6常用的大数据统计分析方法
1.6.1百分位
1.6.2皮尔森相关系数
1.6.3直方图
1.6.4T检验
1.6.5卡方检验
1.7常用的大数据挖掘评估方法
1.8大数据平台相关技术
1.8.1分布式存储技术
1.8.2分布式任务调度技术
1.8.3并行计算技术
1.8.4其他技术
1.9大数据平台实例——阿里云数加平台
1.9.1数加平台简介
1.9.2数加平台产品简介
1.9.3数加平台优势特色
1.9.4机器学习平台简介
1.9.5机器学习平台功能
1.9.6机器学习平台操作流程
1.10小结
思考题
第二篇技术篇
第2章数据预处理技术
2.1数据预处理的目的
2.2数据采样
2.2.1加权采样
2.2.2随机采样
2.2.3分层采样
2.3数据清理
2.3.1填充缺失值
2.3.2光滑噪声数据
2.3.3数据清理过程
2.4数据集成
2.4.1数据集成简介
2.4.2常用数据集成方法
2.5数据变换
2.5.1数据变换简介
2.5.2数据规范化
2.6数据归约
2.6.1数据立方体聚集
2.6.2维归约
2.6.3数据压缩
2.6.4数值归约
2.6.5数据离散化与概念分层
2.7特征选择
2.7.1特征选择简介
2.7.2Relief算法
2.7.3Fisher判别法
2.7.4基于GBDT的过滤式特征选择
2.8特征提取
……
第三篇 综合应用篇
参考文献
|
|