登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 聯絡我們  | 運費計算  | 幫助中心 |  加入書簽
會員登入   新用戶註冊
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類閱讀雜誌 香港/國際用戶
最新/最熱/最齊全的簡體書網 品種:超過100萬種書,正品正价,放心網購,悭钱省心 送貨:速遞 / 物流,時效:出貨後2-4日

2024年10月出版新書

2024年09月出版新書

2024年08月出版新書

2024年07月出版新書

2024年06月出版新書

2024年05月出版新書

2024年04月出版新書

2024年03月出版新書

2024年02月出版新書

2024年01月出版新書

2023年12月出版新書

2023年11月出版新書

2023年10月出版新書

2023年09月出版新書

『簡體書』R语言数据分析与挖掘(高职)

書城自編碼: 3537559
分類: 簡體書→大陸圖書→教材高职高专教材
作者: 陈维
國際書號(ISBN): 9787560657905
出版社: 西安电子科技大学出版社
出版日期: 2020-08-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:NT$ 144

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
严复与福泽谕吉启蒙思想比较(王中江著作系列)
《 严复与福泽谕吉启蒙思想比较(王中江著作系列) 》

售價:NT$ 750.0
甘于平凡的勇气
《 甘于平凡的勇气 》

售價:NT$ 225.0
存在与结构:精神分析的法国转向——以拉康与萨特为中心
《 存在与结构:精神分析的法国转向——以拉康与萨特为中心 》

售價:NT$ 240.0
生成式人工智能:AIGC与多模态技术应用实践指南
《 生成式人工智能:AIGC与多模态技术应用实践指南 》

售價:NT$ 495.0
石油帝国的兴衰:英国的工业化与去工业化
《 石油帝国的兴衰:英国的工业化与去工业化 》

售價:NT$ 445.0
古典的回響:溪客舊廬藏明清文人繪畫
《 古典的回響:溪客舊廬藏明清文人繪畫 》

售價:NT$ 1990.0
根源、制度和秩序:从老子到黄老学(王中江著作系列)
《 根源、制度和秩序:从老子到黄老学(王中江著作系列) 》

售價:NT$ 550.0
索恩丛书·北宋政治与保守主义:司马光的从政与思想(1019~1086)
《 索恩丛书·北宋政治与保守主义:司马光的从政与思想(1019~1086) 》

售價:NT$ 345.0

內容簡介:
现在,越来越多的人考虑引入大数据技术来促进公司产品的销售以获得更多的利润。而学习算法能让商务活动及其发展过程的预测摆脱人脑计算能力的局限,并且能提高数据模型的预测精确度,使得大数据的分析处理在依托计算机的大规模计算能力下得以完成。
当前数据分析*常用的工具就是R语言,本书深入浅出地介绍了利用R语言进行数据分析及构建预测模型的多种实用方法,包括回归、聚类、关联和分类分析等常用学习算法的实现,每一种算法都通过具体案例详细说明构建模型、实现模型以及评价模型的过程。本书还系统讲解了相关的R语言的基础知识,包括环境准备以及数据转换、分析和结果可视化的方法等。
本书融合了作者十几年来利用数据分析算法来实现数据挖掘与分析的诸多心得,书中所有的源代码和实验数据以及习题和答案在出版社网站上都可以免费下载。阅读完本书并亲自动手完成书中所有算法案例后,读者对数据分析将会有更深入的了解。
本书既可以作为相关专业数据分析类课程的教材,也可以作为大数据网络培训或技术人员自学的参考资料。
目錄
第1章 初识数据分析与R语言 1
1.1 软件下载与安装 1
1.1.1 下载和安装 1
1.1.2 下载和安装RStudio 3
1.2 包的安装和加载 5
1.3 应用R实现数据操作 6
1.3.1 数据读写 6
1.3.2 数据基本操作 8
1.3.3 应用简单统计 11
1.3.4 数据可视化 14
习 题 17
第2章 回归分析 18
2.1 简单线性回归分析 18
2.1.1 调用lm函数构建简单线性回归模型 18
2.1.2 输出线性模型的特征信息 20
2.1.3 使用线性回归模型预测未知数 21
2.1.4 生成模型的诊断图 22
2.2 多项式回归分析 23
2.2.1 利用lm函数生成多项式回归模型 23
2.2.2 调用rlm函数生成稳健线性回归模型 25
2.3 在SLID数据集上研究线性回归案例 27
习题 33
第3章 关联分析 35
3.1 关联分析的准备工作 35
3.1.1 将数据转换成事务数据 35
3.1.2 展示事务及其关联 37
3.2 Apriori规则 39
3.2.1 使用Apriori规则完成关联挖掘 39
3.2.2 去掉冗余规则 42
3.3 关联规则可视化 43
3.4 Eclat挖掘 45
3.4.1 使用Eclat挖掘频繁项集 45
3.4.2 生成时态事务数据 47
3.5 使用cSPADE挖掘频繁时序模式 49
习题 52
第4章 聚类分析 53
4.1 层次聚类 53
4.1.1 使用层次聚类处理数据 53
4.1.2 将树分成簇 56
4.2 k均值聚类 57
4.2.1 使用k均值方法处理数据 57
4.2.2 绘制二元聚类图 59
4.3 聚类算法比较 61
4.4 聚类效果评估 62
4.4.1 从簇中抽取轮廓信息 62
4.4.2 获得优化的k值聚类 64
4.5 使用密度聚类方法处理数据 65
习题 68
第5章 决策树 69
5.1 准备训练和测试数据集 69
5.2 递归决策树 71
5.3 递归决策树可视化 73
5.4 评测递归分割树的预测能力 74
5.5 递归分割树剪枝 76
5.6 使用条件推理树建立分类模型 78
5.7 条件推理树可视化 79
5.8 评测条件推理树的预测能力 80
习题 82
第6章 神经网络与支持向量机 83
6.1 支持向量机 83
6.1.1 使用支持向量机完成数据分类 83
6.1.2 选择支持向量机的惩罚因子 85
6.1.3 实现SVM模型的可视化 87
6.1.4 基于支持向量机训练模型实现类预测 89
6.1.5 调整支持向量机 90
6.2 神经网络 93
6.2.1 利用neuralnet包训练神经网络模型 93
6.2.2 可视化由neuralnet包得到的神经网络模型 96
6.2.3 基于neuralnet包得到的模型实现类标号预测 97
6.2.4 利用nnet包训练神经网络模型 99
6.2.5 基于nnet包得到的模型实现类标号预测 101
习题 102
第7章 模型评估 103
7.1 k折交叉验证 103
7.1.1 基于k折交叉验证方法评测模型性能 103
7.1.2 利用e1071包完成交叉验证 104
7.1.3 利用caret包完成交叉检验 106
7.2 变量重要性排序 107
7.2.1 利用caret包对变量重要性程度排序 107
7.2.2 利用rminer包对变量重要程度排序 109
7.3 特征选择 110
7.3.1 利用caret包找到高度关联的特征 110
7.3.2 利用caret包选择特征 111
7.4 模型的性能评估 115
7.4.1 评测回归模型的性能 115
7.4.2 利用混淆矩阵评测模型的预测能力 118
7.4.3 利用ROCR评测模型的预测能力 119
7.4.4 利用caret包比较ROC曲线 120
7.4.5 利用caret包比较模型性能差异 123
习题 125
附录 习题库 126
参考文献 162

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 台灣用户 | 香港/海外用户
megBook.com.tw
Copyright (C) 2013 - 2024 (香港)大書城有限公司 All Rights Reserved.