新書推薦:
《
元好问与他的时代(中华学术译丛)
》
售價:NT$
398.0
《
汽车传感器结构·原理·检测·维修
》
售價:NT$
500.0
《
怪谈百物语:不能开的门(“日本文学史上的奇迹”宫部美雪重要代表作!日本妖怪物语集大成之作,系列累销突破200万册!)
》
售價:NT$
296.0
《
罗马政治观念中的自由
》
售價:NT$
230.0
《
中国王朝内争实录:宠位厮杀
》
售價:NT$
281.0
《
凡事发生皆有利于我(这是一本读了之后会让人运气变好的书”治愈无数读者的心理自助经典)
》
售價:NT$
203.0
《
未来特工局
》
售價:NT$
254.0
《
高术莫用(十周年纪念版 逝去的武林续篇 薛颠传世之作 武学尊师李仲轩家世 凸显京津地区一支世家的百年沉浮)
》
售價:NT$
250.0
|
編輯推薦: |
《R语言数据分析与可视化》的主要内容包括创建数据集、基本绘图、高级绘图、基本数据管理、高级数据管理、基本统计分析、高级统计分析、创建动态报告、R与hadoop、R语言图形用户界面等内容,是一本基于R语言的数据分析与可视化的入门教材。本书在传统统计分析的基础上,进一步融合了大数据相关技术,使得具有更强的实用性。
|
內容簡介: |
本书涵盖了R语言介绍、创建数据集、基本绘图、高级绘图、基本数据管理、高级数据管理、基本统计分析、高级统计分析、创建动态报告、R语言与Hadoop、R语言图形用户界面、综合案例分析。 本书可以作为数据科学与大数据技术、统计学及相关专业本科生的教材使用,也可以作为高职高专数据分析与可视化专业的教材使用,同时可以供数据分析技术人员和R语言用户使用。
|
關於作者: |
杨剑锋,贵州理工学院大数据学院大数据教研室主任,博士,副教授,瑞典耶夫勒大学访问学者。主要研究方向:可靠性工程、应用统计、数据分析。主讲课程:C语言程序设计、统计计算、统计建模与R语言、JAVA面向对象程序设计、大数据技术及应用实践、离散数学等。发表学术论文30余篇,其中SCI检索3篇,EI检索8篇;主持省部级项目2项、校级项目1项,参与国家自然科学基金项目1项、省部级项目2项、市厅级及其它项目2项;指导大学生创新创业项目8项;编写大数据领域专著1部,信息专业本科教材1本。
|
目錄:
|
第1章R语言介绍1
1.1R语言概述1
1.1.1R语言简介1
1.1.2R语言的特点与优势2
1.1.3R语言的下载和安装2
1.1.4R语言的应用前景2
1.2R语言的基本使用3
1.2.1R语言的入门3
1.2.2R语言的帮助功能5
1.2.3R语言的工作空间6
1.2.4R语言的输入与输出7
1.3R语言的软件包8
1.3.1安装包8
1.3.2载入包8
1.4小结8
习题8
第2章创建数据集9
2.1数据集的概念9
2.2数据结构9
2.2.1向量10
2.2.2矩阵11
2.2.3数组12
2.2.4数据框14
2.2.5列表15
2.3数据的输入17
2.3.1使用键盘输入数据17
2.3.2从带分隔符的文本文件导入数据17
2.3.3导入Excel数据18
2.3.4导入SPSS数据18
2.3.5导入SAS数据19
2.3.6导入Stata数据19
2.4小结19
习题19
目录R语言数据分析与可视化第3章基本绘图20
3.1使用图形20
3.2图形参数21
3.2.1图形参数简介21
3.2.2符号和线条22
3.2.3颜色23
3.2.4文本属性24
3.2.5图形尺寸和边界尺寸26
3.3添加文本、自定义坐标轴和图例27
3.3.1标题28
3.3.2坐标轴28
3.3.3参考线30
3.3.4图例30
3.3.5文本标注32
3.4散点图32
3.4.1散点图矩阵33
3.4.2三维散点图33
3.4.3旋转三维散点图35
3.4.4气泡图36
3.5折线图37
3.6图形组合38
3.7小结42
习题42
第4章高级绘图43
4.1R语言中的图形系统43
4.2ggplot2包高级绘图46
4.2.1几何函数46
4.2.2分组图形47
4.2.3网格图形47
4.2.4光滑曲线48
4.2.5图形外观50
4.3lattice包高级绘图55
4.3.1lattice包简介55
4.3.2调节变量55
4.3.3自定义面板函数57
4.3.4图形分组变量58
4.3.5修改图形参数59
4.3.6图形条带60
4.3.7图形页面布局61
4.3.8深入学习64
4.4保存图形64
4.5高级绘图实例66
4.6小结68
习题68
第5章基本数据管理70
5.1变量的定义70
5.1.1示例70
5.1.2创建新变量71
5.1.3变量的重编码73
5.1.4变量的重命名74
5.2缺失值76
5.2.1缺失值判断77
5.2.2缺失模型判断78
5.2.3缺失值处理80
5.3日期值82
5.3.1创建日期型变量83
5.3.2日期值的格式转换84
5.3.3日期值的运算86
5.4类型转换87
5.5数据排序88
5.6数据集的合并90
5.6.1数据框添加列93
5.6.2数据框添加行94
5.7数据集取子集95
5.7.1选入(保留)变量95
5.7.2剔除(丢弃)变量96
5.7.3subset()函数97
5.7.4随机抽样97
5.8使用SQL语句操作数据框97
5.9小结98
习题98
第6章高级数据管理100
6.1数值和字符处理函数100
6.1.1数学函数100
6.1.2统计函数102
6.1.3概率函数103
6.1.4字符处理函数105
6.1.5其他实用函数106
6.1.6将函数应用于矩阵和数据框107
6.2控制流108
6.2.1重复和循环108
6.2.2条件执行109
6.3用户自编函数111
6.4整合与重构112
6.4.1转置112
6.4.2整合数据114
6.4.3reshape2包114
6.5高级数据管理实例118
6.6小结121
习题121
第7章基本统计分析122
7.1描述性统计分析122
7.1.1统计分析概述122
7.1.2方法云集 128
7.1.3更多方法129
7.1.4分组计算描述性统计量131
7.1.5分组计算的扩展134
7.1.6结果的可视化135
7.2频数表和列联表154
7.2.1生成频数表154
7.2.2生成列联表155
7.2.3生成列联表的扩展159
7.2.4独立性检验160
7.2.5相关性的度量162
7.3相关分析163
7.3.1相关的类型163
7.3.2相关性的显著性检验166
7.3.3相关关系的可视化168
7.4T检验统计量170
7.4.1独立样本的T检验170
7.4.2非独立样本的 T 检验171
7.5组间差异的非参数检验172
7.5.1两组的比较172
7.5.2多组的比较174
7.6组间差异的可视化175
7.7小结181
习题181
第8章高级统计分析182
8.1回归分析182
8.1.1回归的多面性182
8.1.2OLS回归183
8.1.3回归诊断187
8.1.4异常观测值189
8.2方差分析190
8.2.1ANOVA模型拟合190
8.2.2单因素方差分析195
8.2.3协方差分析195
8.2.4多因素方差分析196
8.3广义线性回归196
8.3.1广义线性模型和glm()函数197
8.3.2logistic回归199
8.4主成分分析和因子分析205
8.4.1主成分分析205
8.4.2因子分析207
8.5聚类分析209
8.5.1层次聚类分析209
8.5.2划分聚类分析212
8.6高级统计分析实例214
8.7小结220
习题221
第9章创建动态报告222
9.1用模板生成报告222
9.2用R语言和Markdown创建动态报告224
9.3用R语言和LaTex创建动态报告230
9.3.1LaTex的基本语法230
9.3.2R LaTex创建动态报告232
9.3.3其他文档编辑方法234
9.4用R语言和Open Document创建动态报告236
9.5用R语言和Microsoft Word创建动态报告237
9.6创建动态报告实例240
9.7小结241
习题241
第10章R语言与Hadoop243
10.1RHadoop包243
10.1.1RHadoop简介243
10.1.2R语言与Hadoop的安装244
10.1.3RHadoop的安装246
10.2RHadoop的基本使用248
10.2.1rhdfs包的使用248
10.2.2rmr2包的使用250
10.3实例分析250
10.4小结252
习题252
第11章R语言图形用户界面253
11.1R语言图形用户界面简介253
11.2集成开发环境RStudio254
11.2.1RStudio简介254
11.2.2RStudio的安装256
11.2.3RStudio的基本使用257
11.3交互式Web应用Shiny包257
11.3.1Shiny包的安装258
11.3.2交互式Shiny Web应用的部署259
11.4可视化仪表板Flex Dashboard包261
11.5小结264
习题264
第12章综合实例分析265
12.1实例背景265
12.2描述性统计分析267
12.3高级统计分析272
12.3.1相关分析可视化272
12.3.2回归分析可视化273
12.3.3聚类分析可视化276
12.4小结277
参考文献278
|
內容試閱:
|
随着大数据时代的到来,各领域的数据呈爆炸性增长,这加速了统计学与计算机科学的交叉融合。R软件是一款集成了数据操作、统计和可视化功能的、优秀的开源软件,R软件具备高效的数据处理和可视化功能,提供了大量的数据分析工具。统计分析的数据规模和处理复杂度不断增加,传统意义上的数据处理工具已经难以满足人们的要求。本书在传统统计分析的基础上,进一步融合了大数据相关技术,具有更强的实用性。
本书的主要特色如下。
(1) 内容全面而完整,结构安排合理,图文并茂,通俗易懂,能够很好地帮助读者学习和理解R语言的基本操作、R语言数据管理、R语言统计分析、创建动态报告、R语言与Hadoop、R语言图形用户界面等数据分析与可视化内容。
(2) 注重理论与实践相结合。本书由浅入深,利用大量典型实例,详细讲解了R语言数据分析与可视化的主要内容,并结合实际利用R语言来完成一个综合项目实例。
(3) 统计学与计算机科学的高度融合。本书不仅介绍了传统的R语言统计分析方法,还介绍了R语言与大数据融合的相关技术,例如RHadoop等工具的使用。
(4) 本书作者都是长期从事本科教育的专职教师,从事云计算与大数据专业课教学多年,具有丰富的教学经验和实践经验,本书为他们教学经验和实践经验的结晶。
读者可扫描插图右侧的二维码获取彩色插图。
本书由杨剑锋任主编,张豹、尹少齐、伍仕屹任副主编。伍仕屹编写第1~3章,尹少齐编写第4、6、8章,张豹编写第5、7、9章,杨剑锋编写第10~12章。贵州理工学院信息网络中心副主任杨云江教授任主审,负责全书架构设计和内容设计,并负责书稿内容的主审工作。
因作者知识和水平有限,加上时间仓促,书中难免有不完善、疏漏和错误之处,恳请广大读者多多指教和批评指正,在此表示衷心感谢。
编者2021年2月
|
|