新書推薦:
《
启微·狂骉年代:西洋赛马在中国
》
售價:NT$
357.0
《
有趣的中国古建筑
》
售價:NT$
305.0
《
十一年夏至
》
售價:NT$
347.0
《
如何打造成功的商业赛事
》
售價:NT$
407.0
《
万千教育学前·透视学前儿童的发展:解析幼儿教师常问的那些问题
》
售價:NT$
265.0
《
慈悲与玫瑰
》
售價:NT$
398.0
《
启蒙的辩证:哲学的片简(法兰克福学派哲学经典,批判理论重要文本)
》
售價:NT$
347.0
《
心跳重置
》
售價:NT$
269.0
|
內容簡介: |
本书重点介绍Python语言在处理数据、分析数据及数据可视化方面的应用技巧,内容涉及数据分析软件介绍、数据的收集与整理、Python数据分析编程基础、数据的探索性分析及可视化、数据的直观分析及可视化、数据的统计分析及可视化、数据的模型分析及可视化、数据的预测分析及可视化、数据的决策分析及可视化、数据的在线分析及可视化。本书内容丰富,图文并茂,可操作性强且便于查阅,主要面向希望应用Python进行数据分析的读者,能有效地帮助读者提高数据处理与分析的水平,提升工作效率。书中的例子数据和习题数据都可在作者的学习博客http:Rstat.leanote.com下载使用,也可登录华信教育资源网http:www.hxedu.com.cn免费下载。本书适合各个层次的数据分析用户,既可作为初学者的入门指南,又可作为中、高级用户的参考手册,同时也可作为各大中专院校和培训班的数据分析教材。
|
關於作者: |
王斌会暨南大学管理学院教授,博士生导师。从事数学、统计学及经济管理教学和科研工作30多年,在数据科学和大数据分析领域做了大量的基础性研究与开创性工作。出版相关学术专著和教材10余本。精通大数据分析及SAS、SPSS、R、Python等语言的编程及数据处理云计算平台的开发。王术,博士生。英国伦敦大学国王学院数据科学硕士,现为中国农业科学院与比利时列日大学联合培养博士生。主要研究方向为农业大数据分析和挖掘、农业资源利用与区域规划。
|
目錄:
|
目录
第1章数据分析软件简介1
1.1数据分析软件简介2
1.2Python语言介绍3
1.2.1Python简介3
1.2.2Python的功能4
1.2.3Python编程环境6
1.3Python数据分析平台8
1.3.1Jupyter数据分析平台9
1.3.2Python在线分析平台15
1.4Python编程入门20
1.4.1Python的工作目录20
1.4.2Python的分析用包20
1.4.3Python的数据类型22
习题126
第2章数据的收集与整理28
2.1数据的类型28
2.1.1按度量尺度分28
2.1.2按时间状况分29
2.2数据的收集29
2.2.1横向数据的收集30
2.2.2纵向数据的收集32
2.3数据的管理33
2.3.1表格管理数据34
2.3.2数据库管理数据34
2.3.3Python数据管理34
习题235
第3章Python数据分析编程基础37
3.1Python编程运算38
3.1.1基本运算38
3.1.2控制语句38
3.1.3函数定义39
3.1.4面向对象41
3.2数值分析库numpy42
3.2.1一维数组43
3.2.2二维数组43
3.2.3数组的操作43
3.3数据分析库pandas44
3.3.1序列Series44
3.3.2数据框DataFrame46
3.3.3数据框的读写48
3.3.4数据框的操作50
习题354
第4章数据的探索性分析及可视化57
4.1数据的描述分析58
4.1.1计数数据汇总分析58
4.1.2计量数据汇总分析59
4.1.3描述性汇总统计量61
4.2数据的统计绘图62
4.2.1基于matplotlib的绘图62
4.2.2基于pandas的绘图69
4.3数据的分组分析73
4.3.1一维频数表与图73
4.3.2二维集聚表与图76
4.3.3多维透视表与图79
习题486
第5章数据的直观分析及可视化88
5.1特殊统计图的绘制89
5.1.1函数图89
5.1.2气泡图91
5.1.3三维散点图91
5.1.4三维曲面图92
5.2seaborn统计绘图92
5.2.1seaborn绘图特点93
5.2.2seaborn中的统计图93
5.3ggplot绘图系统98
5.3.1ggplot与plotnine包98
5.3.2基于图层的绘图法98
5.3.3plotnine中的统计图100
5.4pyecharts动态绘图104
5.4.1pyecharts简介104
5.4.2pyecharts基本绘图104
5.4.3基于数据框的绘图110
习题5113
第6章数据的统计分析及可视化115
6.1随机变量及其分布图116
6.1.1均匀分布及随机数图116
6.1.2正态分布及随机数图117
6.2统计量及其抽样分布图125
6.2.1统计量及抽样的概念125
6.2.2统计量的分布及模拟图126
6.3基本统计推断方法129
6.3.1参数的估计方法129
6.3.2参数的假设检验132
6.3.3统计推断的可视化133
习题6135
第7章数据的模型分析及可视化137
7.1线性相关分析模型138
7.1.1线性相关的概念和模拟138
7.1.2样本相关系数的计算140
7.1.3样本相关系数的检验143
7.2线性回归分析模型144
7.2.1线性回归模型的建立144
7.2.2线性回归模型的检验147
7.2.3线性回归模型的预测149
7.3分组可视化模型分析149
7.3.1可视化分组线性相关分析150
7.3.2可视化分组线性回归模型150
习题7153
第8章数据的预测分析及可视化155
8.1动态数列的基本分析156
8.1.1动态数列介绍156
8.1.2动态数列的变动分析158
8.2动态数列的预测分析161
8.2.1趋势预测构建161
8.2.2平滑预测方法165
8.3时间序列数据的可视化分析168
8.3.1股票数据可视化分析169
8.3.2股票的收益率分析176
习题8180
第9章数据的决策分析及可视化182
9.1确定性决策分析183
9.1.1单目标求解及图示183
9.1.2多目标求解及图示185
9.2不确定性决策分析186
9.2.1分析方法的思想186
9.2.2不确定性分析原则187
9.3概率型风险分析190
9.3.1期望值法及直观分析191
9.3.2后悔期望值法及直观分析192
习题9193
第10章数据的在线分析及可视化195
10.1Tushare数据的可视化分析196
10.1.1股市基本数据的获取与分析196
10.1.2证券交易数据的获取与分析203
10.1.3Tushare数据的保存及扩展207
10.2新浪财经数据的可视化分析208
10.2.1宏观经济数据的抓取与分析209
10.2.2股票行情数据的抓取与分析212
10.3中商情报数据的可视化分析213
10.3.1宏观经济数据的爬取与分析214
10.3.2A股股票信息的爬取与分析216
习题10218
附录A本书学习博客220
附录B书中相关资料222
附录C书中自定义函数223
参考文献224
|
|