新書推薦:
《
现代吴语的研究(中华现代学术名著3)
》
售價:NT$
296.0
《
天下的当代性:世界秩序的实践与想象(新版)
》
售價:NT$
352.0
《
德国天才4:断裂与承续
》
售價:NT$
500.0
《
妈妈的情绪,决定孩子的未来
》
售價:NT$
194.0
《
推拿纲目
》
售價:NT$
1836.0
《
精致考古--山东大学实验室考古项目论文集(一)
》
售價:NT$
1112.0
《
从天下到世界——国际法与晚清中国的主权意识
》
售價:NT$
347.0
《
血色帝国:近代英国社会与美洲移民
》
售價:NT$
265.0
|
編輯推薦: |
1.从Python程序设计基础入手,深入讲解数据分析的相关包及数据分析方法
2.将数值、网络、文本等类型的数据作为案例进行分析,将理论与实际相结合
3.配套资源丰富,配套微课视频,案例数据源,课件,上机实验指导等
|
內容簡介: |
本书针对Python零基础的读者,重点讲解利用Python进行数据分析的基础知识,并通过大量的实战案例,使读者掌握数据处理、分析与可视化的方法。全书分为4个部分,共13章,主要内容包括:Python语法基础、网络爬虫、NumPy、pandas、正则表达式与格式化输出、数据处理与数据分析、Matplotlib、pyecharts、Altair动态可视化、NetworkX、航班数据分析、豆瓣网络数据分析、《红楼梦》文本数据分析等。
本书内容丰富、由浅入深,案例浅显易懂,适合作为普通高等院校数据科学与大数据技术、统计与大数据等专业相关课程的教材,也适合作为从事数据分析与可视化相关工作的从业人员的的参考书。
|
關於作者: |
余本国,博士,硕士研究生导师,主讲线性代数、微积分、Python语言、大数据分析基础等课程。2012年到加拿大York University做访问学者。出版有《Python数据分析基础》等多本著作,广受市场好评。
|
目錄:
|
第 一部分 Python语法基础5
第 1章 Python语法基础 6
1.1 编辑器Anaconda 6
1.2 语法规范 12
1.3 程序结构 18
1.4 异常值处理 24
1.5 数据类型 27
1.6 函数 41
1.7 实战体验:超市小票打印功能 46
第二部分 Python数据处理与分析 48
第 2章 网络爬虫 49
2.1 urllib库 49
2.2 BeautifulSoup库 51
2.3 scrapy框架爬虫 55
2.4 实战体验:爬取豆瓣网数据 61
第3章 Numpy 67
3.1 数组的创建 68
3.2 数组的操作 74
3.3 数组的计算 85
3.4 统计基础 86
3.5 矩阵运算 89
3.6 实战体验:图片翻转裁剪压缩处理 92
第4章 Pandas 96
4.1 Series 96
4.2 DataFrame 101
4.3 数据导入 107
4.4 数据导出 111
4.5 实战体验:输出符合条件的属性内容 113
第5章 正则表达式与格式化输出 116
5.1 正则表达式基础 116
5.2 re模块 118
5.3 贪婪匹配 120
5.4 编译 121
5.5 正则函数 121
5.6 格式化输出 126
5.7 实战体验:验证信息的正则表达式 131
第6章 数据处理与分析 134
6.1 数据处理 134
6.2 数据标准化 172
6.3 数据分析 175
6.4 实战体验:股票统计分析 185
第三部分 Python数据可视化 192
第7章 Matplotlib 193
7.1 Matplotlib的设置 193
7.2 符号及中文标注处理 194
7.3 绘图种类 195
7.4 实战体验:南丁格尔玫瑰图 206
第8章 Pyechartcs 208
8.1 安装及配置 208
8.2基本图表 211
8.3 坐标系图表 219
8.4 地图与地理坐标绘制 224
8.5 3D图形 228
第9章 Altair动态可视化 230
9.1安装与导入Altair 230
9.2 Altair图形语法 231
9.3交互效果的实现 236
9.4 实战体验:学生数据交互可视化 241
第 10章 Networkx 251
10.1 模块安装 251
10.2 无向图 251
10.3 有向图 253
10.4 实战体验:标注货物流向图 254
第四部分 应用案例 256
第 11章 航班数据分析 257
11.1 需求介绍 257
11.2 预备知识 257
11.3 航班数据处理 260
11.4 完整代码 266
第 12章 豆瓣网络数据分析 269
12.1 数据处理 269
12.2 计算平均星级 270
12.3 计算均价 272
第 13章 《红楼梦》文本数据分析 277
13.1 准备工作 277
13.2 分词 278
13.3 文本聚类分析 295
13.4 LDA主题模型 306
13.5 人物社交网络分析 312
本章小结 318
附录 Pyecharts本地加载渲染js图 319
|
|