新書推薦:
《
画楼:《北洋画报》忆旧(年轮丛书)
》
售價:NT$
1573.0
《
大国脊梁:漫画版
》
售價:NT$
374.0
《
跟着渤海小吏读历史:大唐气象(全三册)
》
售價:NT$
989.0
《
心智的构建:大脑如何创造我们的精神世界
》
售價:NT$
352.0
《
美国小史(揭秘“美国何以成为美国”,理解美国的经典入门读物)
》
售價:NT$
352.0
《
中国古代北方民族史丛书——东胡史
》
售價:NT$
576.0
《
巨人传(插图珍藏本)
》
售價:NT$
3289.0
《
地下(村上春树沙林毒气事件的长篇纪实)
》
售價:NT$
332.0
|
編輯推薦: |
本书配套资源丰富,包括教学大纲、教学课件、电子教案、程序源码、习题答案。
|
內容簡介: |
本书采用理论知识与全过程案例解析相结合的方式,深入浅出地介绍运用Python进行数据分析与挖掘的基本概念与方法。全书共13章,分为四部分: Python基础知识、数据分析相关库、数据挖掘理论与算法应用、综合案例。全书本着循序渐进、理论联系实际的原则,每个知识点及每章均选择了接近实际应用并具有典型性的丰富案例,引导读者更好地理解数据分析与挖掘的知识,并能快速开展编程实践,是一本实践性极强、深浅适度、重在应用、着重实战能力培养的教材。 本书可作为高等学校大数据管理与应用、数据科学与大数据技术、计算机科学与技术等相关专业的教材,也可作为数据分析与挖掘相关从业人员的参考书。
|
目錄:
|
第一部分Python基础知识
第1章Python概述
1.1Python简介
1.2Python的特点和应用领域
1.2.1Python的特点
1.2.2Python的应用领域
1.3Python开发环境的搭建
1.3.1Python的下载
1.3.2Python的安装
1.4Anaconda的下载与安装
1.5Anaconda中的Python开发环境
1.5.1Jupyter的使用
1.5.2Spyder的使用
1.5.3使用Conda管理包
1.5.4第三方包管理的例子
1.6使用百度AI Studio云计算编程环境
1.6.1登录AI Studio平台
1.6.2创建项目
1.6.3启动并运行项目
1.7Python的运行原理
1.8Python的编写规范
1.8.1行和缩进
1.8.2多行语句
1.8.3Python引号
1.8.4Python注释
1.9本章小结
第2章Python基础语法
2.1标识符与变量
2.1.1Python标识符
2.1.2Python关键字
2.1.3变量与赋值
2.2输入与输出
2.2.1数据的输入
2.2.2数据的输出
2.2.3输入和输出实战例题
2.3Python数据结构
2.3.1标量——基本数据类型
2.3.2序列类型——列表、元组和字符串
2.3.3映射类型——字典
2.3.4集合类型
2.3.5Python数据结构实战例题
2.4运算符与表达式
2.5Python流程控制
2.5.1顺序结构
2.5.2选择结构
2.5.3循环结构
2.6本章实战例题
2.7本章小结
2.8本章习题
第3章函数
3.1函数概述
3.1.1模块和包
3.1.2什么是函数
3.2函数的定义
3.3参数传递
3.3.1实参变量指向不可变对象
3.3.2实参变量指向可变对象
3.4函数参数的设置
3.4.1函数参数的类型
3.4.2位置参数
3.4.3默认参数
3.4.4关键字参数
3.4.5可变参数
3.5匿名函数
3.6递归函数
3.7本章实战例题
3.8本章小结
3.9本章习题
第4章类与对象
4.1面向对象
4.2类与对象的联系
4.3类的定义与使用
4.4属性
4.4.1实例属性和类属性
4.4.2公有属性和私有属性
4.5方法
4.5.1实例方法
4.5.2类方法
4.5.3静态方法
4.6继承
4.6.1隐性继承
4.6.2覆盖
4.6.3super继承
4.6.4多重继承
4.7运算符重载
4.8本章实战例题
4.9本章小结
4.10本章习题
第二部分数据分析相关库
第5章NumPy基础与应用
5.1NumPy简介
5.2NumPy数组基础
5.2.1数组的属性
5.2.2创建数组
5.2.3数组的数据类型
5.2.4数组的迭代
5.2.5数组的索引和切片
5.2.6数组的合并与拆分
5.3数组的相关操作
5.3.1统计相关操作
5.3.2形状相关操作
5.3.3数组的四则运算、点乘与比较操作
5.4数组的读/写
5.4.1数组的读取
5.4.2数组的写入
5.5本章实战例题
5.6本章小结
5.7本章习题
第6章Pandas基础与应用
6.1Pandas简介
6.1.1Pandas的主要特点
6.1.2Pandas的安装
6.2Pandas中的数据结构
6.2.1Series
6.2.2DataFrame
6.3Pandas中数据的基本操作
6.3.1数据的导入和导出
6.3.2数据的选取
6.3.3数据的编辑
6.3.4数据的合并
6.4数据运算与分析
6.4.1数据的算术运算和比较运算
6.4.2数据排序
6.4.3统计分析
6.4.4分组与聚合
6.4.5透视表与交叉表
6.5本章实战例题
6.6本章小结
6.7本章习题
第7章Matplotlib 基础及应用
7.1Matplotlib简介
7.1.1Matplotlib的主要特点
7.1.2Matplotlib的安装
7.2Matplotlib的基础知识
7.2.1导入Matplotlib
7.2.2Matplotlib中图形(Figure)的构成
7.2.3Matplotlib的中文设置
7.3Pyplot的使用
7.3.1plt.plot()函数的使用
7.3.2子图
7.4Pyplot中的常用图形
7.4.1散点图
7.4.2柱状图
7.4.3直方图
7.4.4饼图
7.4.53D图
7.5本章实战例题
7.6本章小结
7.7本章习题
第三部分数据挖掘理论与算法应用
第8章分类
8.1分类概述
8.1.1分类的基本概念
8.1.2常用的分类算法
8.1.3分类算法的评价指标
8.2分类的理论知识
8.2.1信息熵
8.2.2信息增益
8.2.3基尼系数
8.3决策树
8.3.1决策树的基本概念
8.3.2决策树的算法过程
8.3.3scikitlearn中决策树的应用
8.4朴素贝叶斯分类器
8.4.1朴素贝叶斯分类器的基本介绍
8.4.2朴素贝叶斯分类器的算法过程
8.4.3scikitlearn中朴素贝叶斯分类器的应用
8.5支持向量机
8.5.1支持向量机简介
8.5.2支持向量机的算法过程
8.5.3scikitlearn中支持向量机的应用
8.6梯度提升决策树
8.6.1梯度提升决策树的基本概念
8.6.2梯度提升决策树的算法过程
8.6.3scikitlearn中梯度提升决策树的应用
8.7Python中分类预测模型的小结
8.8本章实战例题
8.9本章小结
8.10本章习题
第9章聚类
9.1聚类概述
9.1.1聚类的基本概念
9.1.2聚类中距离的度量
9.1.3聚类的常用算法
9.1.4聚类的评估
9.2基于划分的KMeans聚类算法
9.2.1KMeans的基本概念
9.2.2KMeans的算法过程
9.2.3scikitlearn中KMeans的应用
9.3基于层次分析的聚类
9.3.1基于层次分析的聚类的基本原理
9.3.2基于层次分析的聚类过程
9.3.3scikitlearn中Birch的应用
9.4基于密度的聚类
9.4.1基于密度的聚类的基本原理
9.4.2基于密度的聚类过程
9.4.3scikitlearn中DBSCAN的应用
9.5本章实战例题
9.6本章小结
9.7本章习题
第10章回归分析
10.1回归概述
10.1.1常用的回归模型
10.1.2回归分析的步骤
10.1.3回归的相关系数
10.1.4回归模型的评价指标
10.2线性回归
10.2.1线性回归的原理
10.2.2线性回归的应用
10.2.3一元线性回归
10.2.4多元线性回归
10.3逻辑回归
10.3.1逻辑回归的原理
10.3.2LogisticRegression的应用
10.3.3逻辑回归的应用
10.4其他回归
10.4.1多项式回归
10.4.2岭回归
10.4.3Lasso回归
10.5本章实战例题
10.6本章小结
10.7本章习题
第四部分综 合 案 例
第11章实战案例: 电商消费者数据分析
11.1案例背景
11.2数据加载和预处理
11.2.1加载需要的库及读入数据
11.2.2数据信息初步分析
11.2.3数据预处理
11.3探索性数据分析
11.3.1各国订单情况分析
11.3.2客户情况分析
11.3.3产品情况分析
11.3.4按时间分析销售数据
11.4本章小结
第12章实战案例: 乳腺癌数据分析与预测
12.1案例背景
12.2数据加载和预处理
12.2.1加载需要的库及读入数据
12.2.2数据信息初步分析
12.2.3数据预处理
12.3探索性数据分析
12.3.1诊断结果列的分布
12.3.2数据分布的可视化分析
12.3.3相关性分析
12.4分类模型
12.4.1LogisticRegression模型
12.4.2决策树模型
12.4.3SVM模型
12.5提升预测准确率的策略
12.5.1数据标准化或规范化
12.5.2特征选择
12.5.3参数调优
12.6本章小结
第13章实战案例: 钻石数据分析与预测
13.1案例背景
13.2数据加载和预处理
13.2.1加载需要的库及读入数据
13.2.2数据信息初步分析
13.2.3数据预处理
13.3探索性数据分析
13.3.1类别特征分析
13.3.2数值特征分析
13.3.3相关性分析
13.4回归模型的预测
13.5本章小结
参考文献
|
內容試閱:
|
“洞悉先于人,数据赢天下”。随着大数据时代的到来,数据已成为重要的生产要素和国家基础性战略资源,数据分析
与挖掘的相关理论和技术在各行各业的应用也有了质的飞越。数据分析与挖掘可以从海量数据中找到具有参考意义的模式和规则,转换成有价值的信息、洞察或知识,并创造更多的新价值。数据分析与挖掘综合了人工智能、概率论、线性代数、统计学和数据库等多学科知识,要求相关从业人员既要掌握大量相关理论知识和算法原理,又能熟练运用编程语言进行开发和实践。
Python语言具有语法简洁、功能强大、扩展库丰富、开源免费等特点,可高效完成数据统计分析、数据挖掘、可视化等任务,是目前数据分析与挖掘、机器学习和人工智能等领域广泛应用的一门编程语言。
本书基于Python语言,全面系统地介绍了运用Python进行数据分析与挖掘的基本概念与方法。
全书分为四部分,共13章。第一部分主要讲解Python基础知识,包括第1~4章,重点介绍Python基础语法、函数和面向对象知识; 第二部分主要讲解Python中数据分析的相关库,包括第5~7章,主要介绍使用NumPy和Pandas进行统计分析、分组与聚合、交叉分析,以及使用Matplotlib进行数据可视化的方法; 第三部分主要讲解数据挖掘的理论与算法应用,包括第8~10章,重点介绍数据挖掘的相关概念、常用算法原理和实践应用; 第四部分为综合案例,包括第11~13章,通过3个完整案例详细介绍了数据分析与挖掘的步骤和方法。
本书特色如下。
(1) 体系完整,结构合理。本书按照“Python基础知识—数据分析相关库—数据挖掘理论与算法应用—综合案例”的学习主线,循序渐进地介绍数据分析与挖掘从理论到实践的全过程。
(2) 案例主导,实践性强。本书为每个知识点设计了丰富的典型性案例,并用3个综合案例
帮助
读者加深对全书知识的理解。通过理论知识与编程实践的充分结合,有效引导读者更好地理解和掌握数据分析与挖掘的知识,并快速开展编程实践。
(3) 内容丰富,注重应用。各章除了章节要点、主体知识点阐述和实战案例模块外,还设置了
小结和习题等模块,帮助读者进一步掌握和巩固重点和难点知识,提高应用能力。
为便于教学,本书提供丰富的配套资源,包括教学大纲、教学课件、电子教案、程序源码和习题答案。
资源下载提示
课件等资源: 扫描封底的“课件下载”二维码,在公众号“书圈”下载。
素材(源码)等资源: 扫描目录上方的二维码下载。
本书可作为高等学校大数据管理与应用、数据科学与大数据技术、计算机科学与技术等相关专业的教材,也可作为数据分析与挖掘相关从业人员的参考书。
由于编者水平有限,书中不当之处在所难免,欢迎广大读者批评指正。
在本书的编写过程中得到了北京市数字教育研究课题(No.BDEC2022619037)和国家自然科学基金(No.62172287)的资助,在此表示衷心的感谢。
编者2023年8月
|
|