新書推薦:
![中国早期国家(增订版)](http://103.6.6.66/upload/mall/productImages/25/6/9787573214195.jpg)
《
中国早期国家(增订版)
》
售價:NT$
704.0
![成长的心智——重新思考时代与心灵](http://103.6.6.66/upload/mall/productImages/25/9/9787121491610.jpg)
《
成长的心智——重新思考时代与心灵
》
售價:NT$
500.0
![海洋科学研究的国际法规制](http://103.6.6.66/upload/mall/productImages/25/8/9787208190856.jpg)
《
海洋科学研究的国际法规制
》
售價:NT$
449.0
![华侨与中国新民主主义革命](http://103.6.6.66/upload/mall/productImages/25/7/9787523407776.jpg)
《
华侨与中国新民主主义革命
》
售價:NT$
509.0
![袖中东海一编开:域外文献与清代社会史研究(修订版)](http://103.6.6.66/upload/mall/productImages/25/8/9787208191563.jpg)
《
袖中东海一编开:域外文献与清代社会史研究(修订版)
》
售價:NT$
704.0
![中国音乐史](http://103.6.6.66/upload/mall/productImages/25/8/9787307219885.jpg)
《
中国音乐史
》
售價:NT$
857.0
![重塑的魅力 Blythe改妆与BJD卡通娃头化妆技法](http://103.6.6.66/upload/mall/productImages/25/9/9787121490415.jpg)
《
重塑的魅力 Blythe改妆与BJD卡通娃头化妆技法
》
售價:NT$
449.0
![新一代信息技术产业发展战略研究(2035)](http://103.6.6.66/upload/mall/productImages/25/9/9787030793935.jpg)
《
新一代信息技术产业发展战略研究(2035)
》
售價:NT$
775.0
|
編輯推薦: |
本书给出了各种跨学科的Python程序示例,难度适中,有助于读者循序渐进地掌握Python编程的核心技术和应用方法
|
內容簡介: |
本书以Python 3.9为数据分析与挖掘的工具,课程内容包括基础篇和综合篇。基础篇从Python基础知识出发,围绕数据分析与挖掘常用的科学计算包NumPy、数据处理包Pandas、数据可视化包Matplotlib以及机器学习库Scikit-learn进行理实一体化讲练;综合篇聚焦汽车、交通行业案例进行数据分析综合应用,包括新能源汽车运行数据分析、汽车贷款违约概率预测、航空公司客户价值分析,以及吉利汽车用户在线评论数据分析4个综合应用案例。
本书遵循从基础到综合应用、理论与实践一体化的编写原则,各章按照“案例驱动”编写模式,体验从问题求解到程序设计的转换过程,适合应用型本科高校工科类、管理类专业学生及其他Python数据分析与挖掘爱好者使用。
|
關於作者: |
黄强,硕士研究生,讲师、高级信息系统项目管理师、高级数据分析师,从事高等教育教学工作近10年,现任吉利学院智能科技学院数据科学教研室负责人,主要授课《数据分析与挖掘》、《数据结构与算法》、《数据库原理与应用》,公开发表论文近10篇,其中SCI/SSCI双检索1篇,SSCI检索1篇,主持、参与省厅级、校级课题6项。
|
目錄:
|
基 础 篇
第1章 Python数据分析与挖掘基础 3
1.1 数据分析与挖掘简介 3
1.2 Python开发环境 5
1.3 Python数据类型及常用操作 8
1.4 流程控制语句 13
1.5 函数定义与调用 16
本章小结 17
第2章 NumPy科学计算与分析 19
2.1 NumPy简介 19
2.2 数组的创建及常见操作 20
2.3 矩阵的创建及常见操作 27
2.4 NumPy统计分析 29
本章小结 36
第3章 Pandas数据处理与分析 37
3.1 Pandas简介 37
3.2 序列 37
3.3 数据框 45
3.4 外部文件读取 49
3.5 Pandas数据处理 53
3.6 Pandas数据分析 62
本章小结 69
第4章 Matplotlib数据可视化 71
4.1 数据可视化与Matplotlib简介 71
4.2 Matplotlib绘图基础 72
4.3 Matplotlib常见图表绘制 79
本章小结 88
第5章 Scikit-Learn机器学习 90
5.1 机器学习与Scikit-Learn简介 90
5.2 数据预处理与降维 92
5.3 回归分析 98
5.4 分类分析 101
5.5 聚类分析 110
本章小结 112
综合应用篇
第6章 新能源汽车运行数据分析 117
6.1 需求分析 117
6.2 数据加载与预处理 117
6.3 探索性数据分析 122
6.4 电池健康状态可视化 124
6.5 能耗预测 131
本章小结 135
第7章 汽车贷款违约概率预测 136
7.1 需求分析 136
7.2 数据加载、清洗与分析 136
7.3 预测模型构建与评估 146
7.4 预测可视化 148
本章小结 149
第8章 航空公司客户价值分析 151
8.1 需求分析与数据加载 152
8.2 数据预处理 153
8.3 数据K-均值聚类 156
8.4 价值分析可视化 157
本章小结 159
第9章 吉利汽车用户在线评论数据分析 160
9.1 需求分析 160
9.2 数据加载与预处理 161
9.3 词云图可视化分析 165
9.4 关键词共现分析 167
本章小结 170
|
內容試閱:
|
当前是大数据的时代。各行各业的生产生活都会产生大量数据,大数据的获取与预处理、存储与管理、数据分析与建模,以及数据可视化等大数据应用越来越受到重视。Python基于面向对象、解释性、可移植性以及开源易学等特点进行数据分析与挖掘,容易入门,易于推广,是人们工作和生活的称手工具。
本书以应用为导向,遵循读者认知规律,从基础到综合应用,各章以“案例驱动”导入,遵从理论与实践一体化的编写原则。基础篇为第1~5章。第1章介绍数据分析与挖掘以及Python基础知识,使读者掌握数据分析与挖掘的联系与区别、Anaconda与Spyder的安装和使用方法、Python内置6种数据类型及常用操作、流程控制语句、函数定义与调用等基本编程方法;第2章介绍了Python用于科学计算与简单统计分析的NumPy包;第3章重点介绍了Python用于数据预处理与统计分析的Pandas包,利用Pandas包不仅可以进行数据读取与预处理,还能进行分组聚合、透视表、交叉表等统计分析;第4章主要介绍了Python用于数据可视化的Matplotlib包,主要包括数据可视化常见的图表、Matplotlib绘图流程以及典型基础图表、高级图表及3D图表的绘制;第5章介绍Python用于机器学习的Scikit-Learn库,包括数据预处理、数据降维、回归、分类、聚类相关的机器学习算法原理与应用。综合篇为第6~9章。每章对应一个综合案例,综合案例聚焦汽车、交通行业领域,包括新能源汽车运行数据分析、汽车贷款违约概率预测、航空公司客户价值分析,以及吉利汽车用户在线评论数据分析。各章案例讲解从需求分析、数据加载与预处理、数据分析与建模及数据可视化4个步骤相对完整地进行,使读者可以全面地掌握应用Python进行具体领域的数据分析与挖掘的方法。
本书的出版得到了吉利学院“教学质量工程”(校级品牌课程项目)的资助。本书所有程序均采用Anaconda3集成的Spyde(Python 3.9)进行编写且全部编译通过。书中所有章节教学大纲、课件、案例数据、程序代码、思政元素目录、即测即练题库等配套资源均由清华大学出版社提供下载方式。由于编者水平有限,加之时间仓促,书中难免会有疏漏之处,恳请广大读者批评指正,将意见反馈至邮箱:1450691104@qq.com。
编 者
2023年6月
|
|