新書推薦:
《
大模型应用开发:RAG入门与实战
》
售價:NT$
407.0
《
不挨饿快速瘦的减脂餐
》
售價:NT$
305.0
《
形而上学与存在论之间:费希特知识学研究(守望者)(德国古典哲学研究译丛)
》
售價:NT$
504.0
《
卫宫家今天的饭9 附画集特装版(含漫画1本+画集1本+卫宫士郎购物清单2张+特制相卡1张)
》
售價:NT$
602.0
《
化妆品学原理
》
售價:NT$
254.0
《
万千教育学前·与幼儿一起解决问题:捕捉幼儿园一日生活中的教育契机
》
售價:NT$
214.0
《
爱你,是我做过最好的事
》
售價:NT$
254.0
《
史铁生:听风八百遍,才知是人间(2)
》
售價:NT$
254.0
|
編輯推薦: |
采用理论与实践相结合的原则,在各章的开篇采用图解方式,将所有知识点先贯穿起来,然后对每个知识点配套案例讲解。
在讲解的过程中重思路、重基础、重实操,“用读者易于理解且可随时直接套用的案例,方便读者以最短的时间高效掌握最实用的技能”是本书创作的初衷。
在Pandas、xlwings、openpyxl的高阶应用过程中,书中有演示大量的对比方案,例如同一批量操作Pandas、xlwings、openpyxl三者间不同的应用方法。
|
內容簡介: |
本书采用理论与实践相结合的原则,在各章的开篇会采用图解方式,将所有知识点先贯穿起来,然后对每个知识点配套案例讲解。“用读者易于理解且可随时直接套用的案例,方便读者以最短的时间高效掌握最实用的技能”是本书创作的初衷。 全书共分为6篇:第一篇为入门篇(第1章和第2章),第二篇为基础篇(第3章和第4章),第三篇为强化篇(第5~7章),第四篇为进阶篇(第8章和第9章), 第五篇为高阶篇(第10章和第11章), 第六篇为案例篇(第12章)。书中主要内容包括开启Python之旅、Python基础入门、Pandas数据提取、Pandas数据转换、Pandas文本与日期、Pandas数据处理、Pandas数据重塑、xlwings高效办公、openpyxl高效办公、Python数据处理自动化、Python数据分析自动化、Excel Python综合应用。 本书适用于具有一些数据分析或Python基础的读者,包括电商客服、质量统计、财务金融、人事行政等与数据分析密切相关的从业人员,也可作为高等院校、IT培训机构或IT专业人士的参考书籍。
|
關於作者: |
黄福星,精益六西格玛黑带,物流职业经理人(运营总监)。二十多年工作经历,职业生涯横跨大型生产制造、综合保税物流与供应链、快递快运与新零售等。在信息流指导物流、数据指导改善、物流降本增效方面经验丰富,能够熟练地将精益改善技术与大数据分析技术运用于各类现场管理。
|
目錄:
|
本书源码
第一篇入门篇
第1章开启Python之旅
1.1Python快速入门
1.1.1Python进化史
1.1.2搭建编程环境
1.2Anaconda下载与安装
1.2.1下载Anaconda
1.2.2安装Anaconda
1.2.3使用Anaconda
1.3Jupyter Notebook
1.3.1操作界面
1.3.2Code运行模式
1.3.3Markdown模式
1.3.4常用快捷键
1.3.5常用魔法命令
第2章Python基础入门
2.1程序设计
2.1.1编码规范
2.1.2命名规范
2.1.3保留字
2.1.4标识符
2.1.5变量
2.1.6代码缩进
2.1.7注释
2.1.8输入与输出
2.2数据结构
2.2.1列表
2.2.2元组
2.2.3字典
2.2.4集合
2.3数据类型
2.3.1数值型
2.3.2字符串型
2.3.3布尔型
2.4运算符
2.4.1算术运算符
2.4.2赋值运算符
2.4.3比较运算符
2.4.4逻辑运算符
2.4.5位运算符
2.5数据算法
2.5.1顺序结构
2.5.2分支结构
2.5.3循环结构
2.6迭代器与生成器
2.6.1迭代器
2.6.2生成器
2.7函数与方法
2.7.1内置函数
2.7.2自定义函数
2.7.3匿名函数
2.8异常处理
2.8.1内置异常
2.8.2异常处理
第二篇基础篇
第3章Pandas数据提取
3.1Pandas简介
3.1.1Pandas数据分析
3.1.2SMED与数据分析
3.1.3Excel数据的读取流程
3.2pd.read_excel()函数
3.2.1路径参数
3.2.2引擎参数
3.3工作表名称
3.3.1选择工作簿中的所有工作表
3.3.2选择工作簿中指定的工作表
3.3.3选择工作簿中具体的某一工作表
3.4标题
3.4.1提升为标题
3.4.2不需要标题
3.4.3多层索引
3.5处理行
3.5.1跳过行
3.5.2保留行
3.6选择列
3.6.1指定索引列
3.6.2选择列
3.7数据类型
3.7.1查看数据类型
3.7.2转换数据类型
3.7.3解析日期时间列
3.8对Excel的读取与解析
3.9存储数据
3.9.1to_excel
3.9.2ExcelWriter
第4章Pandas数据转换
4.1Pandas入门
4.1.1数据处理流程
4.1.2数据转换内容
4.2创建Series
4.2.1列表转Series
4.2.2元组转Series
4.2.3字典转Series
4.2.4ndarray转Series
4.2.5常量转Series
4.3创建DataFrame
4.3.1文件导入生成
4.3.2Series创建
4.3.3字典创建
4.3.4二维列表创建
4.3.5元组创建
4.4索引与切片
4.4.1直接索引
4.4.2标签索引
4.4.3位置索引
4.5逻辑值筛选
4.5.1索引器访问
4.5.2查询方法
4.6移动列
4.7选择列
4.7.1筛选列
4.7.2选择数据类型
4.8列名修改
4.8.1列名替换
4.8.2重命名列
4.9添加列
4.9.1属性赋值
4.9.2分配新列
4.9.3表达式创建新列
4.10添加行
4.10.1追加行
4.10.2添加多行
4.11删除操作
4.11.1删除
4.11.2删除缺失值
4.11.3删除重复项
4.12填充操作
第三篇强化篇
第5章Pandas文本与日期
5.1字符串处理
5.1.1字符串处理流程
5.1.2正则表达式
5.1.3文本正则应用
5.2日期和时间
5.2.1时间点
5.2.2时间段
5.2.3时间差
5.2.4时间偏移
5.2.5频率转换
第6章Pandas数据处理
6.1数据对齐
6.1.1对齐性
6.1.2空值处理
6.1.3设置行索引
6.1.4重置索引或层级
6.1.5重置行列索引
6.2数值排序
6.2.1排序规则
6.2.2索引排序
6.2.3数值排序
6.2.4数据排名
6.3统计分析
6.3.1统计学基础
6.3.2唯一值
6.3.3聚合统计
6.3.4聚合运算
6.4移动窗口
6.4.1滚动
6.4.2差分
6.4.3偏移
6.4.4扩展
6.4.5同环比
6.5数据遍历
6.5.1映射
6.5.2应用
6.5.3应用映射
6.5.4转换
6.6数据分组
6.6.1创建分组对象
6.6.2分组对象的应用
6.6.3扁平化分组表
6.6.4循环分组对象
6.7数据透视
第7章Pandas数据重塑
7.1多层索引
7.1.1生成多层索引
7.1.2设置多层索引
7.2结构重塑
7.2.1重置索引
7.2.2从列到行堆叠
7.2.3从行到列取消堆叠
7.2.4逆透视
7.2.5层级交换
7.2.6重新排列索引级别
7.2.7删除层级
7.2.8行列转置
7.2.9扩展到行
7.3追加查询
7.3.1数据追加
7.3.2纵横拼接
7.4合并查询
7.4.1数据合并
7.4.2按索引合并
7.5在Power BI中运行
7.5.1缘何从Excel进阶Python
7.5.2Power BI与Pandas的互补性
第四篇进阶篇
第8章xlwings高效办公
8.1xlwings对象模型
8.2xlwings基础语法
8.2.1新建工作簿
8.2.2打开工作簿
8.2.3新增工作表
8.2.4写入数据
8.2.5单元格引用
8.2.6合并单元格
8.2.7单元格区域
8.2.8应用程序接口
8.2.9区域调整
8.2.10选项方法
8.3xlwings工作表调整
8.3.1加密工作簿
8.3.2保护工作表
8.3.3隐藏工作表
8.3.4冻结窗格
8.4xlwings行列调整
8.4.1插入公式
8.4.2插入行列
8.4.3删除行列
8.4.4行高与列宽
8.5xlwings样式调整
8.5.1字体样式
8.5.2边框样式
8.5.3对齐样式
8.5.4填充样式
8.5.5数据格式
8.5.6条件格式
8.5.7表格格式
8.6xlwings添加图表
8.6.1xlwings插入图片
8.6.2xlwings创建图表
8.6.3与Pandas交互
8.6.4与NumPy及Matplotlib交互
8.6.5与Pandas及Matplotlib交互
8.6.6与Pandas及Seaborn交互
8.7与Pandas的用法对比
8.7.1拆分列并扩展到行
8.7.2查看所有工作表名称
8.7.3打开一个已有工作簿
8.7.4在一个工作簿中新增一个工作表
第9章openpyxl高效办公
9.1openpyxl基础语法
9.1.1创建、保存工作簿
9.1.2打开工作簿
9.1.3创建、删除工作表
9.1.4复制、移动工作表
9.1.5移动区域范围
9.1.6合并单元格
9.1.7行列范围用法
9.2openpyxl工作表调整
9.2.1保护工作表
9.2.2隐藏工作表
9.2.3冻结窗格
9.2.4标签颜色
9.3openpyxl行列应用
9.3.1插入公式
9.3.2插入行列
9.3.3删除行列
9.3.4隐藏行列
9.3.5行高与列宽
9.3.6数据组合
9.4openpyxl样式设置
9.4.1字体样式
9.4.2边框样式
9.4.3对齐样式
9.4.4填充样式
9.4.5文本样式
9.4.6数据格式
9.4.7条件格式
9.5openpyxl数据处理
9.5.1行值统计
9.5.2列值统计
9.6openpyxl添加图表
9.6.1添加图片
9.6.2添加图表
9.7openpyxl与Pandas交互
9.7.1openpyxl获取来自Pandas的数据
9.7.2Pandas获取来自openpyxl的数据
第五篇高阶篇
第10章Python数据处理自动化
10.1pathlib基础
10.1.1常用方法
10.1.2路径处理
10.1.3批量重命名应用
10.1.4与xlwings交互
10.1.5与openpyxl交互
10.2批量创建空白工作簿
10.2.1Pandas实现方式
10.2.2xlwings实现方式
10.2.3openpyxl实现方式
10.3批量操作单个工作簿
10.3.1将一个工作表复制到另一个工作簿
10.3.2将一个工作表批量复制到多个工作簿
10.3.3在一个工作表旁新增多个工作表
10.3.4将所有工作表合并成一个工作表
10.3.5按列值将一个工作表拆分成多个工作表
10.3.6按表名将多个工作表拆分为多个工作簿
10.3.7按列将一个工作表拆分成多个工作簿
10.3.8将一个工作表拆分成多个工作簿的多个工作表
10.3.9重命名一个工作簿中的所有工作表
10.3.10删除一个工作簿中的指定工作表
10.4批量操作多个工作簿
10.4.1批量打开现有工作簿
10.4.2将多个工作簿中所有工作表合并为一个工作表
10.4.3批量重命名多个工作簿中的同名工作表
10.4.4在多个工作簿中批量删除工作表
10.4.5批量隐藏工作簿中的工作表
第11章Python数据分析自动化
11.1数据分析方法论
11.1.1数据分析方法
11.1.2数据分析的5W1H
11.1.3数据分析流程
11.1.4Pandas数据分析应用
11.2单个工作簿数据处理
11.2.1对所有工作表进行数据筛选
11.2.2对所有工作表进行批量排序
11.2.3对所有工作表求最大值和最小值
11.2.4对所有工作表进行各自统计
11.2.5对所有工作表进行数据透视
11.3多个工作簿数据处理
11.3.1对所有工作簿的数据批量排序
11.3.2对多个工作簿批量统计最大值和最小值
11.3.3对多个工作簿中的各工作表分类汇总
11.3.4对多个工作簿批量制作数据透视表
11.4图表与数据的综合应用
11.4.1图表的应用
11.4.2添加柱形图
11.4.3添加簇状柱形图
11.4.4添加双轴组合图
11.4.5添加多个子图
11.4.6Matplotlib应用流程
11.5批量打印工作簿中的工作表
11.6批量加密保护工作簿
第六篇案例篇
第12章Excel Python综合应用
12.1综观全局
12.1.1数据获取
12.1.2信息获取
12.2数据质量
12.2.1异常值探究
12.2.2缺失值处理
12.3数据现状
12.3.1现状摸底
12.3.2数据观测
12.4数据分析
12.4.1分组统计
12.4.2数据透视
12.4.3时序分析
12.5数据可视化
12.5.1统计操作量
12.5.2管理标准差
12.5.3数据集子图
12.5.4流向流量图
12.6数据自动化
|
內容試閱:
|
在日常数据分析过程中,Excel、Python、R、SQL、Power BI、Tableau等都是数据分析师常用的工具。
在这几款工具中,Excel因其灵活、高效及易获取性,不管是早期推出的函数与VBA,还是近几年所推出的Power BI(内置了Power Query、Power Pivot等)都让其拥有数量庞大的用户群,从而成为众多数据分析师的首选。在近几年的计算机语言流行排行榜中,Python是当前最热门的语言之一,并且热度一直有增无减。
“人生苦短,我用Python”。其实,在数据分析中Excel与Python是可以完美结合的,并且越来越多的数据分析师已倾向于从Excel过渡到Python。通过xlwings或openpyxl替换VBA,通过Pandas替换Excel数据分析,通过NumPy Pandas与xlwings/openpyxl等的交互,用最简洁的代码操作更大量的数据,从而实现更高阶的数据分析与报表自动化。
本书采用理论与实践相结合的原则,在各章的开篇采用图解方式,将所有知识点先贯穿起来,然后对每个知识点的配套案例进行讲解。在讲解的过程中重思路、重基础、重实操,“用读者易于理解且可随时直接套用的案例,方便读者以最短的时间高效地掌握最实用的技能”是本书创作的初衷。在Pandas、xlwings、openpyxl的高阶应用过程中,书中演示了大量的对比方案,例如,同一批量操作Pandas、xlwings、openpyxl三者间不同的应用方法。
本书特色
“用一个数据源讲解一本书”及“注重图解”是本书的写作风格,书中穿插大量的知识图解与引导。从入门篇到高阶篇的近300个应用案例中,主要围绕着一个简单的工作簿(订单表.xlsx)及其子集(华东.xlsx)为数据源进行有效讲解,把Pandas中使用频率最高的或效率最高的80%的函数、方法、属性及其与xlwings、openpyxl的对比与交互应用,以及与Matplotlib、Seaborn的交互应用,通过对比与扩展两种方式加深读者对知识的全面了解与应用。最后通过一个实用的案例,把全书的所有重要知识点一一串接起来,并最终轻松转换为实战案例。
本书前半部分为Excel Python的数据分析基础,后半部分为Excel Python的数据分析与自动化进阶。本书适用于具有数据分析或Python基础的读者,包括电商客服、质量统计、财务金融、人事行政等与数据分析密切相关的从业人员,也可作为高等院校、IT培训机构的教材,还可作为IT专业人士的自学参考书。
扫描目录上方的二维码可下载本书源码。
致谢
首先要感谢笔者的妻子,写作过程中占据了大量的个人时间及家庭时间,她的理解与支持是笔者最大的动力。
感谢笔者的父母,是你们的谆谆教诲才使笔者一步一个脚印地走到今天。
还要感谢清华大学出版社赵佳霓编辑,她一如既往的专业指导让笔者受益匪浅。
由于时间仓促,书稿虽然经过全面检查,但疏漏之处在所难免,敬请读者批评指正,你们的反馈是笔者进步的动力。
黄福星2023年4月19日
|
|