登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 聯絡我們  | 運費計算  | 幫助中心 |  加入書簽
會員登入   新用戶註冊
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類閱讀雜誌 香港/國際用戶
最新/最熱/最齊全的簡體書網 品種:超過100萬種書,正品正价,放心網購,悭钱省心 送貨:速遞 / 物流,時效:出貨後2-4日

2024年10月出版新書

2024年09月出版新書

2024年08月出版新書

2024年07月出版新書

2024年06月出版新書

2024年05月出版新書

2024年04月出版新書

2024年03月出版新書

2024年02月出版新書

2024年01月出版新書

2023年12月出版新書

2023年11月出版新書

2023年10月出版新書

2023年09月出版新書

『簡體書』Python数据分析实战——从Excel轻松入门Pandas

書城自編碼: 3754439
分類: 簡體書→大陸圖書→計算機/網絡程序設計
作者: 曾贤志
國際書號(ISBN): 9787302602811
出版社: 清华大学出版社
出版日期: 2022-05-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:NT$ 403

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
月与蟹(青鲤文库)荣获第144届直木奖,天才推理作家经典作品全新译本。一部青春狂想曲,带你登上心理悬疑之巅。
《 月与蟹(青鲤文库)荣获第144届直木奖,天才推理作家经典作品全新译本。一部青春狂想曲,带你登上心理悬疑之巅。 》

售價:NT$ 230.0
索恩丛书·盛清统治下的太监与皇帝
《 索恩丛书·盛清统治下的太监与皇帝 》

售價:NT$ 403.0
透过器物看历史(全6册)
《 透过器物看历史(全6册) 》

售價:NT$ 2234.0
我在台北故宫博物院读名画
《 我在台北故宫博物院读名画 》

售價:NT$ 500.0
尼罗河往事:古埃及文明4000年
《 尼罗河往事:古埃及文明4000年 》

售價:NT$ 347.0
一个人·谁也不是·十万人(诺贝尔文学奖得主反思自我的巅峰之作)
《 一个人·谁也不是·十万人(诺贝尔文学奖得主反思自我的巅峰之作) 》

售價:NT$ 250.0
重写晚明史(全5册  精装)
《 重写晚明史(全5册 精装) 》

售價:NT$ 3560.0
汉末晋初之际政治研究
《 汉末晋初之际政治研究 》

售價:NT$ 602.0

建議一齊購買:

+

NT$ 407
《 JavaScript+Vue.js Web开发案例教程 》
+

NT$ 284
《 从0到1 HTML+CSS快速上手 微视频版 》
+

NT$ 593
《 Laravel框架关键技术解析 》
+

NT$ 364
《 Visual Basic.NET实用教程(第3版) 》
+

NT$ 648
《 Netty 4核心原理与手写RPC框架实战 》
+

NT$ 384
《 ECMAScript 从零开始学(视频教学版) 》
編輯推薦:
本书是一本基础入门加实战的书籍,既有基础知识,又有丰富示例,包括详细的操作步骤,实操性强。本书对Pandas的基本概念讲解很详细,包括基本概念及代码示例。
內容簡介:
本书从零开始系统讲解了使用Pandas导入Excel数据,然后使用Pandas技术对数据做整理和分析,后导出为不同形式的Excel文件。完整实现了数据的导入、处理、输出的处理流程。 全书共10章。第1章为Pandas数据处理环境的搭建,第2章为使用Pandas对Excel数据读取与保存,第3章介绍与Pandas底层数据相关的NumPy库,第4章介绍了Pandas中DataFrame表格的增、删、改、查等常用操作,第5章介绍了对Series与DataFrame两种数据的运算、分支、遍历等处理,第6章介绍了字符串的各种清洗技术,第7章介绍时间戳与时间差数据的处理,第8章介绍Pandas中分层索引及与索引相关的操作,第9章介绍了对数据的分组处理及做数据透视表处理,第10章介绍了表格的数据结构转换,以及多表读取与保存。书中包含相应示例,不仅可以学会理论知识还可以灵活应用。 本书可作为Excel爱好者和数据分析初学者的入门书籍,以及想提高数据分析效率,拓展数据分析手段相关人员的参考书籍。
關於作者:
曾贤志,Office技术培训专家,我要自学网专家讲师,特邀技术图书作者,擅长使用VBA、SQL、Power BI、Python等技术做数据分析。著有《Power Query For Excel让工作化繁为简》《加薪不加班:174个Excel函数案例闯职场》《从Excel到Python:用Python轻松处理Excel数据》等与数据分析相关的技术图书。
目錄
第1章Pandas数据处理环境搭建
1.1Pandas环境配置
1.1.1安装Python发行版本Anaconda
1.1.2程序编写工具Jupyter Notebook
1.2Python基础操作
1.2.1变量
1.2.2注释
1.2.3代码缩进
1.2.4数据结构
1.2.5控制语句
1.2.6函数
第2章Pandas中数据的存取
2.1读取Excel文件数据
2.2读取CSV文件数据
2.3保存为Excel文件格式
2.4保存为CSV文件格式
2.5Pandas中表格的结构
2.5.1DataFrame数据结构
2.5.2Series数据结构
第3章NumPy数据处理基石
3.1NumPy的定义
3.2NumPy数组的创建与转换
3.2.1普通数组
3.2.2序列数组
3.2.3随机数组
3.2.4转换数组
3.3NumPy数组的预处理
3.3.1类型转换
3.3.2缺失值处理
3.3.3重复值处理
3.4NumPy数组维度转换
3.4.1数组维度转换
3.4.2数组合并
3.5Series数据的创建
3.6DataFrame表格的创建
3.6.1使用NumPy数组创建DataFrame表格
3.6.2使用Python列表创建DataFrame表格
3.6.3使用Python字典创建DataFrame表格
第4章表格管理技术
4.1表格属性获取与修改
4.1.1表格属性的获取
4.1.2表格属性修改
4.2表格的切片选择
4.2.1切片法
4.2.2筛选法
4.2.3loc切片法
4.2.4iloc切片法
4.3添加表格的行和列
4.3.1添加行
4.3.2添加列
4.4删除表格的行和列
4.4.1删除行
4.4.2删除列
4.4.3删除有缺失值的行和列
4.5表格数据的修改
4.6巩固案例
第5章数据处理基础
5.1数据运算处理
5.1.1运算符与运算函数
5.1.2Series与单值的运算
5.1.3DataFrame与单值运算
5.1.4Series与Series运算
5.1.5DataFrame与DataFrame运算
5.1.6DataFrame与Series运算
5.1.7数据运算时的对齐特性
5.2数据分支判断
5.2.1条件判断处理1(mask()与where())
5.2.2条件判断处理2(np.where())
5.3数据遍历处理
5.3.1遍历Series元素(map())
5.3.2遍历DataFrame行和列(apply())
5.3.3遍历DataFrame元素(applymap())
5.4数据统计处理
5.4.1聚合统计
5.4.2逻辑统计
5.4.3极值统计
5.4.4排名统计
5.5巩固案例
5.5.1根据不同蔬菜的采购数量统计每天采购金额
5.5.2筛选出成绩表中各科目均大于或等于100的记录
5.5.3筛选出成绩表中各科目的和大于或等于300的记录
5.5.4统计每个人各科目总分之和的排名
5.5.5统计每个人所有考试科目的科目
第6章字符串清洗技术
6.1正则
6.1.1正则表达式的导入与创建
6.1.2正则表达式处理函数
6.1.3正则表达式编写规则
6.2拆分
6.2.1普通拆分
6.2.2正则拆分
6.2.3拆分次数
6.2.4拆为表格
6.2.5实例应用
6.3提取
6.3.1将数据提取到列方向
6.3.2将数据提取到行方向
6.3.3实例应用
6.4查找
6.4.1查找位置
6.4.2查找判断
6.4.3查找数据
6.4.4实例应用
6.5替换
6.5.1Series数据替换
6.5.2DataFrame表格替换
6.5.3实例应用
6.6长度
6.7重复
6.8修剪
6.9填充
6.9.1元素填充
6.9.2字符填充
6.10去重
6.10.1重复项判断
6.10.2重复项删除
6.11排序
6.11.1单列排序
6.11.2多列排序
6.11.3自定义排序
6.12合并
6.12.1Series数据自身元素合并
6.12.2Series数据与其他数据合并
6.13扩展
6.14巩固案例
6.14.1筛选出分数中至少有3个大于或等于90分的记录
6.14.2两表查询合并应用
6.14.3给关键信息加掩码
6.14.4提取文本型单价后与数量做求和统计
6.14.5提取不重复名单
6.14.6对文本中的多科目成绩排序
第7章日期和时间处理技术
7.1时间戳
7.1.1单个时间戳
7.1.2时间戳序列
7.1.3时间戳转换
7.1.4时间戳信息获取
7.2时间差
7.2.1单个时间差
7.2.2时间差序列
7.2.3时间差信息获取
7.2.4时间差偏移
7.3巩固案例
7.3.1根据出生日期计算年龄
7.3.2将不规范日期整理为标准日期
7.3.3根据开始时间到结束时间的时长计算金额
7.3.4根据借书起始时间及租借天数计算归还日期
第8章高级索引技术
8.1Pandas索引
8.1.1Series索引
8.1.2DataFrame索引
8.2分层索引的设置
8.2.1Series的分层索引设置
8.2.2DataFrame的分层索引设置
8.3分层索引设置的4种方法
8.4文件导入导出时分层索引设置
8.5行索引与列数据的相互转换
8.5.1列数据设置为行索引
8.5.2行索引设置为列数据
8.6分层索引切片
8.6.1选择单行
8.6.2选择单列
8.6.3选择单值
8.6.4选择多行多列
8.6.5选择指定级别数据
8.6.6筛选索引
8.7索引的修改
8.7.1索引重命名
8.7.2索引重置
8.7.3索引排序
8.7.4索引层级交换
8.7.5索引删除
8.8巩固案例
8.8.1筛选出下半年总销量大于上半年的记录
8.8.2对文本型数字月份排序
8.8.3根据分数返回等级设置索引
第9章数据汇总技术
9.1分组处理
9.1.1分组
9.1.2聚合
9.1.3转换
9.1.4过滤
9.1.5高级分组
9.2数据透视表
9.2.1指定索引方向分组聚合
9.2.2多列执行单种聚合
9.2.3单列执行多种聚合
9.2.4多列执行多种聚合
9.2.5指定列做指定聚合
9.2.6行索引和列索引分组聚合
9.2.7跟列数据长度相同的数组做分组
9.2.8数据透视表缺失值处理
9.2.9数据透视表的行和列总计设置
9.3巩固案例
9.3.1提取各分组的前两名记录
9.3.2按条件筛选各分组的记录
9.3.3提取各分组下的值
9.3.4分组批量拆分表格到Excel文件
9.3.5将数据透视表拆分为Excel文件
第10章表格转换技术
10.1表格方向转换
10.1.1列索引数据转换成行索引数据
10.1.2将行索引数据转换成列索引数据
10.2表格纵横拼接
10.2.1表格纵向拼接(初级)
10.2.2表格纵向拼接(进阶)
10.2.3表格横向拼接(初级)
10.2.4表格横向拼接(进阶)
10.3表格数据存取
10.3.1批量读取
10.3.2批量保存
10.4巩固案例
10.4.1多个工作表数据合并
10.4.2工资条制作
10.4.3特殊的纵向表格拼接
10.4.4多工作表合并与聚合处理
10.4.5跨表查询后再聚合汇总
10.4.6将汇总结果分发到不同工作表
內容試閱
Excel是一款非常流行的电子表格软件。它是一种很好的数据存储方式,同时也是一款强大的数据清洗、分析工具。任何事物有强就有弱。Excel本身已经内置了很多实用的功能,为什么还要选择Pandas工具来处理Excel数据呢?
首先,在Excel进行数据清洗时,如果工作重复度比较高,反复使用手动操作效率太低,不具有自动化功能。当然,也可以用Excel内置的VBA编程进行二次开发,解决自动化问题,但Pandas更胜一筹,其代码简洁,灵活性强,运算速度更快。
其次,Pandas是跨平台的,在不同的操作系统上均可以使用。即使没有安装电子表格软件,也可以使用。不但如此,Pandas还支持TXT、CSV、HTML和数据库等更多格式的数据获取方式。
那么,什么是Pandas?Pandas是Python中的一个数据分析包,是基于NumPy的(提供高性能的矩阵运算,这就标志着它的运算速度快)。并且Pandas提供了超强的数据清洗功能,可以用于数据挖掘和数据分析,可以说Pandas就是为数据分析而生的。
本书从学习Excel数据清洗的视角来学习Pandas,更易上手。很多时候,Pandas中编写的数据处理代码像Excel中的工作表函数公式一样,一条代码就能完成任务,优雅又简洁。
本书主要内容
第1章介绍Anaconda集成环境的安装,Jupyter Notebook的使用,以及Python语言的基础语法应用。
第2章介绍Pandas对Excel/CSV文件的读取与保存设置,并介绍Pandas的DataFrame和Series两大核心数据结构。
第3章介绍NumPy数组的创建与转换,并介绍NumPy数组的类型、缺失值、重复值等预处理,以及Series和DataFrame两种数据结构的各种创建方法。
第4章介绍对DataFrame表格属性的获取与修改,表格的各种切片选择方法,以及对表格增、删、改、查的设置。
第5章介绍DataFrame、Series和单值3种不同结构数据之间的运算方法,并介绍Pandas中常用的分支判断函数,以及Pandas中常用的循环遍历函数和常用的统计函数。
第6章讲解正则表达式的使用方法,Pandas中拆分、提取、查找、替换、去重、排序、合并等常用字符串处理函数。
第7章介绍时间戳、时间差数据处理的相关函数。
第8章介绍Pandas中分层索引的设置、创建,分层索引的切片选择方法,以及分层索引的重命名、重置、排序、删除等操作。
第9章讲解Pandas中的分组处理技术,以及Pandas中的数据透视表技术。
第10章介绍DataFrame表格的纵向和横向拼接技术,如何批量读取Excel工作表数据为DataFrame表格,以及批量保存DataFrame表格数据到多工作表、多工作簿。
阅读建议
本书是一本基础入门加实战的图书,既有基础知识,又有丰富示例,包括详细的操作步骤,实操性强。本书对Pandas的基本概念讲解很详细,从第4章开始,在每章的后一节配有对整章知识应用的示例,并提供完整代码,运行代码就可以立即看到效果。这样会给读者信心,在轻松掌握基础知识的同时快速进入实战阶段。
建议读者对Excel有一定的操作基础,这样更方便对照学习。如果读者有一定的Python基础则更好,没有Python基础也不用担心,第1章讲解关于Python的基础知识,在Pandas中应用Python的技术点也不多,例如在Pandas中基本不会使用Python循环语句。因而不用担心Python基础不好而学不会Pandas。
本书源代码
扫描下方二维码,可获取本书示例的源代码:


致谢
成书不易,在写作本书的过程中,笔者得到了很多人的支持与帮助。首先,感谢我的父母、岳父母及妻子,感谢你们一如既往对我工作的支持,成为我坚实的后盾; 然后还要感谢女儿雨柔、儿子果儿。你们是我坚持写作的动力,一位普普通通的父亲想给你们树立一个榜样。无论何时都不能忘记学习,哪怕每天只能进步一点点。只有知识才是我们一生中重要的财富。希望你们在自己的人生道路上,能保持一颗不抛弃、不放弃的心。
由于时间仓促,书中难免存在不妥之处,请读者见谅,并提宝贵意见。
曾贤志
2022年1月

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 台灣用户 | 香港/海外用户
megBook.com.tw
Copyright (C) 2013 - 2024 (香港)大書城有限公司 All Rights Reserved.