新書推薦:
《
封建社会农民战争问题导论(光启文库)
》
售價:NT$
296.0
《
虚弱的反攻:开禧北伐
》
售價:NT$
429.0
《
泰山:一种中国信仰专论(法国汉学经典译丛)
》
售價:NT$
380.0
《
花外集斠箋
》
售價:NT$
704.0
《
有兽焉.8
》
售價:NT$
305.0
《
大学问·明清经济史讲稿
》
售價:NT$
330.0
《
中国国际法年刊(2023)
》
售價:NT$
539.0
《
早点知道会幸福的那些事
》
售價:NT$
295.0
|
編輯推薦: |
本教材基于“新工科”“新文科”建设背景,以学生认知为基础,围绕数据智能和编程思维,建设基于Python的数据分析与可视化教材。该教材结构完整,内容由浅入深,语言通俗易懂,案例贴近学生生活和学习真实场景,既体现了该学科的当前热点,又兼顾了案例的生动性和趣味性,教学内容和实践内容相辅相成,适合零基础学生完整、系统地学习数据分析与可视化方法。
|
內容簡介: |
本书以数据智能和编程思维为核心,围绕数据的全生命周期管理概念,详细介绍了基于Python的数据分析与可视化方法,涵盖基本概念、数据处理、数据获取、数据计算、数据分析、数据可视化及综合应用。 本书分为理论和实验两部分,内容由浅入深,语言通俗易懂,案例贴近学生生活和学习真实场景,既体现了数据科学的技术热点,又兼顾了案例的生动性和趣味性,适合全国高等学校各专业作为“新文科”建设背景下的人工智能和数据科学通识课教材使用,也可作为大数据、智能数据处理相关专业的专业教材或参考教材。
|
目錄:
|
理论篇
第1章数据智能概述3
1.1数据智能技术3
1.1.1数据科学过程的基本概念4
1.1.2机器学习5
1.1.3深度学习9
1.1.4习题与实践10
1.2编程思维10
1.2.1编程思维概述10
1.2.2习题与实践11
1.3数据结构与应用11
1.3.1数据的逻辑结构11
1.3.2数据的存储结构12
1.3.3常见的数据结构13
1.3.4习题与实践14
1.4数据隐私与数据安全15
1.4.1数据隐私15
1.4.2数据安全16
1.4.3数据道德18
1.4.4习题与实践20
第2章基本数据处理21
2.1算法的表达21
2.1.1什么是算法21
2.1.2算法流程图22
2.1.3算法的控制结构23
2.1.4习题与实践25〖3〗数据智能——Python数据分析与可视化目录〖3〗2.2数据基础25
2.2.1数据的程序表达25
2.2.2数据的传递38
2.2.3习题与实践42
2.3批量数据处理应用43
2.3.1字符串43
2.3.2列表45
2.3.3元组47
2.3.4字典48
2.3.5集合50
2.3.6习题与实践52
第3章数据处理编程53
3.1程序的基本结构53
3.1.1控制流53
3.1.2程序运算选择58
3.1.3程序运算控制64
3.1.4习题与实践70
3.2模块化程序设计71
3.2.1函数71
3.2.2模块与Python库73
3.2.3习题与实践77
第4章数据获取与计算79
4.1数据采集和处理79
4.1.1文件输入输出80
4.1.2读取文件内容82
4.1.3将数据写入文件83
4.1.4习题与实践85
4.2数据预处理85
4.2.1数据探查86
4.2.2搜集数据86
4.2.3数据预处理的方法87
4.2.4习题与实践89
4.3Python数值统计90
4.3.1NumPy90
4.3.2ndarray对象90
4.3.3NumPy 数据类型92
4.3.4NumPy 数组属性94
4.3.5其他创建数组的方式96
4.3.6切片、迭代和索引100
4.3.7NumPy计算102
4.3.8习题与实践103
第5章数据分析与可视化104
5.1Python数据分析104
5.1.1Series数据结构105
5.1.2DataFrame对象107
5.1.3Pandas的数据预处理116
5.1.4习题与实践120
5.2Python数据可视化121
5.2.1Matplotlib模块121
5.2.2Seaborn模块131
5.2.3习题与实践135
第6章电信行业客户行为分析与流失预警136
6.1客户流失分析136
6.1.1客户流失分析的核心问题137
6.1.2流失客户分析137
6.2数据获取138
6.3数据预处理146
6.4流失用户的特征分析151
6.5流失用户分析与预警158
实验篇
实验1计算思维和编程思维实践165
实验2数据的输入和输出170实验3数据的程序表达172实验4程序运算选择174实验5程序运算控制177实验6批量数据处理180实验7模块化程序设计183实验8数据采集和预处理186实验9Python数据分析188实验10Python数据可视化1191实验11Python数据可视化2193
|
內容試閱:
|
随着互联网、云计算和大数据的蓬勃发展,信息技术得到了极大的普及与应用,在人文社科领域,定量研究越来越受到普遍重视。2014年,得克萨斯大学的艺术史学家Maximilian Schich在Science上发表了Quantitative social science. A network framework of cultural history,他带领团队收集了两千多年以来历史上15万西方文化名人的迁徙信息,通过数据分析与计算研究文化史的网络框架;美国杂志撰稿作家Ben Blatt出版了Nabokovs Favorite Word Is Mauve一书,他用统计学的方法,梳理了19世纪末到21世纪初1500部经典著作,拆解出优秀作品的写作规律;近年来,我国多家科研机构建设了面向人文社科研究的数据平台,为人文社科研究范式的创新与转型提供数据支撑。
2020年11月,发布《新文科建设宣言》,重磅启动“新文科”。在人文社科领域,应用数据思维和数据科学方法进行科研探索,已成为必然趋势。新文科建设与人才培养要求针对人文社科领域的科研应用需求,结合文科专业学生特点,融入现代信息技术赋能文科教育。因此,面向新文科学生的素养养成,应该建设以数据思维和编程思维为核心的教材体系,促进数据驱动的新文科研究范式发展,涵盖数据、大数据、数据管理、数据分析、数据可视化、数字化学习与创作等关键学科知识,培养学生应用编程思维和数字化工具解决问题,全面提升学生的计算机素养、数字化胜任力和进行交叉学科科研创新的关键能力。
本教材致力于深化新文科大学计算机教学改革,培养具有形象思维、数据思维和编程思维的新文科人才,能够在数字化时代更好地开展人文社科领域的数字化学习与创新训练。
本教材以及与之对应的课程目标如下。
●了解数据思维和编程思维,理解算法的概念和程序设计的基本知识,理解智能数据处理的过程和方法。
●能够针对实际问题进行抽象和建模,以Python语言为工具编写程序解决问题。
●培养学生应用数据科学方法和编程思维进行交叉学科科研探索,形成较强的形象思维、逻辑思维、批判性思维和创造性思维。
本教材分为理论与实验两部分。理论部分涵盖基本概念、数据处理、数据获取、数据计算、数据分析、数据可视化及综合应用;实验部分针对各个章节的理论学习,开展数据处理、数据分析与可视化的实验。各章简要介绍如下。
第1章数据智能概述介绍数据智能概念及其技术的发展、编程思维及基本数据结构、数据隐私与数据安全,使读者了解数据科学基本概念。
第2章基本数据处理围绕算法的表达、基本数据类型、数据处理基础及批量数据处理的应用介绍算法和数据的基本概念,使读者掌握大数据处理的基本原理与方法。
第3章数据处理编程主要介绍程序的基本结构及其实现、模块化编程中必须掌握的方法和技巧,并通过解决实际问题,培养读者基本的编程思维。
第4章数据获取与计算对数据采集与文件读写、数据预处理的具体方法进行介绍,使读者了解数据预处理的作用,掌握基本的数据获取与预处理方法。
第5章数据分析与可视化围绕Python实现数据处理与可视化的全流程,介绍常用的数据结构、数据预处理方法、数据分析方法,并借助Python的NumPy、Pandas、Matplotlib等模块所提供的计算、分析、统计和绘图功能,来阐述实用的数据分析和数据可视化方法。
第6章电信行业客户行为分析与流失预警从电信行业客户流失入手,对客户行为数据进行处理,分析客户为什么会流失、什么样的客户容易流失,进而在产品业务推广过程中,提出防止客户流失的方案。实现了利用编程思维和Python编程语言,探究数据智能。
本教材编写团队全部来自华东师范大学数据科学与工程学院,他们多年来始终致力于大学计算机基础教育及相关研究,密切结合信息技术发展及人才培养的需求,着眼于将智能信息技术与教育研究实践进行深度融合,在大学计算机公共课、基础教育改革等方面做出了众多的探索与实践。
本教材的编写始于2021年年初,经过两年的创作与不断完善最终完成。在此,感谢清华大学出版社和全国高等学校计算机教育研究会的支持,感谢为大学计算机基础教学贡献力量的各位老师,特别感谢参与教材编写与审核的各位老师: 胡文心、刘艳、王肃、俞琨、蔡建华。由于时间仓促,书中疏漏及不足之处在所难免,敬请读者海涵并不吝指正。
作者
2023年5月
|
|