新書推薦:
《
从康德到黑格尔的发展:兼论宗教哲学(英国观念论名著译丛)
》
售價:NT$
275.0
《
突破不可能:用特工思维提升领导力
》
售價:NT$
352.0
《
王阳明大传:知行合一的心学智慧(精装典藏版)
》
售價:NT$
1010.0
《
失衡与重塑——百年变局下的中国与世界经济
》
售價:NT$
602.0
《
不被定义的年龄:积极年龄观让我们更快乐、健康、长寿
》
售價:NT$
352.0
《
南方谈话:邓小平在1992
》
售價:NT$
367.0
《
纷纭万端 : 近代中国的思想与社会
》
售價:NT$
500.0
《
中国古代文体形态研究(第四版)(中华当代学术著作辑要)
》
售價:NT$
765.0
|
內容簡介: |
本书分为10章。第1章介绍Python语言的起源和特性,以及安装Python及其开发环境的方法;第2章介绍Python语言的基础知识;第3章介绍Python数据组织结构,作为学习后续数据操作的基础;第4~7章介绍为了能够有效进行数据分析和数据挖掘所必须对数据进行的多种处理方法;第8章介绍使用不同的Python扩展库,以不同的可视化方法和形式对数据进行探索和分析;第9章介绍数据分析方法;第10章介绍数据挖掘的关联、分类和聚类算法。本书配套以下教学资源:教学PPT、习题答案、数据分析支撑文件、程序代码等,请选用本书作教材的教师登录www.cmpedu.com注册后下载,或发邮件至jinacmp@163.com索取(注明学校名+姓名)。本书可作为普通高校计算机、大数据、人工智能、金融管理等专业的教材,也可供广大从事数据分析、人工智能、机器学习等应用系统开发的技术人员参考。本书配有电子课件和程序代码,书中的程序代码均在Python 3.8、Anaconda 3上调试通过,有些需要安装第三方库。选用本书作教材的老师请登录www.cmpedu.com注册下载课件等教学资源,或发邮件至jinacmp@163.com索取。
|
目錄:
|
目录前言第1章Python介绍及安装11.1Python出现11.2Python的特性21.3安装和使用Python3单元练习13第2章Python语言基础142.1Python语句142.2基本数据类型172.3标识符与变量182.4运算及运算符202.5程序结构242.6面向对象282.7常用标准库函数292.8自定义函数45单元练习47第3章Python数据组织结构493.1字符串493.2列表543.3元组603.4集合613.5映射(字典)643.6数组673.7矩阵743.8系列783.9数据框架81单元练习93第4章数据生成和采集964.1数据生成和载入964.2数据文件访问1144.3数据库访问1344.4网络数据采集136单元练习151第5章数据整理1535.1数据类型及精度转换1535.2数据抽样1545.3缺失值处理1575.4重复值处理1605.5异常值处理1615.6排序1625.7标准化1635.8离散化1655.9数值编码1675.10拟合与插值171单元练习175第6章数据变换1776.1线性空间变换1776.2域变换183单元练习185第7章数据规约1867.1主成分分析1867.2因子分析1877.3独立成分分析1897.4多维标度分析1907.5线性判别分析1917.6TSNE1937.7特征选择194单元练习197第8章数据可视化分析1988.1Matplotlib绘图1988.2Pandas绘图2298.3Seaborn绘图2418.4Networkx绘图2558.5Graphviz绘图256单元练习257第9章数据分析2619.1统计分析2619.2回归分析2809.3时间序列分析288单元练习301第10章数据挖掘30410.1关联分析30410.2分类归纳30810.3聚类分析326单元练习336参考文献338
|
內容試閱:
|
我们已进入信息社会,社会对信息资源的开发和应用进入了一个崭新的阶段,给经济、科技、生产、文化和生活等各个方面都带来了深刻变革和发展。数据的采集和应用,推动着工业生产向着更为规范和精准的方式迈进,推动着城市管理演变得更为智慧高效,推动着社会服务趋于更加精细和以人为本……数据的资源化转变,进一步促进了数据的生产和消费,数据在人们的生活中已经不可或缺。面对日益庞大的数据资源,以及社会发展对数据资源的依赖和推动,人们迫切需要强有力的手段、方法和工具来“挖掘”其中的有用信息,使数据资源的价值得以充分体现。数据分析和数据挖掘就是针对这一需求而发展起来的新兴的交叉学科,历经发展,在信息社会中迅速得到广泛应用。广大从事数据分析、数据应用和决策支持等领域的科研工作者和工程技术人员迫切需要了解和掌握这门技术。两年前,结合自己的教学工作,笔者编写了《数据挖掘原理与应用》,对数据挖掘的基本原理和过程进行了基本介绍,内容涉及运用多学科知识来构建数据挖掘技术,实现数据挖掘的各主要功能、挖掘算法和应用。书中以MS Excel为计算工具和数据挖掘软件WEKA相结合,使读者通过基本的计算和调整,体会数据挖掘算法的内涵和变化的影响。但是在数据分析和数据挖掘的实际应用中,需要使用简易、高效、支持并行和分布式处理的数据处理语言和工具来完成处理,而且要求该处理语言或工具具有较强的适应性,能够应用于不同质量、不同结构、不同体量的数据的处理。因此,本书着重介绍如何使用Python语言,完成《数据挖掘原理与应用》中的各项处理任务,并对相关内容进行了拓展,例如Python程序设计等内容,使之能够适用于Python初学者。Python是随着海量数据分析与处理需求的增长,以及数据处理与互联网相融合应用场景的产生和繁衍而应运而生的,成为专于数据分析、数据可视化和数据处理等的计算机语言和工具之一。Python语言作为可以通过扩展库在定义、功能和框架等方面进行拓展的开源软件,其数据管理和运算处理能够与数学表达恰当契合,与多种应用平台的完美对接和融合吸引了数据分析人员的目光,使用排名一直稳步上升,近几年来已跃居开发语言的前三名(TOIBE统计)。如今,Python已成为数据分析和数据科学的标准语言和标准平台之一。介绍使用Python进行数据分析和进行数据挖掘的书籍很多,大多以Python数据分析和挖掘扩展库(如numpy、sklearn和scipy等)为线索逐个介绍扩展库的功能。本书则是以完成数据分析和数据挖掘工作所要进行的环节为脉络,通过函数描述和示例分析,介绍使用Python进行数据采集、数据整理、数据探索和数据分析和挖掘的方法。受篇幅所限,无法对数据分析和数据挖掘技术的原理进行详细介绍。使用者应具备相关领域的基本知识,应具有较为扎实的面向对象编程的基础,以保证能够充分学习和掌握本书中的原理、算法和编程方法。本书可作为高等院校数据科学与大数据技术、计算机、信息管理与信息系统等专业的教材,也可供技术人员学习参考。本书分为10章。第1章介绍Python语言的起源和特性,以及安装Python及其开发环境的方法;第2章介绍Python语言的基础知识;第3章介绍Python数据组织结构,作为学习后续数据操作的基础;第4~7章介绍为了能够有效进行数据分析和数据挖掘所必须对数据进行的多种处理方法;第8章介绍使用不同的Python扩展库,以不同的可视化方法和形式对数据进行探索和分析;第9章介绍数据分析方法;第10章介绍数据挖掘的关联、分类和聚类算法。在本书的编写过程中,力争内容完整、准确、易于理解,参考了大量的热心学者和爱好者在互联网上以各种形式贡献的大量的资料,也参阅了相关书籍。在此,对这些资料的作者表示衷心感谢。书中内容涉及相关门类相关学科的深入知识,由于编者水平和精力有限,难免有疏漏和错误之处。读者在使用本书的过程中,敬请提出宝贵意见和建议,并发送至邮箱1184844262@qqcom,必定回复表示感谢。
|
|