新書推薦:
《
如何打造成功的商业赛事
》
售價:NT$
407.0
《
万千教育学前·透视学前儿童的发展:解析幼儿教师常问的那些问题
》
售價:NT$
265.0
《
慈悲与玫瑰
》
售價:NT$
398.0
《
启蒙的辩证:哲学的片简(法兰克福学派哲学经典,批判理论重要文本)
》
售價:NT$
347.0
《
心跳重置
》
售價:NT$
269.0
《
云中记
》
售價:NT$
347.0
《
中国古代妇女生活(中国古代生活丛书)
》
售價:NT$
214.0
《
你的认知正在阻碍你
》
售價:NT$
296.0
|
內容簡介: |
本书重点介绍Python语言在数据处理与数据挖掘方面的应用技巧,主要包括数据分析基础知识(数据收集与分析软件、数据挖掘的分析基础、简单数据的统计分析),数据分析高级方法(多元数据的综合分析、时序数据的模型分析),大数据基本处理方法(大数据分析基础应用、文献计量与科研评价、社会网络分析方法、数据分析编程平台)等内容。附录中还提供了Python数据分析相关方法和函数等,方便读者随时查看。本书内容丰富,图文并茂,可操作性强且便于查阅,主要面向数据分析的读者,能有效帮助读者提高数据处理与分析的水平,提升工作效率。书中的例子数据、习题数据及相关代码都可在作者的学习博客http://blog.leanote.com/DaPy下载使用,也可登录华信教育资源网http://www.hxedu.com.cn免费下载。
|
關於作者: |
王术,暨南大学伯明翰大学联合学院助理教授。比利时列日大学(与中国农业科学院联合培养)博士。英国伦敦大学国王学院数据科学硕士,华南华南农业大学经济学学士。研究领域为农业经济、环境经济和能源经济及数据科学等交叉学科的研究。曾受国家留学基金委资助公派留学。发表SCI及中文期刊十余篇,其中第1作者SCI一区论文5篇(分别发表于本专业国际顶级期刊)。编写并出版教材3部,掌握计算机编程语言与软件开发能力,精通R语言和Python数据分析。王斌会,暨南大学管理学院教授,博士生导师。国家和省级一流课程获得者,暨南大学“十佳教学名师”。从事数学、统计学及经济管理教学和科研工作37年,发表科研论文100余篇,完成50多项国家和省部级课题,获省部级以上科技进步奖3项,获省部级以上教学成果奖2项,一流课程4门,教学项目10余项。在数据分析和统计建模领域做了大量的基础性研究与开创性工作。出版相关学术专著3部,出版相关教材10余本,开发计算机软件10余套。精通大数据分析及统计语言的编程及数据处理云计算平台的开发。详情见其网站:www.yuque.com/rstat (www.jdwbh.cn/Rstat)
|
目錄:
|
目录第1部分 数据挖掘基础第1章 Python数据挖掘基础41.1 数据挖掘软件简介51.1.1 基本数据挖掘软件51.1.2 Python语言介绍61.2 Anaconda计算包91.2.1 Anaconda的使用91.2.2 Jupyter分析平台111.2.3 Spyder编程平台151.3 Python编程基础171.3.1 Python编程入门171.3.2 Python数据类型171.3.3 Python编程运算211.4 Python程序设计231.4.1 Python数据分析包241.4.2 数值分析包numpy261.4.3 基本绘图包matplotlib27数据及练习134第2章 数据挖掘的基本方法362.1 数据收集过程372.1.1 常规数据收集372.1.2 大数据的概念422.1.3 数据管理462.1.4 数据分析包pandas482.2 数据的描述分析562.2.1 基本统计量562.2.2 基于数据框的绘图612.3 数据的透视分析652.3.1 一维频数分析652.3.2 二维集聚分析672.3.3 多维透视分析72数据及练习274第3章 数据挖掘的统计基础763.1 均匀分布及其应用773.1.1 均匀分布的概念773.1.2 均匀分布的应用783.2 正态分布及其应用813.2.1 正态分布简介813.2.2 基本统计推断85数据及练习387第2部分 数值数据的挖掘第4章 线性相关与回归模型904.1 两变量相关与回归分析914.1.1 两变量线性相关分析914.1.2 两变量线性回归模型934.2 多变量相关与回归分析954.2.1 多变量线性相关分析954.2.2 多变量线性回归模型97数据及练习4107第5章 时间序列数据分析1105.1 时间序列简介1115.1.1 时间序列的概念1115.1.2 时间序列的模拟1115.1.3 股票数据的分析1135.2 时间序列模型的构建1145.2.1 ARIMA模型1145.2.2 ARMA模型的构建1195.2.3 ARMA模型的建立与检验1235.3 时间序列模型的应用1295.3.1 模型的预处理1305.3.2 模型的估计与检验1315.3.3 模型的预测分析133数据及练习5133第6章 多元数据的统计分析1356.1 综合评价方法1366.1.1 综合评价指标体系1366.1.2 综合评价分析方法1386.2 主成分分析方法1446.2.1 主成分分析方法的基本思想1446.2.2 主成分的基本分析1466.3 聚类分析方法1516.3.1 聚类分析方法的概念1516.3.2 系统聚类方法153数据及练习6158第3部分 文本数据的挖掘第7章 简单文本处理方法1627.1 字符串处理1637.1.1 字符串的基本操作1637.1.2 字符串查询与替换1647.2 简单文本处理1657.2.1 文本挖掘的概念1657.2.2 文本数据的分词1677.3 网络数据的爬虫1707.3.1 网页的基础知识1707.3.2 Python爬虫步骤1717.3.3 爬虫方法的应用173数据及练习7180第8章 社会网络与知识图谱1828.1 社会网络的初步印象1838.1.1 社会网络分析概念1838.1.2 社会网络分析包1848.2 社会网络图的构建1858.2.1 社会网络数据形式1858.2.2 社会网络统计量1888.2.3 美化社会网络图1918.3 商业数据知识图谱应用1948.3.1 关联规则分析概念入门1948.3.2 关联规则分析基础应用1958.3.3 关联规则可视化分析1978.3.4 大样本关联规则实战199数据及练习8203第9章 文献计量与知识图谱2049.1 文献计量研究的框架2059.2 文献数据的收集与分析2069.2.1 文献数据的获取2069.2.2 文献数据的分析2099.3 科研数据的管理与评价2139.3.1 科研单位与项目分析2139.3.2 科研期刊与作者分析2159.3.3 图谱共现矩阵计算2179.3.4 共现矩阵的网络图218数据及练习9221附录 资源共享平台与云计算平台222附录A 资源共享平台222A1 本书的学习网站222A2 本书自定义函数223附录B 云计算平台简介225B1 课程学习平台225B2 习题解答平台226参考文献228
|
|