新書推薦:
《
首辅养成手册(全三册)(张晚意、任敏主演古装剧《锦绣安宁》原著小说)
》
售價:NT$
551.0
《
清洁
》
售價:NT$
296.0
《
组队:超级个体时代的协作方式
》
售價:NT$
352.0
《
第十三位陪审员
》
售價:NT$
245.0
《
微观经济学(第三版)【2024诺贝尔经济学奖获奖者作品】
》
售價:NT$
709.0
《
Python贝叶斯深度学习
》
售價:NT$
407.0
《
文本的密码:社会语境中的宋代文学
》
售價:NT$
306.0
《
启微·狂骉年代:西洋赛马在中国
》
售價:NT$
357.0
|
內容簡介: |
本书系统地介绍了数据科学基础理论、大数据理论、大数据技术及应用的相关内容,具体内容包括数据科学概述、大数据概述、大数据与云计算、大数据的采集与预处理、大数据的存储与处理、大数据分析方法、大数据分析工具、大数据可视化、大数据安全、大数据的应用等。
本书针对高等院校数据科学与大数据技术等专业开设的相关课程编写,既可作为高等院校的教材,也可供从事数据管理、数据分析和大数据系统架构等工作的读者阅读和参考。
|
目錄:
|
前言
第1章 数据科学概述1
本章学习要点1
1.1 数据基础理论1
1.2 数据科学基础理论7
1.3 数据科学的发展12
1.4 数据科学家概述16
本章小结18
习题19
第2章 大数据概述21
本章学习要点21
2.1 大数据的产生和发展21
2.2 大数据基础理论28
2.3 大数据与相关领域的联系32
本章小结35
习题35
第3章 大数据与云计算37
本章学习要点37
3.1 云计算概述37
3.2 云计算的核心技术48
3.3 云计算与大数据的联系56
本章小结61
习题61
第4章 数据的采集与预处理63
本章学习要点63
4.1 大数据采集63
4.2 大数据预处理70
4.3 联机分析处理76
本章小结82
习题82
第5章 大数据的存储与处理84
本章学习要点84
5.1 大数据的存储方式84
5.2 数据仓库93
5.3 大数据的处理框架101
本章小结111
习题111
第6章 大数据分析方法113
本章学习要点113
6.1 大数据分析方法概述113
6.2 数据挖掘的主要方法119
6.3 时间序列分析131
6.4 人工神经网络139
本章小结143
习题143
第7章 大数据分析工具146
本章学习要点146
7.1 Python146
7.2 Tableau152
7.3 SAS157
7.4 R163
本章小结168
习题168
第8章 大数据可视化170
本章学习要点170
8.1 大数据可视化概述170
8.2 大数据可视化的方法与工具177
8.3 大数据可视化的发展192
本章小结194
习题194
第9章 大数据安全196
本章学习要点196
9.1 大数据安全概述196
9.2 大数据隐私问题204
9.3 大数据安全技术210
本章小结228
习题228
第10章 大数据的应用230
本章学习要点230
10.1 大数据在物流行业中的应用230
10.2 大数据在电子商务行业中的
? 应用241
10.3 大数据在医疗行业中的应用247
本章小结253
习题254
参考文献256
|
內容試閱:
|
信息化水平的不断提高,促进了数据科学、大数据、云计算和物联网等技术的诞生和快速发展。我国“十三五”规划正式将大数据上升为国家战略,在未来的若干年,社会对大数据专业人才的需求量将是巨大的。为此,我国许多高校开设了与数据科学或大数据相关的专业,旨在为社会培养大批的从事数据管理、大数据系统开发和数据分析等工作的复合型、应用型人才。基于这样的背景和需求,本书系统地介绍了培养具有数据科学素养和大数据基础知识的专业人才所需要的大数据相关知识。
本书共10章,内容包含数据科学与大数据的相关概念、从大数据采集到大数据可视化这一过程中所需的知识,并在此基础上介绍了大数据所面临的安全挑战和大数据技术在不同领域的应用,帮助读者掌握数据科学与大数据技术中的重要基本概念,理解其相关技术和方法的基本原理。本书在结构上可分为基础部分、技术部分和应用部分。
第1部分为基础部分(第1~3章),主要介绍数据科学的基础理论、大数据的基础知识以及大数据中云计算的相关知识。第1章从数据的概念、类型和数据模型,数据科学的概念、研究内容和发展等,到数据科学家的概念与应具备的能力等内容,全面介绍了数据科学的整个体系。第2章系统性地介绍了大数据的产生背景,发展情况和大数据的概念、特征与核心技术等内容。第3章从大数据的视角阐述了云计算的概念、特点、体系架构、核心技术以及在大数据中的作用等内容。
第2部分为技术部分(第4~9章),主要介绍大数据的采集、预处理、存储、处理、分析、可视化及安全保护的相关技术。第4章的内容包括系统日志采集和网络数据采集等大数据采集技术以及数据清洗、集成、变换和归约等预处理技术和联机分析处理的概念等。第5章介绍分布式文件系统、NoSQL数据库和云存储三种大数据存储方法,数据仓库的概念、组成、数据模型等基础知识,以及大数据常用的两种处理框架(Hadoop和Spark)。第6章主要介绍大数据分析的类型和步骤,以及关联分析、分类和预测、聚类、时间序列分析和人工神经网络等大数据分析的常用方法。第7章详细介绍Python、Tableau、SAS和R这四种常用的大数据分析工具。第8章从大数据可视化的概念、发展历程、分类、可视化方法(基于文本的可视化方法和基于图形的可视化方法)、常用工具及可视化发展等方面介绍大数据可视化的内容。第9章介绍大数据安全的概念、大数据安全问题的成因以及分类、大数据隐私的相关问题、大数据安全和隐私保护的相关技术。
第3部分为应用部分(第10章),详细介绍大数据技术在物流、电子商务和医疗等行业中的具体应用。
北京科技大学王道平和沐嘉慧担任本书主编,负责设计全书结构、草拟写作提纲、组织编写工作以及统稿等工作,参加编写和资料整理的还有李明芳、梁思涵、尚天泽、胥子政、蔚婧文、刘淞、黄梦禧、杨帆、刘欣楠和丁婧一等。
本书获得北京科技大学“十三五”规划教材项目支持,在编写过程中参考了大量的文献资料,在此对各位编者表示真诚的感谢,同时衷心感谢机械工业出版社对本书出版的大力支持。由于编者水平有限,难免存在不妥和疏漏之处,欢迎广大读者批评指正。
编 者
|
|