新書推薦:
《
明代社会变迁时期生活质量研究
》
售價:NT$
1474.0
《
律令国家与隋唐文明
》
售價:NT$
358.0
《
现代吴语的研究(中华现代学术名著3)
》
售價:NT$
296.0
《
天下的当代性:世界秩序的实践与想象(新版)
》
售價:NT$
352.0
《
德国天才4:断裂与承续
》
售價:NT$
500.0
《
妈妈的情绪,决定孩子的未来
》
售價:NT$
194.0
《
推拿纲目
》
售價:NT$
1836.0
《
精致考古--山东大学实验室考古项目论文集(一)
》
售價:NT$
1112.0
|
編輯推薦: |
本书特色
(1) 采用“理实一体化”教学方式,课堂上既有教师的讲述,又有学生独立思考、上机操作的内容。
(2) 丰富的教学案例,包含了书中的教学课件、习题答案、微课视频等多种教学资源。
(3) 紧跟时代潮流,注重技术变化,书中包含了最新的大数据技术知识和一些开源库的使用。建议读者在阅读本书时使用Python 3.7以上版本,并提前安装好所需要的扩展库(如requests、Scrapy、numpy、pandas、matplotlib等)以便实验。此外,读者在阅读本书时还需安装MySQL和Kettle等相关软件。
(4) 本书编者都具有多年的教学经验,书中重难点突出,能够激发学生的学习热情。
|
內容簡介: |
本书介绍大数据技术的基本概念和相应的技术应用。全书共10章,分别是大数据介绍、云计算基础、大数据架构、数据采集、数据清洗、大数据存储、大数据分析与挖掘、大数据可视化、大数据安全和大数据的行业应用。本书将理论与实践操作相结合,通过大量的案例帮助读者快速了解大数据相关基本技术,并对书中重要的、核心的知识点加大练习比例,以达到熟练应用的目的。 本书可作为高等院校大数据、人工智能、软件技术、云计算、计算机网络等专业的专业课教材,也可作为大数据爱好者的参考书。
|
關於作者: |
黄源
计算机系教师,大数据专业负责人,带头人,副教授。
主讲课程:
(1)XML基础
(2)大数据基础
(3)linux操作系统
(4)网站搜索引擎优化
(5)python基础
主编教材(第一主编)
(1)XML基础与案例教程 机械工业出版社
(2)HTML5 css3网页设计机 械工业出版社
(3)搜索引擎优化基础与实训 中国水利水电出版社
(4)大数据分析 清华大学出版社
|
目錄:
|
第1章大数据介绍
1.1大数据概述
1.1.1认识大数据
1.1.2大数据的特征
1.1.3大数据技术应用与基础
1.2大数据的意义
1.2.1大数据的国家战略意义
1.2.2大数据的企业意义
1.2.3我国大数据市场的产业发展
1.3本章小结
1.4实训
习题1
第2章云计算基础
2.1云计算概述
2.1.1云计算定义
2.1.2云计算的特征
2.1.3云计算的体系结构
2.2云计算的服务类型与层次
2.2.1云计算服务类型
2.2.2云计算服务层次
2.3云计算的服务模式
2.3.1公有云
2.3.2私有云
2.3.3混合云
2.4云计算关键技术
2.4.1虚拟化技术
2.4.2容器技术
2.4.3并行计算技术
2.4.4海量数据存储技术
2.5云计算与大数据
2.5.1云计算与大数据的关系
2.5.2云计算与大数据的融合发展
2.6云计算的应用
2.7常见云计算平台介绍
2.7.1云计算平台介绍
2.7.2常见的云计算平台
2.8本章小结
2.9实训
习题2
第3章大数据架构
3.1大数据架构概述
3.1.1大数据架构介绍
3.1.2大数据架构分类
3.2Hadoop架构
3.2.1Hadoop介绍
3.2.2Hadoop发展史
3.2.3Hadoop核心组件
3.3HDFS概述
3.3.1HDFS的概念
3.3.2HDFS操作
3.4MapReduce概述
3.4.1MapReduce的概念
3.4.2MapReduce设计方式
3.4.3MapReduce架构
3.5本章小结
3.6实训
习题 3
第4章数据采集
4.1数据采集概述
4.2数据采集平台
4.2.1数据采集平台概述
4.2.2数据采集平台实例
4.3爬虫数据采集基础
4.3.1网络爬虫基础知识
4.3.2网络爬虫框架Scrapy
4.4Python爬虫实现
4.4.1Python简介
4.4.2Python爬虫实现
4.5本章小结
4.6实训
习题4
第5章数据清洗
5.1数据清洗概述
5.2数据清洗的常用方法
5.2.1缺失值的处理方法
5.2.2噪声数据的处理方法
5.3数据质量与数据仓库
5.3.1数据质量的定义
5.3.2数据质量的常见问题
5.3.3数据质量与数据清洗
5.3.4数据仓库与ETL
5.3.5主数据与元数据
5.4数据清洗环境与常用工具
5.4.1数据清洗环境
5.4.2数据清洗常用工具
5.5本章小结
5.6实训
习题5
第6章大数据存储
6.1大数据存储概述
6.1.1大数据存储的概念
6.1.2大数据存储的类型
6.1.3大数据存储的关键技术
6.2大数据存储方式
6.2.1分布式存储
6.2.2NoSQL数据库
6.2.3NewSQL数据库
6.2.4云数据库
6.3NoSQL数据库产品介绍
6.3.1Redis
6.3.2HBase
6.3.3MongoDB
6.3.4LevelDB
6.3.5Neo4j
6.4本章小结
6.5实训
习题6
第7章大数据分析与挖掘
7.1大数据分析概述
7.1.1大数据分析的概念
7.1.2大数据分析的类型
7.1.3大数据分析的方法
7.2大数据挖掘
7.2.1大数据挖掘概述
7.2.2大数据挖掘应用
7.3数据挖掘算法
7.3.1KMeans算法
7.3.2朴素贝叶斯算法
7.3.3Apriori算法
7.3.4决策树算法
7.3.5KNN算法
7.3.6支持向量机
7.3.7遗传算法
7.3.8神经网络算法
7.4本章小结
7.5实训
习题 7
第8章大数据可视化
8.1大数据可视化概述
8.1.1大数据可视化的概念
8.1.2大数据可视化的流程
8.1.3大数据可视化图表介绍
8.2大数据可视化方法
8.2.1文本可视化
8.2.2网络可视化
8.2.3空间信息可视化
8.3大数据可视化常用工具
8.3.1Excel
8.3.2ECharts
8.3.3Tableau
8.4大数据可视化技术的应用
8.4.1大数据可视化的应用场景
8.4.2大数据可视化技术的行业应用
8.5本章小结
8.6实训
习题8
第9章大数据安全
9.1数据安全与大数据安全
9.1.1数据安全概述
9.1.2大数据安全
9.2大数据安全的挑战与关键技术
9.2.1大数据安全面临的主要威胁
9.2.2大数据安全的关键技术
9.3大数据安全体系
9.3.1大数据安全体系概述
9.3.2大数据安全体系实施
9.4大数据安全法律
9.4.1大数据安全法律介绍
9.4.2大数据安全法律应用
9.5本章小结
9.6实训
习题9
第10章大数据的行业应用
10.1工业大数据
10.1.1工业大数据概述
10.1.2工业大数据的特点和分类
10.1.3工业大数据的内涵
10.1.4工业大数据与行业的联系
10.1.5工业大数据的应用
10.1.6我国工业大数据存在的问题
10.2交通大数据
10.2.1交通大数据概述
10.2.2大数据在智慧交通中的应用
10.2.3交通大数据存在的问题
10.3教育大数据
10.3.1教育大数据概述
10.3.2教育大数据的实现
10.3.3数字化校园
10.3.4教育大数据的应用实例
10.4本章小结
10.5实训
习题10
参考文献
|
內容試閱:
|
大数据是现代社会高科技发展的产物,相对于传统的数据分析,大数据是海量数据的集合,它以采集、整理、存储、清洗、挖掘、分析、应用、可视化为核心,广泛地应用在社会的各个行业中。特别是在数字经济时代,数据已成为重要的生产力,对价值创造和生产力发展有广泛影响,推动人类社会迈向一个网络化连接、数据化描绘、融合化发展的数字经济新时代。
当前,发展大数据已经成为国家战略,大数据在引领经济社会发展中的新引擎作用更加明显。在大数据专业的人才培养上,高校培养的大数据人才首先应具备获取大数据的能力。例如,能根据任务要求,综合利用各种计算机技术和知识,收集、整理海量数据并加以存储,为支撑相关决策和行为做好数据准备。其次,应具备分析大数据的能力,能根据具体需求,采用有效方法和模型分析数据,并形成报告,为实际问题提供决策依据。最后,还应具备良好的团队合作精神。
本书共10章,包括大数据介绍、云计算基础、大数据架构、数据采集、数据清洗、大数据存储、大数据分析与挖掘、大数据可视化、大数据安全和大数据的行业应用。
本书特色
(1) 采用“理实一体化”教学方式,课堂上既有教师的讲述,又有学生独立思考、上机操作的内容。
(2) 紧跟时代潮流,注重技术变化,书中包含了最新的大数据技术知识和一些开源库的使用。建议读者在阅读本书时使用Python 3.7及以上版本,并提前安装好所需要的扩展库(如requests、Scrapy、numpy、pandas、matplotlib等)。此外,读者还需安装MySQL和Kettle等相关软件。
(3) 本书编者都具有多年的教学经验,书中重难点突出,能够激发学生的学习热情。
(4) 为便于教学,本书提供丰富的配套资源,包括教学大纲、教学课件、电子教案、习题答案、在线作业和微课视频。
资源下载提示
课件等资源: 扫描封底的“课件下载”二维码,在公众号“书圈”下载。
素材(源码)等资源: 扫描目录上方的二维码下载。
在线作业: 扫描封底的作业系统二维码,登录网站在线做题及查看答案。
视频等资源: 扫描封底的文泉云盘防盗码,再扫描书中相应章节中的二维码,可以在线学习。
教学建议
本书建议学时为60学时,具体分布如下。
章节建 议 学 时
大数据介绍4
云计算基础4
大数据架构8
数据采集6
数据清洗8
大数据存储6
大数据分析与挖掘8
大数据可视化6
大数据安全4
大数据的行业应用6
本书由黄源担任主编,李兵川、何浩、邓宇沁和杨瑞峰担任副主编。其中,黄源编写第1章、第5~10章; 李兵川编写第2章; 何浩和邓宇沁共同编写第3章; 杨瑞峰和黄源共同编写第4章。全书由黄源负责统稿工作。
在本书的编写过程中,中国电信金融行业信息化应用重庆基地总经理助理杨琛给予了大力支持,清华大学出版社的编辑做了大量工作,在此一并表示感谢。
由于编者水平有限,书中难免存在疏漏之处,衷心希望广大读者批评、指正。
编者
2022年6月于重庆
|
|