新書推薦:
《
女人的胜利
》
售價:NT$
254.0
《
数据有道:数据分析+图论与网络+微课+Python编程(鸢尾花数学大系:从加减乘除到机器学习)
》
售價:NT$
1214.0
《
500万次倾听:陪伤心的人聊聊
》
售價:NT$
245.0
《
英国商业500年(见证大国崛起与企业兴衰,启迪未来商业智慧。)
》
售價:NT$
367.0
《
万千心理·儿童心理治疗中的心智化:临床实践指导
》
售價:NT$
398.0
《
自我囚禁的人:完美主义的心理成因与自我松绑(破除你对完美主义的迷思,尝试打破自我评价过低与焦虑的恶性循环)
》
售價:NT$
301.0
《
周易
》
售價:NT$
203.0
《
东南亚的传统与发展
》
售價:NT$
306.0
|
編輯推薦: |
(1)全书内容面广,章节由简入深,易于学习。(2)紧跟时代潮流,注重技术变化,书中包含了新的大数据知识及一些开源工具的介绍。(3)编写本书的教师都具有多年的教学经验,重难点突出,能够激发学生的学习热情。
|
內容簡介: |
本书系统介绍了大数据的基本原理与概念,共9章,分别讲解大数据的基本知识、大数据与新一代信息技术、数据采集、大数据存储、数据清洗、大数据分析与挖掘、数据可视化、大数据安全与治理以及大数据的应用。本书系统介绍了大数据的基础知识,并对一些大数据的应用实例进行讲解。本书可作为高等院校大数据专业、人工智能专业、软件技术专业、云计算专业、计算机网络专业的专业基础课教材,也可作为大数据爱好者的参考书。
|
關於作者: |
黄源,工学硕士,重庆航天职业技术学院大数据专业带头人,教授,研究方向为大数据分析与可视化。近年来负责多项市级教改科研课题,主编出版计算机类教材十余本。
|
目錄:
|
第1章 大数据的基本知识 11.1 大数据概述 11.1.1 大数据的特征 11.1.2 大数据的意义 31.2 大数据的数据类型 61.2.1 结构化数据 61.2.2 非结构化数据 61.2.3 结构化数据和非结构化数据的区别 71.3 大数据政策 71.3.1 国外的大数据政策 71.3.2 国内的大数据政策 91.4 小结 101.5 习题 10第2章 大数据与新一代信息技术 112.1 大数据与云计算 112.1.1 云计算概述 112.1.2 大数据与云计算的区别与联系 172.2 大数据与物联网 182.2.1 物联网概述 182.2.2 大数据与物联网的区别与联系 212.3 大数据与人工智能 212.3.1 人工智能概述 212.3.2 大数据与人工智能的区别与联系 252.4 大数据与区块链 262.4.1 区块链概述 262.4.2 大数据与区块链的区别与联系 272.5 小结 282.6 习题 29第3章 数据采集 303.1 数据采集概述 303.1.1 认识数据采集 303.1.2 数据采集的常见方式 313.2 数据采集平台 343.2.1 Flume 343.2.2 Kafka 353.2.3 Logstash 373.3 网络爬虫 373.3.1 认识网络爬虫 373.3.2 网络爬虫的分类及特点 403.3.3 网络爬虫的道德规范与法律风险 413.4 小结 423.5 习题 43第4章 大数据存储 444.1 大数据存储概述 444.1.1 大数据存储的概念 444.1.2 大数据存储的分类 454.2 Hadoop架构 484.2.1 认识Hadoop架构 484.2.2 Hadoop的起源与发展 494.2.3 Hadoop生态组件 514.3 NoSQL数据库 634.3.1 认识NoSQL数据库 634.3.2 NoSQL数据库的分类 634.4 数据仓库 694.4.1 认识数据仓库 704.4.2 数据仓库的特点 734.4.3 数据仓库的应用 734.5 小结 744.6 习题 74第5章 数据清洗 755.1 数据清洗概述 755.1.1 认识数据清洗 755.1.2 数据清洗的流程 775.1.3 数据质量 785.2 数据清洗的方法 825.2.1 处理缺失值 825.2.2 处理异常值 835.2.3 处理重复值 855.3 数据清洗的常用工具 855.3.1 Python 855.3.2 R 875.3.3 Kettle 885.3.4 DataCleaner 895.4 小结 915.5 习题 91第6章 大数据分析与挖掘 926.1 大数据分析概述 926.1.1 大数据分析的概念 926.1.2 大数据分析的常用方法 976.2 数据挖掘 1026.2.1 认识数据挖掘 1026.2.2 数据挖掘的应用 1046.3 数据挖掘的常见算法 1056.3.1 K-Means算法 1066.3.2 KNN算法 1076.3.3 朴素贝叶斯算法 1086.3.4 决策树算法 1106.3.5 支持向量机算法 1126.4 小结 1146.5 习题 114第7章 数据可视化 1157.1 数据可视化概述 1157.1.1 认识数据可视化 1157.1.2 数据可视化的类型 1227.2 数据可视化的方法 1237.2.1 文本可视化 1237.2.2 社交网络可视化 1257.2.3 地理空间可视化 1277.3 数据可视化的常见工具 1307.3.1 ECharts 1307.3.2 Excel 1337.3.3 D3 1357.3.4 Tableau 1377.4 小结 1397.5 习题 139第8章 大数据安全与治理 1408.1 大数据安全概述 1408.1.1 认识数据安全 1408.1.2 大数据面临的安全挑战 1438.1.3 大数据安全的关键技术 1458.2 数据治理 1518.2.1 认识数据治理 1518.2.2 数据治理的目标 1568.2.3 数据治理的实现 1578.3 小结 1698.4 习题 169第9章 大数据的应用 1709.1 农业大数据 1709.1.1 认识农业大数据 1709.1.2 农业大数据的关键技术 1739.1.3 农业大数据的应用 1779.2 工业大数据 1799.2.1 认识工业大数据 1799.2.2 工业大数据的关键技术 1819.2.3 工业大数据的应用 1859.3 金融大数据 1879.3.1 认识金融大数据 1879.3.2 金融大数据的关键技术 1899.3.3 金融大数据的应用 1939.4 交通大数据 1949.4.1 认识交通大数据 1949.4.2 交通大数据的关键因素 1979.4.3 交通大数据的应用 1999.5 小结 2009.6 习题 201参考文献 202
|
|