新書推薦:
《
《日本文学史序说》讲演录
》
售價:NT$
332.0
《
无尽的海洋:美国海事探险与大众文化(1815—1860)
》
售價:NT$
454.0
《
治盗之道:清代盗律的古今之辨
》
售價:NT$
556.0
《
甲骨文丛书·剑桥世界暴力史(第一卷):史前和古代世界(套装全2册)
》
售價:NT$
959.0
《
甲骨文丛书·中华早期帝国:秦汉史的重估
》
售價:NT$
1367.0
《
欲望与家庭小说
》
售價:NT$
449.0
《
惜华年(全两册)
》
售價:NT$
320.0
《
甲骨文丛书·古代中国的军事文化
》
售價:NT$
454.0
|
內容簡介: |
大数据作为继云计算、物联网之后 IT行业又一颠覆性的技术,备受人们关注。大数据无处不在,包括金融、汽车、零售、餐饮、电信、能源、政务、医疗、体育、娱乐等在内的各行各业,都融入了大数据的印迹,大数据对人类的社会生产和生活必将产生重大而深远的影响。本书为了让读者更好地了解大数据技术应用,从大数据的概念开始介绍大数据技术的应用过程,包括大数据概述、大数据技术平台、大数据预处理技术、大数据存储技术、大数据处理与分析和数据可视化。这些内容可以让读者系统地学习大数据技术涉及的关键技术及其基本概念和原理。本书可作为各类职业院校大数据技术及相关专业的教材,也可以作为计算机爱好者的自学参考用书。本书配有电子课件,读者可登录机械工业出版社教育服务网( www.cmpedu. com)以教师身份注册后免费下载或联系编辑( 010-88379807)咨询。本书还配有微课视频,读者可扫描二维码观看学习,方便教师进行混合教学。
|
目錄:
|
前 言二维码索引第1章 大数据概述 ............................................ 11.1 大数据的概念 .................................................................................. 31.2 大数据关键技术............................................................................. 221.3 大数据产业.................................................................................... 251.4 大数据与云计算、物联网之间的关系 .............................................. 301.5 大数据技术应用案例 ...................................................................... 40本章小结................................................................................................ 43本章习题................................................................................................ 43第2章 大数据技术平台 .................................... 452.1 大数据处理框架Hadoop................................................................ 472.2 阿里云大数据平台.......................................................................... 52本章小结................................................................................................ 62本章习题................................................................................................ 62第3章 大数据预处理技术..................................633.1 大数据获取手段............................................................................. 653.2 数据预处理技术............................................................................. 77本章小结................................................................................................ 84本章习题 ................................................................................................ 84第4章 大数据存储技术 .................................... 874.1 分布式文件系统............................................................................. 894.2 分布式数据库HBase ................................................................... 1034.3 NoSQL数据库 ............................................................................ 1194.4 云数据库 ..................................................................................... 130本章小结..............................................................................................144本章习题 ..............................................................................................144 5.1 MapReduce .............................................................................. 1495.2 Spark......................................................................................... 1615.3 机器学习入门 .............................................................................. 178本章小结.............................................................................................. 191本章习题 .............................................................................................. 1916.1 数据可视化概述........................................................................... 1956.2 利用Python进行数据可视化 ........................................................ 204本章小结.............................................................................................. 220本章习题 .............................................................................................. 220
|
內容試閱:
|
前 言PREFACE当今社会是一个高速发展的社会,科技发达,信息流通,人们之间的交流越来越密切,生活也越来越方便,大数据就是这个高科技时代的产物。大数据并不在“大”,而在于“有用”。价值含量、挖掘成本比数量更为重要。对于很多行业而言,如何利用这些大规模数据是赢得竞争的关键。大数据时代的到来,迫切需要学校及时建立大数据技术专业课程体系,为社会培养和输送一大批具备大数据专业素养的高级人才,满足社会对大数据人才日益旺盛的需求。本书定位为大数据技术的入门教材,为读者搭建起通向“大数据知识空间”的桥梁。本书系统梳理、总结大数据相关技术,介绍大数据技术的基本原理和大数据的主要应用,帮助读者形成对大数据知识体系及其应用领域的轮廓性认识,为读者在大数据领域“深耕细作”奠定基础、指明方向。在本书的基础上,感兴趣的读者可以通过其他诸如《Hadoop 权威指南》等工具书,继续深入学习和实践大数据相关技术。本书紧紧围绕“构建知识体系,阐明基本原理,引导初级实践,了解相关应用”的指导思想,对大数据知识体系进行系统梳理,做到“有序组织、去粗取精、由浅入深、渐次展开”。本书共6 章。第1 章大数据概述,介绍大数据的基本概念和应用领域,阐述大数据、云计算和物联网的相互关系;第2 章大数据技术平台,介绍大数据处理架构Hadoop,由于Hadoop 已经成为应用广泛的大数据技术平台,因此,本书的大数据相关技术主要围绕Hadoop 展开,包括Hadoop MapReduce、HDFS 和HBase。另外,还介绍了商用大数据处理与分析平台,例如,阿里云大数据平台,简单介绍它的原理和框架;第3 章大数据预处理技术,介绍了几种大数据获取手段,重点介绍了使用爬虫技术获取大数据;第4 章大数据存储技术,介绍了大数据存储相关技术的概念与原理,包括分布式文件系统(HDFS)、分布式数据库(HBase)、NoSQL 数据库和云数据库;第5 章大数据处理与分析,介绍了大数据处理和分析的核心技术—— 分布式并行编程模型MapReduce 和Spark 编程;第6 章数据可视化,简单介绍了大数据可视化技术。本书面向职业院校大数据技术等相关专业的学生,可以作为专业必修课或选修课的教材。在教学过程中,建议安排48 学时,16 个教学周,每周3 学时。每章的具体学时分配如下:第1、2、6 章每章安排4 学时;第3、4、5 章每章安排12 学时。本书由朱二喜、华驰担任主编,余勇、贺宁、汪丽华和李垒担任副主编,参加编写的还有陈炯、丁琼、王晶晶和李春朋。其中,朱二喜负责第1 章的编—· IV ·—写和统稿工作;华驰负责第2 章的编写工作;余勇、贺宁负责第3 章的编写工作,汪丽华、李垒负责第4 章的编写工作;陈炯、丁琼负责第5 章的编写工作;王晶晶、李春朋负责第6 章的编写工作。另外,北京西普阳光教育科技股份有限公司在教材编写过程中给予了大量的技术支持和案例。在此,向他们表示衷心的感谢。由于编者水平有限,本书难免存在不足之处,望广大读者不吝赐教。编 者
|
|