新書推薦:
《
这才是真正的诸葛亮
》
售價:NT$
347.0
《
嫉妒
》
售價:NT$
250.0
《
文明的碎片(西蒙·沙玛重磅新作!)
》
售價:NT$
500.0
《
别读博,会脱单
》
售價:NT$
265.0
《
甲骨文丛书·德意志与神圣罗马帝国(第1卷):从马克西米利安一世到《威斯特伐利亚和约》(1493~1648年)(全2册)
》
售價:NT$
1109.0
《
强绩效模式:从0到1的绩效架构设计
》
售價:NT$
403.0
《
引爆流量:轻松打造爆款短视频
》
售價:NT$
352.0
《
数学史概论
》
售價:NT$
500.0
|
內容簡介: |
本书系统介绍大数据技术的原理与应用,主要内容包括基本概念、分布式计算编程基础、Hadoop系统、分布式文件系统HDFS、分布式数据库HBase、分布式计算框架MapReduce、数据仓库Hive、流计算Spark Streaming、数据可视化、大数据的电商精准营销案例、好友推荐案例等章节,涵盖了海量数据的高效存储、非结构化数据存储和随机访问、分布式并行编程、数据仓库、实时计算、数据可视化、电商精准营销、好友推荐等各个方面的内容。本书以简单易懂的语言、生动有趣的实例和图形展示知识点,将概念、原理与应用融会贯通,并对大数据工具软件进行了细致的梳理。
|
關於作者: |
高永平,男,汉族,江西峡江,中共党员;硕士生导师、副教授;多年来一直从事计算机科学与技术专业的教学与科研工作。主要研究方向:数据库技术与应用、软件工程与知识工程。主讲了本课程和研究生的主要课程为:《java程序设计(双语)》、《数据结构与算法》、《Web程序设计》、《面向对象程序设计》、《软件工程》、《高级软件工程》、《数据库原理与应用》等。在国内外期刊公开发表各类科研和教研论文23篇,其中被EI检索论文8篇,核心期刊发表论文4篇。主持或作为主要参与人的科研和教研项目18项,其中国家自然2项,省级科研项目9项,省级教研7项;另外还有横向课题5项。获得省高校科技成果二等奖1项,省教学成果奖二等奖和三等奖各1项;校教学成果奖5项。
|
目錄:
|
第1章 绪论1 1.1 大数据的发展历程1 1.2 大数据的概念4 1.3 大数据的特征5 1.4 大数据的应用6 1.5 大数据分析方法10 1.6 大数据面临的挑战11 习题12 第2章 分布式计算编程基础13 2.1 分布式系统13 2.2 分布式计算架构15 2.3 分布式文件系统16 2.4 CAP 定理18 习题21 第3章 大数据处理框架 Hadoop22 3.1 Hadoop简介22 3.2 Hadoop 生态系统24 3.3 Hadoop 的安装与使用31 习题40 第4章 Hadoop 分布式文件系统42 4.1 HDFS 简介42 4.2 HDFS的设计原则43 4.3 HDFS 的核心概念44 4.4 HDFS 的体系结构45 4.5 HDFS 的存储原理47 4.6 HDFS 的数据读写流程49 4.7 HDFS 的编程实现53 习题57 第5章 分布式数据库 HBase59 5.1 HBase 简介59 5.2 HBase 数据模型60 5.3 HBase 的系统架构64 5.4 HBase 表结构设计67 5.5 HBase 的数据读写流程69 5.6 HBase 编程实践72 习题76 第6章 分布式计算框架 MapReduce77 6.1 MapReduce 简介77 6.2 MapReduce 的计算模型77 6.3 MapReduce 的工作原理78 6.4 MapReduce 编程实践81 习题89 第7章 数据仓库 Hive91 7.1 Hive 简介91 7.2 Hive 的架构93 7.3 Hive 的数据类型及应用95 7.4 Hive 的数据模型97 7.5 DDL 的应用98 7.6 DML 的应用101 7.7 JDBC 访问103 习题104 第8章 Spark Streaming105 8.1 流计算概述105 8.2 流计算的概念106 8.3 Spark 概述107 8.4 Spark Standalone 模式的架构108 8.5 Spark Streaming简介110 8.6 编写 Spark Streaming 程序的基本步骤111 8.7 创建 StreamingContext 对象111 8.8 Spark Streaming 数据源112 8.9 Spark Streaming 程序示例113 习题116
第9章 数据可视化117 9.1 可视化概述117 9.2 可视化的作用118 9.3 可视化工具119 9.4 可视化典型案例125 习题126 第10章 基于大数据的电商精准营销128 10.1 数据预处理概述128 10.2 数据探索与可视化132 第11章 好友推荐案例分析140 11.1 任务需求140 11.2 准备工作140 11.3 创建 Maven 项目143 11.4 FriendRecommend 程序的实现148 11.5 运行程序与结果验证157 参考文献161
|
|