新書推薦:
《
养育女孩 : 官方升级版
》
售價:NT$
230.0
《
跨界:蒂利希思想研究
》
售價:NT$
500.0
《
千万别喝南瓜汤(遵守规则绘本)
》
售價:NT$
204.0
《
大模型启示录
》
售價:NT$
510.0
《
东法西渐:19世纪前西方对中国法的记述与评价
》
售價:NT$
918.0
《
养育男孩:官方升级版
》
售價:NT$
230.0
《
小原流花道技法教程
》
售價:NT$
500.0
《
少女映像室 唯美人像摄影从入门到实战
》
售價:NT$
505.0
|
編輯推薦: |
本书以基本概念和发展现状作为切入点,对多种大数据关键技术进行逻辑性阐述和分析,同时结合典型应用领域,论述了大数据技术在通信、互联网中扮演的重要角色,系统地向读者阐述了大数据的内涵。
|
內容簡介: |
本书从大数据的基本概念出发,深入解析了大数据应用的关键技术与应用。以大数据的数据挖掘技术、大数据的存储与处理、大数据应用的总体架构三方面为线索,详细阐述了大数据挖掘的诸多常用算法,介绍了Hadoop、HDFS及MapReduce等大数据存储与处理的关键技术与应用、大数据应用的框架与构架。本书以通信运营商及互联网电子商务等应用为背景,从典型实例的角度系统地介绍了大数据挖掘应用从目标构建、算法建模到程序实现,再到大数据分析及结果描述应用的整个过程,以期为读者提供从理论到实务的有效借鉴。
|
關於作者: |
2006年07月至就职于今重庆邮电大学 通信与信息工程学院,主要从事信息与通信工程相关领域的科研和教学工作,近年来,作为项目负责人或主研人员,参加多项国家自然科学基金和省部级重点科研项目10余项,获2012年度全军科技进步奖1项,发表论文20余篇,其中SCIEI检索10余篇次,申请国家发明专利8项,授权5项。
|
目錄:
|
目 录
第1章 大数据概述1
1.1 大数据的概念1
1.1.1 什么是大数据1
1.1.2 大数据的产生和来源2
1.1.3 大数据的技术3
1.1.4 大数据的特征8
1.1.5 数据、信息与知识10
1.2 大数据的价值与挑战10
1.2.1 大数据的潜在价值11
1.2.2 大数据对业务的挑战12
1.2.3 大数据对技术架构的挑战13
1.2.4 大数据对管理策略的挑战14
1.3 大数据与相关领域的关系16
1.3.1 大数据与统计分析16
1.3.2 大数据与数据挖掘16
1.3.3 大数据与云计算17
1.4 大数据发展状况20
参考文献23
第2章 大数据挖掘技术24
2.1 数据挖掘与过程24
2.1.1 数据挖掘的七大功能24
2.1.2 数据挖掘的实质25
2.2 数据挖掘过程26
2.2.1 定义挖掘目标27
2.2.2 数据取样28
2.2.3 数据探索30
2.2.4 数据预处理32
2.2.5 数据模式发现37
2.2.6 模型评价40
2.3 常用算法47
2.3.1 决策树48
2.3.2 回归50
2.3.3 关联规则54
2.3.4 聚类59
2.3.5 贝叶斯分类方法66
2.3.6 神经网络69
2.3.7 支持向量机(SVM)73
2.3.8 假设检验77
2.3.9 遗传算法81
参考文献84
第3章 大规模存储与处理技术86
3.1 Hadoop概述86
3.1.1 什么是Hadoop86
3.1.2 Hadoop发展简史88
3.1.3 Hadoop的优势90
3.1.4 Hadoop的子项目90
3.2 HDFS92
3.2.1 HDFS的设计目标93
3.2.2 HDFS文件系统的原型GFS93
3.2.3 HDFS文件的基本结构95
3.2.4 HDFS的文件读写操作97
3.2.5 HDFS的存储过程101
3.3 MapReduce编程框架105
3.3.1 MapReduce的发展历史105
3.3.2 MapReduce的基本工作过程107
3.3.3 MapReduce的特点110
3.4 建立Hadoop开发环境111
3.4.1 相关准备工作111
3.4.2 JDK的安装配置113
3.4.3 SSH无钥登录113
3.4.4 安装、配置Hadoop环境变量115
3.5 大数据处理系统分类118
3.5.1 批量数据处理系统118
3.5.2 流式数据处理系统119
3.5.3 交互式数据处理122
3.5.4 图数据处理系统124
3.6 大数据查询和分析技术:SQL on Hadoop126
3.6.1 数据库简介126
3.6.2 图数据库128
3.6.3 Hive:基本的Hadoop分析130
3.6.4 实时互动的SQL:Impala和Drill134
3.7 以通信业务分析为例的大数据的技术环境部署136
3.7.1 应用架构规划与设计136
3.7.2 技术环境部署与配置137
第4章 大数据应用的总体架构和关键技术148
4.1 大数据的业务分析148
4.2 大数据的总架体构模型152
4.3 大数据高级分析161
4.3.1 数据仓库与联机分析处理技术162
4.3.2 大数据分析与传统分析167
4.3.3 非结构化复杂数据分析168
4.3.4 实时预测分析177
4.4 可视化分析181
4.4.1 可视化技术181
4.4.2 可视化工具192
参考文献195
第5章 运营商数据分析196
5.1 案例背景196
5.1.1 大数据运营已为大势所趋196
5.1.2 采取大数据运营的原因196
5.1.3 大数据分析如何提升电信行业绩效197
5.1.4 大数据的社会价值199
5.2 挖掘目标的提出200
5.3 案例分析201
5.3.1 体系架构201
5.3.2 Hadoop集群抽取模块202
5.3.3 数据处理模块208
5.3.4 数据分发211
5.4 MapReduce操作218
5.5 结果分析221
第6章 互联网电影推荐系统223
6.1 背景描述223
6.2 业务目标224
6.3 业务需求225
6.4 协同过滤推荐系统建模225
6.4.1 推荐系统概述225
6.4.2 基于对立用户的协同过滤模型227
6.5 项目处理过程229
6.5.1 项目数据229
6.5.2 数据预处理230
6.5.3 Hadoop并行算法242
6.6 总结250
|
|