新書推薦:
《
女人的胜利
》
售價:NT$
255.0
《
数据有道:数据分析+图论与网络+微课+Python编程(鸢尾花数学大系:从加减乘除到机器学习)
》
售價:NT$
1214.0
《
500万次倾听:陪伤心的人聊聊
》
售價:NT$
245.0
《
英国商业500年(见证大国崛起与企业兴衰,启迪未来商业智慧。)
》
售價:NT$
367.0
《
万千心理·儿童心理治疗中的心智化:临床实践指导
》
售價:NT$
398.0
《
自我囚禁的人:完美主义的心理成因与自我松绑(破除你对完美主义的迷思,尝试打破自我评价过低与焦虑的恶性循环)
》
售價:NT$
301.0
《
周易
》
售價:NT$
203.0
《
东南亚的传统与发展
》
售價:NT$
306.0
|
編輯推薦: |
-使用Hadoop进行数据存储和建模的着眼点和思路 -将数据输入、输出系统的适用方案 -MapReduce、Spark和Hive等数据处理框架介绍 -数据去重、窗口分析等常见Hadoop处理模式应用 -在Hadoop上采用Giraph、GraphX等图形处理工具 -综合使用工作流以及Apache Oozie等调度工具 -以Apache Oozie、Apache Spark Streaming和Apache Flume进行近实时流处理 -点击流分析、欺诈检验和数据仓库的架构案例 Hadoop之父Doug Cutting作序推荐。 “对Hadoop有所了解”与“能够使用Hadoop形成实际解决方案”之间的一座桥梁!
|
內容簡介: |
本书就使用Apache Hadoop端到端数据管理方案提供专业架构指导。其他书籍大多针对Hadoop生态系统中的软件,讲解较为单一的使用方法,而本书偏重实践,在架构的高度详细阐释诸多工具如何相互配合,搭建出打磨之后的完整应用。书中提供了诸多案例,易于理解,配有详细的代码解析,知识点一目了然。 为加强训练,本书后半部分提供了详细的案例,涵盖常见的Hadoop应用架构。无论是设计Hadoop应用,还是将Hadoop同现有数据基础架构集成,本书都可以提供详实的参考。
|
關於作者: |
Mark Grover Apache Sentry项目管理委员会成员,《Hive编程指南》作者之一,曾参与Apache Hadoop、Apache Hive、Apache Sqoop以及Apache Flume等项目,并为Apache Bigtop项目和Apache Sentry(项目孵化中)项目贡献代码。 Ted Malaska Cloudera公司的解决方案架构师,致力于帮助客户更好地掌握Hadoop及其生态系统。曾任美国金融业监管局(FINRA,Financial Industry Regulatory Authority)首席架构师,指导建设了包括网络应用、服务型架构以及大数据应用在内的大量解决方案。曾为Apache Flume、Apache Avro、YARN以及Apache Pig等项目贡献代码。 Jonathan Seidman Cloudera公司的解决方案架构师,协助合作伙伴将的解决方案集成到Cloudera的软件栈中。芝加哥Hadoop用户组(Chicago Hadoop User Group)及芝加哥大数据(Chicago Big Data)的联合创始人、《Hadoop实战》技术编辑。曾任Orbiz Worldwide公司大数据团队技术主管,为繁忙的站点管理了承载海量数据的Hadoop集群。也曾多次在Hadoop及大数据专业会议上发言。 Gwen Shapira Cloudera公司的解决方案架构师,知名博主,拥有15年从业经验,协助客户设计高扩展性的数据架构。曾任Pythian高级顾问、Oracle ACE主管以及NoCOUG董事会成员,活跃于诸多业内会议。
|
目錄:
|
Hadoop应用架构(郭文超)
进入审阅模式
序
前言
第一部分 考虑Hadoop应用的架构设计
第一章 Hadoop数据建模
第二章 Hadoop数据移动
第三章 Hadoop数据处理
第四章 常见Hadoop处理范式
第五章 Hadoop图处理
第六章 协调调度
第七章 Hadoop近实时处理
第二部分 案例研究
第八章 点击流分析
第九章 欺诈检测
第十章 数据仓库
附录 A Impala中的关联
索引
作者简介
|
|