新書推薦:

《
亚历山大在世界尽头
》
售價:NT$
408

《
生命的法则(2026年版)
》
售價:NT$
561

《
守护我们终将衰退的大脑:阿尔茨海默病防治全书 (一线医生写给中国家庭的阿尔茨海默病防治指南)
》
售價:NT$
301

《
精准表达:一说就懂的四句沟通术
》
售價:NT$
305

《
愤怒的葡萄(陈宗琛译本;美国版《活着》,一部扎根生活的人间史诗)
》
售價:NT$
337

《
鲁迅与抗日战争--启蒙与救亡(鲁迅文化基金会丛书)
》
售價:NT$
398

《
2045:AI改变人类未来的十大趋势(揭示未来二十年超级震撼的科技变革全景图)
》
售價:NT$
347

《
新知文库精选·骆驼来自何处:外来入侵物种的故事与科学
》
售價:NT$
352
|
| 內容簡介: |
准备好释放数据的威力了吗?通过这本《Hadoop**指南影印版第4版修订版英文版》,你将会学习到如何通过ApacheHadoop建立和维护可靠的、可扩展的分布式系统。本书是期望分析任意大小的数据集的程序员以及想建立和运行Hadoop集群的管理员的理想选择。
在这本面向Hadoop2的新版书籍中,作者怀特增加了关于YARN和一些Hadoop相关项目,如Parquet、Flume、Crunch和Spark的新章节。你将会了解到Hadoop版本的*新变化,并且研究在医疗健康系统和基因数据处理中Hadoop的应用案例。
|
| 關於作者: |
|
怀特,TomWhite是Cloudera的工程师和Apache软件基金会的成员,从2007年起就是ApacheHadoop的代码提交者。他在oreilly.com、java.net和IBM的developerWorks写了大量文章,并且经常在产业大会上作关于Hadoop的演讲。
|
| 目錄:
|
Foreword
Preface
Part Ⅰ.HadoopFundamentals
1.Meet Hadoop
2.MapReduce
3.The Hadoop Distributed Filesystem
4.YARN
5.Hadoop IO
Part Ⅱ.MapReduce
6.Developing a MapReduce Application
7.How MapReduce Works
8.MapReduce Types and Formats
9.MapReduce Features
Part Ⅲ.HadoopOperations
10.Setting Up a Hadoop Cluster
11.Adminstering Hadoop
Part Ⅳ.Related Projects
12.Avro
13.Parquet
14.Flume
15.Sqoop
16.Pig
17.Hive
18.Crunch
19.Spark
20.HBase
21.ZooKeeper
Part Ⅴ.Case Studies
22.Composable Data at Cerner.
23.Biological Data Science: Saving Lives with Software
24.Cascading
A.Installing Apache Hadoop
B.Cloudera''s Distribution Including Apache Hadoop
C.Preparing the NCDC Weather Data
D.The Old and New Java MapReduce APIs
Index
|
|