新書推薦:
《
明代女真史
》
售價:NT$
485.0
《
富足人生指南:用十年时间实现富而喜悦
》
售價:NT$
398.0
《
少女杂货铺 Procreate可爱质感插画教程
》
售價:NT$
356.0
《
边界感:人和人之间最舒服的距离
》
售價:NT$
250.0
《
数理人文(第1辑)
》
售價:NT$
500.0
《
俘虏危机:大英帝国崛起的背面(1600~1850)
》
售價:NT$
607.0
《
家庭心理健康指南:孩子一生幸福的基石
》
售價:NT$
305.0
《
舍勒的心灵(中国现象学文库·现象学原典译丛)
》
售價:NT$
367.0
|
內容簡介: |
準備好釋放潛藏在您資料中的力量了嗎?透過這本綜合技術大全,您將學會如何用ApacheHadoop來打造並維運一個可靠而具擴充性的分散式系統。無論是想瞭解如何分析各種大小資料集的程式設計師,或者想要設定與運行Hadoop叢集的系統管理員,都合適閱讀本書。
針對Hadoop2所做的這個改版,新增了YARN以及Hadoop相關專案的新章節,像是Parquet、Flume、Crunch及Spark。從這些新案例中,您可以了解Hadoop在健康照護系統以及基礎資料處理這些領域所扮演的角色。
.學習基礎元件如MapReduce、HDFS及YARN。
.更深入探索MapReduce,包含開發應用程式。
.設定及維護Hadoop叢集以使用HDFS及YARN上的Mapreduce。
.學習兩種資料格式:Avro的資料序列化和Parquet巢狀資料。
.使用資料攝取工具,如Flume(使用於串流資料)和Sqoop(使用於批量資料傳輸)。
.了解高階資料處理工具,如Pig、Hive、Crunch,以及Spark。
.學習HBase分散式資料庫以及運用ZooKeeper打造分散式服務。
|
關於作者: |
TomWhite
TomWhite自2007年起就是ApacheHadoop的提交者。他不僅是阿帕契軟體基金會的成員,同時也是Cloudera的工程師。他曾幫orielly.com、java.net與IBM的developerWorks撰寫技術文章,並在商業研討會上發表多場演講。
|
目錄:
|
第一部分 Hadoop基礎
chapter1|遇見Hadoop
chapter2|MapReduce
chapter3|Hadoop分散式檔案系統
chapter4|YARN
chapter5|Hadoop的IO
第二部分 MapReduce
chapter6|開發MapReduce程式
chapter7|MapReduce如何運作
chapter8|MapReduce的類型與格式
chapter9|MapReduce的特性
第三部分 Hadoop操作
chapter10|建立一個Hadoop叢集
chapter11|Hadoop的管理
第四部分 相關專案
chapter12|Avro
chapter13|Parquet
chapter14|Flume
chapter15|Sqoop
chapter16|Pig
chapter17|Hive
chapter18|Crunch
chapter19|Spark
chapter20|HBase
chapter21|ZooKeeper
第五部分 案例研究
chapter22|Cerner的可聚集資料
chapter23|生物資料科學:用軟體拯救生命
chapter24|Cascading
appendixA|安裝ApacheHadoop
appendixB|Cloudera的Hadoop發行套件
appendixC|準備NCDC氣象資料
appendixD|舊版及新版的JavaMapReduceAPI
index
|
|