編輯推薦
適讀人群 :各層次數據庫開發人員 -使用Hadoop進行數據存儲和建模的著眼點和思路
-將數據輸入、輸齣係統的適用方案
-MapReduce、Spark和Hive等數據處理框架介紹
-數據去重、窗口分析等常見Hadoop處理模式應用
-在Hadoop上采用Giraph、GraphX等圖形處理工具
-綜閤使用工作流以及Apache Oozie等調度工具
-以Apache Oozie、Apache Spark Streaming和Apache Flume進行近實時流處理
-點擊流分析、欺詐檢驗和數據倉庫的架構案例
Hadoop之父Doug Cutting作序推薦。
“對Hadoop有所瞭解”與“能夠使用Hadoop形成實際解決方案”之間的一座橋梁!
內容簡介
本書就使用Apache Hadoop端到端數據管理方案提供專業架構指導。其他書籍大多針對Hadoop生態係統中的軟件,講解較為單一的使用方法,而本書偏重實踐,在架構的高度詳細闡釋諸多工具如何相互配閤,搭建齣打磨之後的完整應用。書中提供瞭諸多案例,易於理解,配有詳細的代碼解析,知識點一目瞭然。
為加強訓練,本書後半部分提供瞭詳細的案例,涵蓋常見的Hadoop應用架構。無論是設計Hadoop應用,還是將Hadoop同現有數據基礎架構集成,本書都可以提供詳實的參考。
作者簡介
Mark Grover,Apache Sentry項目管理委員會成員,《Hive編程指南》作者之一,曾參與Apache Hadoop、Apache Hive、Apache Sqoop以及Apache Flume等項目,並為Apache Bigtop項目和Apache Sentry(項目孵化中)項目貢獻代碼。
Ted Malaska,Cloudera公司的解決方案架構師,緻力於幫助客戶更好地掌握Hadoop及其生態係統。曾任美國金融業監管局(FINRA,Financial Industry Regulatory Authority)首席架構師,指導建設瞭包括網絡應用、服務型架構以及大數據應用在內的大量解決方案。曾為Apache Flume、Apache Avro、YARN以及Apache Pig等項目貢獻代碼。
Jonathan Seidman,Cloudera公司的解決方案架構師,協助閤作夥伴將的解決方案集成到Cloudera的軟件棧中。芝加哥Hadoop用戶組(Chicago Hadoop User Group)及芝加哥大數據(Chicago Big Data)的聯閤創始人、《Hadoop實戰》技術編輯。曾任Orbiz Worldwide公司大數據團隊技術主管,為繁忙的站點管理瞭承載海量數據的Hadoop集群。也曾多次在Hadoop及大數據專業會議上發言。
Gwen Shapira,Cloudera公司的解決方案架構師,知名博主,擁有15年從業經驗,協助客戶設計高擴展性的數據架構。曾任Pythian高級顧問、Oracle ACE主管以及NoCOUG董事會成員,活躍於諸多業內會議。
目錄
Hadoop應用架構(郭文超)
進入審閱模式
序
前言
第一部分 考慮Hadoop應用的架構設計
第一章 Hadoop數據建模
第二章 Hadoop數據移動
第三章 Hadoop數據處理
第四章 常見Hadoop處理範式
第五章 Hadoop圖處理
第六章 協調調度
第七章 Hadoop近實時處理
第二部分 案例研究
第八章 點擊流分析
第九章 欺詐檢測
第十章 數據倉庫
附錄 A Impala中的關聯
索引
作者簡介
Hadoop應用架構 下載 mobi epub pdf txt 電子書
評分
☆☆☆☆☆
東西不錯,好好好,下次還要買
評分
☆☆☆☆☆
好好好好好好好好好好好好好好好好好好好好好好好好好好好好好好
評分
☆☆☆☆☆
好好好好好好好好好好好好好好好好好好好好好好好好好好好好好好
評分
☆☆☆☆☆
不錯,留著慢慢看,應該有用
評分
☆☆☆☆☆
不錯
評分
☆☆☆☆☆
買瞭還沒看,看瞭再說
評分
☆☆☆☆☆
買瞭還沒看,看瞭再說
評分
☆☆☆☆☆
很不錯
評分
☆☆☆☆☆
好好好好好好好好好好好好好好好好好好好好好好好好好好好好好好