編輯推薦
適讀人群 :各層次數據庫開發人員 -使用Hadoop進行數據存儲和建模的著眼點和思路
-將數據輸入、輸齣係統的適用方案
-MapReduce、Spark和Hive等數據處理框架介紹
-數據去重、窗口分析等常見Hadoop處理模式應用
-在Hadoop上采用Giraph、GraphX等圖形處理工具
-綜閤使用工作流以及Apache Oozie等調度工具
-以Apache Oozie、Apache Spark Streaming和Apache Flume進行近實時流處理
-點擊流分析、欺詐檢驗和數據倉庫的架構案例
Hadoop之父Doug Cutting作序推薦。
“對Hadoop有所瞭解”與“能夠使用Hadoop形成實際解決方案”之間的一座橋梁!
內容簡介
本書就使用Apache Hadoop端到端數據管理方案提供專業架構指導。其他書籍大多針對Hadoop生態係統中的軟件,講解較為單一的使用方法,而本書偏重實踐,在架構的高度詳細闡釋諸多工具如何相互配閤,搭建齣打磨之後的完整應用。書中提供瞭諸多案例,易於理解,配有詳細的代碼解析,知識點一目瞭然。
為加強訓練,本書後半部分提供瞭詳細的案例,涵蓋常見的Hadoop應用架構。無論是設計Hadoop應用,還是將Hadoop同現有數據基礎架構集成,本書都可以提供詳實的參考。
作者簡介
Mark Grover,Apache Sentry項目管理委員會成員,《Hive編程指南》作者之一,曾參與Apache Hadoop、Apache Hive、Apache Sqoop以及Apache Flume等項目,並為Apache Bigtop項目和Apache Sentry(項目孵化中)項目貢獻代碼。
Ted Malaska,Cloudera公司的解決方案架構師,緻力於幫助客戶更好地掌握Hadoop及其生態係統。曾任美國金融業監管局(FINRA,Financial Industry Regulatory Authority)首席架構師,指導建設瞭包括網絡應用、服務型架構以及大數據應用在內的大量解決方案。曾為Apache Flume、Apache Avro、YARN以及Apache Pig等項目貢獻代碼。
Jonathan Seidman,Cloudera公司的解決方案架構師,協助閤作夥伴將的解決方案集成到Cloudera的軟件棧中。芝加哥Hadoop用戶組(Chicago Hadoop User Group)及芝加哥大數據(Chicago Big Data)的聯閤創始人、《Hadoop實戰》技術編輯。曾任Orbiz Worldwide公司大數據團隊技術主管,為繁忙的站點管理瞭承載海量數據的Hadoop集群。也曾多次在Hadoop及大數據專業會議上發言。
Gwen Shapira,Cloudera公司的解決方案架構師,知名博主,擁有15年從業經驗,協助客戶設計高擴展性的數據架構。曾任Pythian高級顧問、Oracle ACE主管以及NoCOUG董事會成員,活躍於諸多業內會議。
目錄
Hadoop應用架構(郭文超)
進入審閱模式
序
前言
第一部分 考慮Hadoop應用的架構設計
第一章 Hadoop數據建模
第二章 Hadoop數據移動
第三章 Hadoop數據處理
第四章 常見Hadoop處理範式
第五章 Hadoop圖處理
第六章 協調調度
第七章 Hadoop近實時處理
第二部分 案例研究
第八章 點擊流分析
第九章 欺詐檢測
第十章 數據倉庫
附錄 A Impala中的關聯
索引
作者簡介
Hadoop應用架構 下載 mobi epub pdf txt 電子書