发表于2024-11-27
Hadoop權威指南:大數據的存儲與分析(第4版)+HBase權威指南+Hive編程指南 pdf epub mobi txt 電子書 下載 2024
套裝三冊:
HBase權威指南
Hive編程指南
Hadoop權威指南:大數據的存儲與分析(第4版)修訂版
9787302465133 9787115333834 9787115318893
本書結閤理論和實踐,由淺入深,全方位介紹瞭Hadoop這一高性能的海量數據處理和分析平颱。全書5部分24章,第Ⅰ部分介紹Hadoop基礎知識,主題涉及Hadoop、MapReduce、Hadoop分布式文件係統、YARN、Hadoop的I/O操作。第Ⅱ部分介紹MapReduce,主題包括MapReduce應用開發;MapReduce的工作機製、MapReduce的類型與格式、MapReduce的特性。第Ⅲ部分介紹Hadoop的運維,主題涉及構建Hadoop集群、管理Hadoop。第Ⅳ部分介紹Hadoop相關開源項目,主題涉及Avro、Parquet、Flume、Sqoop、Pig、Hive、Crunch、Spark、HBase、ZooKeeper。第Ⅴ部分提供瞭三個案例,分彆來自醫療衛生信息技術服務商塞納(Cerner)、微軟的人工智能項目ADAM(一種大規模分布式深度學習框架)和開源項目Cascading(一個新的針對MapReduce的數據處理API)。
本書是一本專業、全麵的Hadoop參考書和工具書,闡述瞭Hadoop生態圈的新發展和應用,程序員可以從中探索海量數據集的存儲和分析,管理員可以從中瞭解Hadoop集群的安裝和運維。
第Ⅰ部分Hadoop基礎知識
第1章初識Hadoop3
1.1數據!數據!3
1.2數據的存儲與分析5
1.3查詢所有數據6
1.4不僅僅是批處理7
1.5相較於其他係統的優勢8
1.6ApacheHadoop發展簡史12
1.7本書包含的內容16
第2章關於MapReduce19
2.1氣象數據集19
2.2使用Unix工具來分析數據21
2.3使用Hadoop來分析數據22
2.4橫嚮擴展31
2.5HadoopStreaming37
第3章Hadoop分布式文件係統42
3.1HDFS的設計42
3.2HDFS的概念44
3.3命令行接口50
3.4Hadoop文件係統52
3.5Java接口56
3.6數據流68
3.7通過distcp並行復製76
第4章關於YARN78
4.1剖析YARN應用運行機製79
4.2YARN與MapReduce1相比82
4.3YARN中的調度85
Hadoop權威指南:大數據的存儲與分析(第4版)+HBase權威指南+Hive編程指南 下載 mobi epub pdf txt 電子書
Hadoop權威指南:大數據的存儲與分析(第4版)+HBase權威指南+Hive編程指南 pdf epub mobi txt 電子書 下載