发表于2024-11-24
包郵Spark SQL大數據實例開發教程+入門與實踐指南 數據存儲管理分析書籍 pdf epub mobi txt 電子書 下載 2024
YL13848 9787111591979 9787302496700
Spark SQL是Spark生態環境中核心和基礎的組件,是掌握Spark的關鍵所在。本書從企業級開發的角度齣發,結閤多個企業級應用案例,深入剖析Spark SQL。全書共分為8章,包括:認識Spark SQL、DataFrame原理與常用操作、Spark SQL操作多種數據源、Parquet列式存儲、Spark SQL內置函數與窗口函數、Spark SQL UDF與UDAF、Thrift Server、Spark SQL綜閤應用案例。
本書可以使讀者對Spark SQL有深入的理解,本書適閤於Spark學習愛好者,是學習Spark SQL的入門和提高教材,也是Spark開發工程師開發過程中查閱Spark SQL的案頭手冊。
前言
第1章認識Spark SQL
1.1Spark SQL概述
1.1.1Spark SQL與DataFrame
1.1.2DataFrame與RDD的差異
1.1.3Spark SQL的發展曆程
1.2從零起步掌握Hive
1.2.1Hive的本質是什麼
1.2.2Hive安裝和配置
1.2.3使用Hive分析搜索數據
1.3Spark SQL on Hive安裝與配置
1.3.1安裝Spark SQL
1.3.2安裝MySQL
1.3.3啓動Hive Metastore
1.4Spark SQL初試
1.4.1通過spark-shell來使用Spark SQL
1.4.2Spark SQL的命令終端
1.4.3Spark的Web UI
1.5本章小結
第2章DataFrame原理與常用操作
2.1DataFrame編程模型
2.2DataFrame基本操作實戰
2.2.1數據準備
包郵Spark SQL大數據實例開發教程+入門與實踐指南 數據存儲管理分析書籍 下載 mobi epub pdf txt 電子書
包郵Spark SQL大數據實例開發教程+入門與實踐指南 數據存儲管理分析書籍 pdf epub mobi txt 電子書 下載