发表于2024-11-22
數據科學概論/數據科學與大數據技術叢書 pdf epub mobi txt 電子書 下載 2024
理論篇//
1 數據科學概論
1.1 數據科學的定義
1.2 數據科學的定位
1.2.1 數據科學與數據庫、大數據分析的關係
1.2.2 數據科學與基於數據的決策的關係
1.3 數據科學傢
1.3.1 數據科學傢的技能
1.4 數據科學的基本原則(Principle)
1.4.1 原則1:數據分析可以劃分成一係列明確的階段
1.4.2 原則2:描述性分析與預測性分析
1.4.3 原則3:實體的相似度
1.4.4 原則4:模型的泛化能力
1.4.5 原則5:分析結果的評估與特定應用場景有關
1.4.6 原則6:相關性不同於因果關係
1.4.7 原則7:通過並行處理提高數據處理(分析)速度
1.5 數據處理流程:時間維度的縱嚮視角
1.6 數據處理係統的架構:係統維度的計算視角
1.6.1 數據處理係統的層次架構
1.6.2 數據處理係統的Lambda架構
1.7 數據的多樣性:數據類型維度的橫嚮視角
1.8 數據價值的挖掘:價值維度的價值提升視角
1.9 思考題
2 OLTP與數據服務
2.1 麵嚮OLTP應用的RDBMS數據庫技術
2.1.1 關係數據庫技術與SQL查詢語言
2.1.2 利用索引加快數據訪問
2.1.3 數據庫的事務處理、恢復技術與安全保證
2.1.4 並行數據庫與分布式數據庫
2.2 麵嚮數據服務的NoSQL數據庫技術
2.2.1 NoSQL數據庫技術
2.2.2 CAP理論
2.2.3 Key-Value數據庫
2.2.4 Column Family數據庫
2.2.5 Document數據庫
2.2.6 Graph數據庫
2.3 NewSQL數據庫技術
2.3.1 VoltDB數據庫
2.3.2 Google Spanner數據庫
2.4 思考題
3 OLAP與結構化數據分析
3.1 聯機分析處理(OLAP)與結構化數據分析
3.1.1 從操作型的業務數據庫嚮數據倉庫抽取、轉換和裝載數據
3.1.2 數據倉庫與星型模型
3.1.3 聯機分析處理OLAP
3.1.4 三種類型的OLAP係統
3.2 高性能OLAP係統的關鍵技術
3.2.1 列存儲技術
3.2.2 位圖索引技術
3.2.3 內存數據庫技術
3.2.4 MPP並行數據庫
3.3 結構化數據分析工具介紹
3.3.1 MPP(Shared-Nothing)數據庫、基於列存儲的關係數據庫
3.3.2 SQL on Hadoop係統
3.3.3 性能比較
3.4 思考題
......
數據科學概論/數據科學與大數據技術叢書 pdf epub mobi txt 電子書 下載