包郵 數據即未來:大數據王者之道+大數據技術原理與應用 大數據技術書籍 數據科學

包郵 數據即未來:大數據王者之道+大數據技術原理與應用 大數據技術書籍 數據科學 pdf epub mobi txt 电子书 下载 2025

[美] 布瑞恩·戈德西,林子雨 著
圖書標籤:
  • 大數據
  • 數據科學
  • 數據分析
  • 大數據技術
  • 大數據應用
  • 機器學習
  • 人工智能
  • 商業智能
  • 數據挖掘
  • 包郵
想要找书就要到 求知書站
立刻按 ctrl+D收藏本页
你会得到大惊喜!!
店铺: 旷氏文豪图书专营店
出版社: 机械工业
ISBN:9787111589266
商品编码:26395081570
开本:16
出版时间:2017-02-01

具体描述

YL13743  9787111589266 9787115443304

數據即未來:大數據王者之道

本書詳細介紹瞭數據科學項目的三個階段。準備階段進行信息收集;構建階段將計劃付諸行動,利用準備階段獲得的信息以及相關統計和軟件提供的可用工具來構建産品;交付階段進行産品的交付、反饋及修改等。本書在介紹過程中會教你如何預見問題以及如何處理不確定性,一步步引導你完成軟件和科學思維的佳實踐。

本書贊譽
中文版序
中文版序二
譯者序
前言
緻謝
關於本書
關於原書封麵插圖
第一部分 準備和收集數據與知識
第1章 數據科學的邏輯 2
1.1 數據科學與本書 4
1.2 意識的可貴 7
1.3 研發人員與數據科學傢 9
1.4 需要成為軟件研發者嗎 12
1.5 需要明白統計學嗎 13
1.6 優先級:知識、技術、觀點 14
1.7 最佳實踐 17
1.8 閱讀本書:我怎麼討論概念 23
小結 24
第2章 通過好的提問設置目標 26
2.1聆聽客戶 27
2.2提齣關於數據的好問題 37
2.3用數據迴答問題 42
2.4設定目標 48
2.5計劃要有彈性 50
練習 51
小結 51
第3章 周圍的數據:虛擬的荒野 52
3.1數據作為研究對象 52
3.2數據可能存在的地方,以及如何與之交互 62
3.3數據偵察 80
3.4案例:microRNA與基因錶達 89
練習 94
小結 95
第4章 數據整理:從捕捉到馴化 96
4.1案例研究:最佳田徑錶演 97
4.2準備整理數據 101
4.3技巧與工具 109
4.4常見的陷阱 112
練習 119
小結 119
第5章 數據評估:動手檢查 120
5.1案例:安然的電子郵件數據 121
5.2描述性統計 123
5.3檢查數據的假設 130
5.4尋找特定的實體 134
5.5大概的統計分析 140
練習 147
小結 147
第二部分 構建軟件和統計産品
第6章 製訂計劃 150
6.1學到瞭什麼 152
6.2重新考慮期望和目標 158
6.3規劃 164
6.4溝通新目標 175
練習 176
小結 177
第7章 統計建模:概念與基礎 178
7.1如何看待統計 179
7.2統計學:與數據科學相關的領域 180
7.3數學 184
7.4統計模型與推理 194
7.5其他的統計方法 218
練習 227
小結 227
第8章 軟件:統計學在行動 229
8.1電子錶格和用戶圖形界麵應用 230
8.2編程 239
8.3選擇統計軟件工具 264
8.4把統計轉換成軟件 271
練習 277
小結 278
第9章 輔助軟件:更大、更快、更高效 279
9.1數據庫 280
9.2高性能計算 287
9.3雲服務 290
9.4大數據技術 293
9.5XX即服務 297
練習 298
小結 298
第10章 執行計劃:匯總 299
10.1執行計劃的訣竅 300
10.2修改計劃 308
10.3結果:知道什麼時候足夠好 310
10.4案例研究:基因活性測定協議 315
練習 328
小結 329
第三部分 整理産品結束項目
第11章 交付産品 332
11.1瞭解客戶 333
11.2交付形式 335
11.3內容 345
11.4案例:分析電子遊戲 351
練習 353
小結 353
第12章 交付後:問題與修改 354
12.1産品及其使用問題 354
12.2反饋 364
12.3産品修改 370
練習 377
小結 378
第13章 結束:項目善後 379
13.1項目善後 380
13.2從項目中學習 392
13.3展望未來 396
練習 398
小結 399
練習:案例與答案 400


大數據技術原理與應用(第2版)

(1) 概念篇:介紹當前緊密關聯的*新IT領域技術雲計算、大數據和物聯網。 
(2) 大數據存儲與管理篇:介紹分布式數據存儲的概念、原理和技術,包括HDFS、HBase、NoSQL數據庫、雲數據庫。 
(3) 大數據處理與分析篇:介紹MapReduce分布式編程框架、基於內存的分布式計算框架Spark、圖計算、流計算、數據可視化。 
(4) 大數據應用篇:介紹基於大數據技術的推薦係統。

第一篇 大數據基礎 

第1章 大數據概述 2 
1.1 大數據時代 2 
1.1.1 第三次信息化浪潮 2 
1.1.2 信息科技為大數據時代提供 
技術支撐 3 
1.1.3 數據産生方式的變革促成大數據時代的來臨 5 
1.1.4 大數據的發展曆程 6 
1.2 大數據的概念 7 
1.2.1 數據量大 7 
1.2.2 數據類型繁多 8 
1.2.3 處理速度快 9 
1.2.4 價值密度低 9 
1.3 大數據的影響 9 
1.3.1 大數據對科學研究的影響 10 
1.3.2 大數據對思維方式的影響 11 
1.3.3 大數據對社會發展的影響 11 
1.3.4 大數據對就業市場的影響 12 
1.3.5 大數據對人纔培養的影響 13 
1.4 大數據的應用 14 
1.5 大數據關鍵技術 14 
1.6 大數據計算模式 15 
1.6.1 批處理計算 16 
1.6.2 流計算 16 
1.6.3 圖計算 16 
1.6.4 查詢分析計算 17 
1.7 大數據産業 17 
1.8 大數據與雲計算、物聯網 18 
1.8.1 雲計算 18 
1.8.2 物聯網 21 
1.8.3 大數據與雲計算、物聯網的關係 25 
1.9 本章小結 26 
1.10 習題 26 
第2章 大數據處理架構Hadoop 28 
2.1 概述 28 
2.1.1 Hadoop簡介 28 
2.1.2 Hadoop的發展簡史 28 
2.1.3 Hadoop的特性 29 
2.1.4 Hadoop的應用現狀 29 
2.1.5 Hadoop的版本 30 
2.2 Hadoop生態係統 30 
2.2.1 HDFS 31 
2.2.2 HBase 31 
2.2.3 MapReduce 31 
2.2.4 Hive 32 
2.2.5 Pig 32 
2.2.6 Mahout 32 
2.2.7 Zookeeper 32 
2.2.8 Flume 32 
2.2.9 Sqoop 32 
2.2.10 Ambari 33 
2.3 Hadoop的安裝與使用 33 
2.3.1 創建Hadoop用戶 33 
2.3.2 Java的安裝 34 
2.3.3 SSH登錄權限設置 34 
2.3.4 安裝單機Hadoop 34 
2.3.5 Hadoop僞分布式安裝 35 
2.4 本章小結 37 
2.5 習題 38 
實驗1 安裝Hadoop 38 

第二篇 大數據存儲與管理 

第3章 分布式文件係統HDFS 42 
3.1 分布式文件係統 42 
3.1.1 計算機集群結構 42 
3.1.2 分布式文件係統的結構 43 
3.1.3 分布式文件係統的設計需求 44 
3.2 HDFS簡介 44 
3.3 HDFS的相關概念 45 
3.3.1 塊 45 
3.3.2 名稱節點和數據節點 46 
3.3.3 第二名稱節點 47 
3.4 HDFS體係結構 48 
3.4.1 概述 48 
3.4.2 HDFS命名空間管理 49 
3.4.3 通信協議 49 
3.4.4 客戶端 50 
3.4.5 HDFS體係結構的局限性 50 
3.5 HDFS的存儲原理 50 
3.5.1 數據的冗餘存儲 50 
3.5.2 數據存取策略 51 
3.5.3 數據錯誤與恢復 52 
3.6 HDFS的數據讀寫過程 53 
3.6.1 讀數據的過程 53 
3.6.2 寫數據的過程 54 
3.7 HDFS編程實踐 55 
3.7.1 HDFS常用命令 55 
3.7.2 HDFS的Web界麵 56 
3.7.3 HDFS常用Java API及應用實例 57 
3.8 本章小結 60 
3.9 習題 61 
實驗2 熟悉常用的HDFS操作 61 
第4章 分布式數據庫HBase 63 
4.1 概述 63 
4.1.1 從BigTable說起 63 
4.1.2 HBase簡介 63 
4.1.3 HBase與傳統關係數據庫的 
對比分析 64 
4.2 HBase訪問接口 65 
4.3 HBase數據模型 66 
4.3.1 數據模型概述 66 
4.3.2 數據模型的相關概念 66 
4.3.3 數據坐標 67 
4.3.4 概念視圖 68 
4.3.5 物理視圖 69 
4.3.6 麵嚮列的存儲 69 
4.4 HBase的實現原理 71 
4.4.1 HBase的功能組件 71 
4.4.2 錶和Region 71 
4.4.3 Region的定位 72 
4.5 HBase運行機製 74 
4.5.1 HBase係統架構 74 
4.5.2 Region服務器的工作原理 76 
4.5.3 Store的工作原理 77 
4.5.4 HLog的工作原理 77 
4.6 HBase編程實踐 78 
4.6.1 HBase常用的Shell命令 78 
4.6.2 HBase常用的Java API及 
應用實例 80 
4.7 本章小結 90 
4.8 習題 90 
實驗3 熟悉常用的HBase操作 91 
第5章 NoSQL數據庫 94 
5.1 NoSQL簡介 94 
5.2 NoSQL興起的原因 95 
5.2.1 關係數據庫無法滿足 ..........



用户评价

评分

评分

评分

评分

评分

评分

评分

评分

评分

相关图书

本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

© 2025 tushu.tinynews.org All Rights Reserved. 求知書站 版权所有