Hadoop+Spark大數據巨量分析與機器學習整閤開發實戰 林大貴 計算機與互聯網 書 pdf epub mobi txt 電子書 下載 2025
作 者:林大貴 著 定 價:79 齣 版 社:清華大學齣版社 齣版日期:2017年01月01日 頁 數:425 裝 幀:平裝 ISBN:9787302453758 ●第1章大數據與機器學習1
●1.1大數據定義2
●1.2Hadoop簡介2
●1.3HadoopHDFS分布式文件係統3
●1.4HadoopMapReduce的介紹5
●1.5Spark的介紹6
●1.6機器學習的介紹8
●第2章VirtualBox虛擬機軟件的安裝11
●2.1VirtualBox的下載和安裝12
●2.2設置VirtualBox語言版本16
●2.3設置VirtualBox存儲文件夾17
●2.4在VirtualBox創建虛擬機18
●第3章UbuntuLinux操作係統的安裝23
●3.1下載安裝Ubuntu的光盤文件24
●3.2在Virtual設置Ubuntu虛擬光盤文件26
●3.3開始安裝Ubuntu28
●3.4啓動Ubuntu33
●3.5安裝增強功能34
●3.6設置默認輸入法38
●3.7設置“終端”程序40
●部分目錄
內容簡介
《Hadoop+Spark大數據巨量分析與機器學習整閤開發實戰》從淺顯易懂的“大數據和機器學習”原理介紹和說明入手,講述大數據和機器學習的基本概念,如:分類、分析、訓練、建模、預測、機器學習(推薦引擎)、機器學習(二元分類)、機器學習(多元分類)、機器學習(迴歸分析)和數據可視化應用。為降低讀者學習大數據技術的門檻,書中提供瞭豐富的上機實踐操作和範例程序詳解,展示瞭如何在單颱Windows係統上通過VirtualBox虛擬機安裝多颱Linux虛擬機,如何建立Hadoop集群,再建立Spark開發環境。書中介紹搭建的上機實踐平颱並不於單颱實體計算機。對於有條件的公司和學校,參照書中介紹的搭建過程,同樣可以將實踐平颱搭建在多颱實體計算機上,以便更加接近於大數據和機器學習真實的運行環境。
《Hadoop+Spark大數據巨量分析與機器學習整閤開發實戰》很好適閤於學習大數據基礎知識的初學者等 林大貴 著 林大貴,作者從事IT産業多年,包括係統設計、網站開發等諸多領域,具備豐富實戰開發經驗,多版多部具有影響力的作品。
Hadoop+Spark大數據巨量分析與機器學習整閤開發實戰 林大貴 計算機與互聯網 書 下載 mobi epub pdf txt 電子書