发表于2024-11-25
雲計算與分布式係統:從並行處理到物聯網 pdf epub mobi txt 電子書 下載 2024
隨著信息技術的廣泛應用和快速發展,雲計算作為一種新興的商業計算模型日益受到人們的廣泛關注。《雲計算與分布式係統:從並行處理到物聯網》是一本完整講述雲計算與分布式係統基本理論及其應用的教材。書中從現代分布式模型概述開始,介紹瞭並行、分布式與雲計算係統的設計原理、係統體係結構和創新應用,並通過開源應用和商業應用例子,闡述瞭如何為科研、電子商務、社會網絡和超級計算等創建高性能、可擴展、可靠的係統。
《雲計算與分布式係統:從並行處理到物聯網》內容豐富,敘述深入淺齣,適閤作為計算機及相關專業雲計算、分布式係統或分布式計算課程的教材,同時也適閤專業技術人員參考使用。
Kai Hwang(黃鎧),擁有加州大學伯剋利分校博士學位。現為美國南加州大學電子工程與計算機科學終身教授,並先後擔任清華大學計算機與網絡係統方麵EMC講座教授、分布式與雲計算IV講習教授組的首席講座教授。他曾獲中國計算機學會頒發的第1屆(2004年)海外傑齣學者奬,並於2012年獲得國際(IEEE)雲計算大會(CloudCom)的終身成就奬。
Geoffrey C. Fox,美國印第安納大學計算機科學、信息與物理學院的傑齣教授和院長。他畢業於英國劍橋大學,在並行與分布式計算方麵著作豐碩。他曾任職加州理工學院、Syracuse等校,指導畢業瞭60餘位博士生。他目前也是清華大學的IV講座訪問教授。
Jack J. Dongarra,美國田納西大學電子工程與計算機科學傑齣教授,美國橡樹嶺國傢實驗室首席研究員。他是世界知名的超級計算機與並行計算專傢,也是美國工程院院士,清華大學的IV講座訪問教授。
齣版者的話
中文版序
序
前言
第一部分 係統建模、集群化和虛擬化
第1章 分布式係統模型和關鍵技術
1.1 互聯網之上的可擴展計算
1.1.1 互聯網計算的時代
1.1.2 可擴展性計算趨勢和新的範式
1.1.3 物聯網和CPS
1.2 基於網絡的係統技術
1.2.1 多核CPU和多綫程技術
1.2.2 大規模和超大規模GPU計算
1.2.3 內存、外部存儲和廣域網
1.2.4 虛擬機和虛擬化中間件
1.2.5 雲計算的數據中心虛擬化
1.3 分布式和雲計算係統模型
1.3.1 協同計算機集群
1.3.2 網格計算的基礎設施
1.3.3 對等網絡傢族
1.3.4 互聯網上的雲計算
1.4 分布式係統和雲計算軟件環境
1.4.1 麵嚮服務的體係結構(SOA)
1.4.2 分布式操作係統趨勢
1.4.3 並行和分布式編程模型
1.5 性能、安全和節能
1.5.1 性能度量和可擴展性分析
1.5.2 容錯和係統可用性
1.5.3 網絡威脅與數據完整性
1.5.4 分布式計算中的節能
1.6 參考文獻和習題
第2章 可擴展並行計算集群
2.1 大規模並行集群
2.1.1 集群發展趨勢
2.1.2 計算機集群的設計宗旨
2.1.3 基礎集群設計問題
2.1.4 Top500超級計算機分析
2.2 計算機集群和MPP體係結構
2.2.1 集群組織和資源共享
2.2.2 節點結構和MPP封裝
2.2.3 集群係統互連
2.2.4 硬件、軟件和中間件支持
2.2.5 大規模並行GPU集群
2.3 計算機集群的設計原則
2.3.1 單係統鏡像特徵
2.3.2 冗餘高可用性
2.3.3 容錯集群配置
2.3.4 檢查點和恢復技術
2.4 集群作業和資源管理
2.4.1 集群作業調度方法
2.4.2 集群作業管理係統
2.4.3 集群計算的負載共享設備(LSF)
2.4.4 MOSIX: Linux集群和雲的操作係統
2.5 頂尖超級計算機係統的個案研究
2.5.1 Tianhe��1A:2010年的世界最快超級計算機
2.5.2 Gray XT5 Jaguar:2009年的領先超級計算機
2.5.3 IBM Roadrunner:2008年的領先超級計算機
2.6 參考文獻和習題
第3章 虛擬機和集群與數據中心虛擬化
3.1 虛擬化的實現層次
3.1.1 虛擬化實現的層次
3.1.2 VMM的設計需求和提供商
3.1.3 操作係統級的虛擬化支持
3.1.4 虛擬化的中間件支持
3.2 虛擬化的結構/工具與機製
3.2.1 hypervisor與Xen體係結構
3.2.2 全虛擬化的二進製翻譯
3.2.3 編譯器支持的半虛擬化技術
3.3 CPU、內存和I/O設備的虛擬化
3.3.1 虛擬化的硬件支持
3.3.2 CPU虛擬化
3.3.3 內存虛擬化
3.3.4 I/O虛擬化
3.3.5 多核處理器的虛擬化
3.4 虛擬集群和資源管理
3.4.1 物理集群與虛擬集群
3.4.2 在綫遷移虛擬機的步驟與性能影響
3.4.3 內存、文件與網絡資源的遷移
3.4.4 虛擬集群的動態部署
3.5 數據中心的自動化與虛擬化
3.5.1 數據中心服務器閤並
3.5.2 虛擬存儲管理
3.5.3 虛擬化數據中心的雲操作係統
3.5.4 虛擬化數據中心的可信管理
3.6 參考文獻與習題
第二部分 雲平颱、麵嚮服務的體係結構和雲編程
第4章 構建在虛擬化數據中心上的雲平颱體係結構
4.1 雲計算和服務模型
4.1.1 公有雲、私有雲和混閤雲
4.1.2 雲生態係統和關鍵技術
4.1.3 基礎設施即服務(IaaS)
4.1.4 平颱即服務 (PaaS) 和軟件即服務(SaaS)
4.2 數據中心設計與互連網絡
4.2.1 倉庫規模的數據中心設計
4.2.2 數據中心互連網絡
4.2.3 運送集裝器的模塊化數據中心
4.2.4 模塊化數據中心的互連
4.2.5 數據中心管理問題
4.3 計算與存儲雲的體係結構設計
4.3.1 通用的雲體係結構設計
4.3.2 層次化的雲體係結構開發
4.3.3 虛擬化支持和災難恢復
4.3.4 體係結構設計挑戰
4.4 公有雲平颱:GAE、AWS和Azure
4.4.1 公有雲及其服務選項
4.4.2 榖歌應用引擎(GAE)
4.4.3 亞馬遜的Web服務(AWS)
4.4.4 微軟的Windows Azure
4.5 雲間的資源管理
4.5.1 擴展的雲計算服務
4.5.2 資源配置和平颱部署
4.5.3 虛擬機創建和管理
4.5.4 雲資源的全球交易
4.6 雲安全與信任管理
4.6.1 雲安全的防禦策略
4.6.2 分布式入侵/異常檢測
4.6.3 數據和軟件保護技術
4.6.4 數據中心的信譽指導保護
4.7 參考文獻與習題
第5章 麵嚮服務的分布式體係結構
5.1 服務和麵嚮服務的體係結構
5.1.1 REST和係統的係統
5.1.2 服務和Web服務
5.1.3 企業多層體係結構
5.1.4 網格服務和OGSA
5.1.5 其他的麵嚮服務的體係結構和係統
5.2 麵嚮消息的中間件
5.2.1 企業總綫
5.2.2 發布-訂閱模型和通知
5.2.3 隊列和消息傳遞係統
5.2.4 雲或網格中間件應用
5.3 門戶和科學網關
5.3.1 科學網關樣例
5.3.2 科學協作的HUBzero平颱
5.3.3 開放網關計算環境(OGCE)
5.4 發現、注冊錶、元數據和數據庫
5.4.1 UDDI和服務注冊錶
5.4.2 數據庫和訂閱-發布
5.4.3 元數據目錄
5.4.4 語義Web和網格
5.4.5 作業執行環境和監控
5.5 麵嚮服務的體係結構中的工作流
5.5.1 工作流的基本概念
5.5.2 工作流標準
5.5.3 工作流體係結構和規範
5.5.4 工作流運行引擎
5.5.5 腳本工作流係統Swift
5.6 參考文獻與習題
第6章 雲編程和軟件環境
6.1 雲和網格平颱的特性
6.1.1 雲的功能和平颱的特性
6.1.2 網格和雲的公共傳統特性
6.1.3 數據特性和數據庫
6.1.4 編程和運行時支持
6.2 並行和分布式編程範式
6.2.1 並行計算和編程範式
6.2.2 MapReduce、Twister和迭代MapReduce
6.2.3 來自Apache的Hadoop軟件庫
6.2.4 微軟的Dryad和DryadLINQ
6.2.5 Sawzall和Pig Latin高級語言
6.2.6 並行和分布式係統的映射應用
6.3 GAE的編程支持
6.3.1 GAE編程
6.3.2 榖歌文件係統(GFS)
6.3.3 BigTable——榖歌的NOSQL係統
6.3.4 Chubby——榖歌的分布式鎖服務
6.4 亞馬遜AWS與微軟Azure中的編程
6.4.1 亞馬遜EC2上的編程
6.4.2 亞馬遜簡單存儲服務(S3)
6.4.3 亞馬遜彈性數據塊存儲服務(EBS)和SimpleDB
6.4.4 微軟Azure編程支持
6.5 新興雲軟件環境
6.5.1 開源的Eucalyptus和Nimbus
6.5.2 OpenNebula、Sector/Sphere和Open Stack
6.5.3 Manjrasoft Aneka雲和工具機
6.6 參考文獻與習題
第三部分 網格、P2P和未來互聯網
第7章 網格計算係統和資源管理
7.1 網格體係結構和服務建模
7.1.1 網格曆史與服務類彆
7.1.2 CPU清除和虛擬超級計算機
7.1.3 開放網格服務體係結構(OGSA)
7.1.4 數據密集型網格服務模型
7.2 網格項目和網格係統創建
7.2.1 國傢網格和國際項目
7.2.2 美國的NSF TeraGrid
7.2.3 歐盟的DataGrid
7.2.4 ChinaGrid設計經驗
7.3 網格資源管理和資源中介
7.3.1 資源管理和作業調度
7.3.2 CGSP的網格資源監控
7.3.3 服務記賬和經濟模型
7.3.4 Gridbus的資源中介
7.4 網格計算的軟件與中間件
7.4.1 開源網格中間件包
7.4.2 Globus Tookit體係結構(GT4)
7.4.3 集裝器和資源/數據管理
7.4.4 ChinaGrid支持平颱(CGSP)
7.5 網格應用趨勢和安全措施
7.5.1 網格應用技術融閤
7.5.2 網格負載與性能預測
7.5.3 網格安全執行的信任模型
7.5.4 認證與授權方法
7.5.5 網格安全基礎設施(GSI)
7.6 參考文獻與習題
第8章 對等計算和覆蓋網絡
8.1 P2P計算係統
8.1.1 P2P計算係統的基本概念
8.1.2 P2P計算麵臨的基礎挑戰
8.1.3 P2P網絡係統分類
8.2 P2P覆蓋網絡及其性質
8.2.1 無結構P2P覆蓋網絡
8.2.2 分布式哈希錶(DHT)
8.2.3 結構化P2P覆蓋網絡
8.2.4 混閤式覆蓋網絡
8.3 路由、鄰近性和容錯
8.3.1 P2P覆蓋網絡的路由
8.3.2 P2P覆蓋網絡中的網絡鄰近性
8.3.3 容錯和失效恢復
8.3.4 抗擾動與失效
8.4 信任、信譽和安全管理
8.4.1 節點信任和信譽係統
8.4.2 信任覆蓋網絡和DHT實現
8.4.3 PowerTrust:可擴展的信譽係統
8.4.4 加強覆蓋網絡安全,抵禦DDoS攻擊
8.5 P2P文件共享和版權保護
8.5.1 快速搜索、副本和一緻性
8.5.2 P2P內容分發網絡
8.5.3 版權保護問題和解決方案
8.5.4 P2P網絡中的共謀盜版預防
8.6 參考文獻與習題
第9章 普適雲計算、物聯網與社會網絡
9.1 支持普適計算的雲趨勢
9.1.1 雲計算在HPC/HTC和普適計算中的應用
9.1.2 NASA和CERN的大規模私有雲
9.1.3 靈活和可擴展的雲混搭係統
9.1.4 移動雲計算平颱Cloudlet
9.2 分布式係統和雲的性能
9.2.1 科研雲綜述
9.2.2 數據密集型擴展計算(DISC)
9.2.3 HPC/HTC係統的性能指標
9.2.4 雲計算的服務質量
9.2.5 MPI、Azure、EC2、MapReduce、Hadoop的基準測試
9.3 物聯網關鍵技術
9.3.1 實現普適計算的物聯網
9.3.2 射頻標識(RFID)
9.3.3 傳感器網絡和ZigBee技術
9.3.4 全球定位係統(GPS)
9.4 物聯網創新應用
9.4.1 物聯網應用
9.4.2 零售和供應鏈管理
9.4.3 智能電網和智能建築
9.4.4 信息物理係統(CPS)
9.5 在綫社會網絡和專業網絡
9.5.1 在綫社會網絡特徵
9.5.2 基於圖論的社會網絡分析
9.5.3 社會網絡社區和應用
9.5.4 Facebook:世界上最大的社會網絡
9.5.5 Twitter:微博、新聞和提醒服務平颱
9.6 參考文獻與習題
索引
用戶可能會遇到一些延遲或者丟失在最後檢查點前未保存的部分數據。
故障切換集群故障切換可能是目前商業應用集群所需的最重要特徵。當一個組件失效時,該技術允許剩餘係統接管之前由失效組件提供的服務。故障切換機製必須提供一些功能,如失效診斷、失效通知和失效恢復。失效診斷是指失效以及導緻該失效的故障組件位置的檢測。一種常用的技術是使用心跳消息,集群節點發送心跳消息給對方。如果係統沒有接收到某個節點的心跳消息,那麼可以判定節點或者網絡連接失效瞭。
例2.8雙網絡集群的失效診斷和恢復
集群使用兩個網絡連接其節點。其中一個節點被指定為主節點(master node)。每個節點都有一個心跳維護進程,該進程通過兩個網絡周期性(每10秒)發送心跳消息至主節點。如果主節點沒有接收到某節點的心跳(10秒)消息,那麼將認為探測到失效並會作齣如下診斷:
節點到兩個網絡之一的連接失效,如果主節點從一個網絡接收到該節點的心跳消息,但從另一個卻沒有接收到。
節點發生故障,如果主節點從兩個網絡都沒有接收到心跳消息。這裏假設兩個網絡同時失效的幾率忽略不計。
示例中的失效診斷很簡單,但它有若乾缺陷。如果主節點失效,怎麼辦?10秒的心跳周期是太長。還是太短?如果心跳消息在網絡中丟失瞭(例如,由於網絡擁塞),怎麼辦?該機製能否適用於數百個節點?實際的高可用性係統必須解決這些問題。一種常用的技術是使用心跳消息攜帶負載信息,當主節點接收到某個節點的心跳消息時,它不僅瞭解該節點存活著,而且知道該節點的資源利用率等情況。這些負載信息對於負載均衡和作業管理是很有用的。
失效一旦被診斷,係統將通知需要知道該失效的組件。失效通知是必要的,因為不僅僅隻有主節點需要瞭解這類信息。例如,某個節點失效,DNS需要被通知,以至不會有更多的用戶連接到該節點。資源管理器需要重新分配負載,同時接管失效節點上的剩餘負載。係統管理員也需要被提醒,這樣他能夠進行適當的操作來修復失效節點。
恢復機製
失效恢復是指接管故障組件負載的必需動作。恢復技術有兩種類型:在嚮後恢復中,集群上運行的進程持續地存儲一緻性狀態(稱為檢查點)到穩定的存儲。失效之後,係統被重新配置以隔離故障組件、恢復之前的檢查點,以及恢復正常的操作。這稱為迴滾。
嚮後恢復與應用無關、便攜,相對容易實現,已被廣泛使用。然而,迴滾意味著浪費瞭之前執行結果。如果執行時間是至關重要的,如在實時係統中,那麼迴滾時間是無法容忍的,應該使用嚮前恢復機製。在這個機製下,係統並不迴滾至失效前的檢查點。相反,係統利用失效診斷信息重建一個有效的係統狀態,並繼續執行。嚮前恢復是應用相關的,並且可能需要額外的硬件。
例2.9 MTTF、MTTR和失效成本分析
考慮一個基本沒有可用性支持的集群。當一個節點失效,下麵一係列事件將會發生:
1.整個係統被關閉和斷電。
2.如果硬件失效,故障節點被替換。
3.該係統通電和重啓。
4.用戶應用程序被重新裝載,並從開始重新運行。
假設集群中的某個節點每100小時發生一次故障。集群的其餘部分不會發生故障。步驟1~3需要花費2小時。一般來說,步驟4的平均時間也是2小時。該集群的可用性是多少?如果每小時的停機損失為82 500美元,每年的失效損失是多少?
解 集群的MTTF是100小時,MTTR是2+2=4小時。根據錶2—5,可用性為100/104=96.15%。這相當於每年337小時的停機時間,失效損失為82 500美元×337,即超過2 700萬美元。
……
感覺內容太理想狀態瞭
評分看瞭第一章,不錯,挺基礎的一本書。
評分全新塑封,包裝的還行
評分書的質量很好。學習起來
評分瞭解相應內容還是很不錯的,值得購買!
評分很不錯的雲計算經典書籍
評分上次買來還沒看的,不過看瞭簡介,感覺不錯
評分價格沒啥優惠,書的內容還沒有看呢
評分價格沒啥優惠,書的內容還沒有看呢
雲計算與分布式係統:從並行處理到物聯網 pdf epub mobi txt 電子書 下載