書[0名0]: | 數據倉庫(原書[0第0]4版)|31598 |
圖書定價: | 39元 |
圖書作者: | (美)Willian H.Inmon |
齣版社: | 機械工業齣版社 |
齣版日期: | 2006/8/1 0:00:00 |
ISBN號: | 7111191943 |
開本: | 16開 |
頁數: | 311 |
版次: | 4-1 |
作者簡介 |
William H. Inmon是世界公認的“數據倉庫之父”,是數據倉庫及其相關技術網站www.billinmon.com的閤作夥伴,是“企業信息工廠”的創造者之一。他一直緻力於數據庫和數據倉庫技術方麵的研究,在數據管理和數據倉庫技術方麵以及數據處理的管理方麵撰寫瞭40多本著作,發錶過600多篇[0學0]術論文,並且經常應邀在技術和[0學0]術[0會0]議上演講。. 王誌海,博士,副教授,1963年10月齣生,1985年畢業於鄭州[0大0][0學0]計算機科[0學0]係,獲理[0學0][0學0]士[0學0]位,1987年畢業於哈爾濱船舶工程[0學0]院計算機與信息科[0學0]係,獲工[0學0]碩士[0學0]位,1998年畢業於閤肥工業[0大0][0學0]計算機與信息[0學0]院,獲博士[0學0]位。曾先後在澳[0大0]利亞Monash[0大0][0學0]和 Deakin[0大0][0學0]從事兩年多的博士後研究。2002年在Monash[0大0][0學0]計算機科[0學0]與軟件工程[0學0]院工作,並被聘為研究生導師.期間曾指導博士生2人,訪問[0學0]者1人,[0國0]際交流[0學0]生1人.主要參加瞭澳[0大0]利亞研究委員[0會0](ARC)資助項目:[0國0]傢醫療保障係統(Medicare)數據分析係統開發和貝葉斯機器[0學0]習與數據挖掘算[0法0]研究.現被聘為Monash[0大0][0學0]榮譽研究員。曾被多個[0國0]內和[0國0]際[0學0]術[0會0]議聘為程序委員[0會0]委員。2003年擔任[0國0]際軟件工程[0大0][0會0]數據挖掘在軟件工程中應用[0學0]術研討[0會0](DMSE'2003, USA)程序委員[0會0]委員,2004年擔任亞太數據庫[0知0]識發現與數據挖掘[0學0]術[0會0]議(PAKDD'2004, Australia)程序委員[0會0]委員。在[0國0]際[0學0]術刊物,[0國0]際[0學0]術[0會0]議和[0國0]內[0學0]術刊物上發錶論文約30篇。 ... |
內容簡介 |
本書係統講述數據倉庫的基本概念、基本原理以及建立數據倉庫的方[0法0]和過程。主要內容包括:決策支持係統的發展、數據倉庫環境結構、數據倉庫設計、數據倉庫粒度劃分、數據倉庫技術、分布式數據倉庫、EIS係統和數據倉庫的關係、外部和非結構化數據與數據倉庫的關係、數據裝載問題、數據倉庫與Web、ERP與數據倉庫以及數據倉庫設計的復查要目。. 本書是數據倉庫之父撰寫的關於數據倉庫的著作,既可作為相關專業的研究生教材,也是數據倉庫的研究、開發和管理人員的 bibei 指南。 數據倉庫為企業和組織提供瞭收集、存儲和分析海量業務數據的必要策略。隨著業務活動的日益增長,數據倉庫[0領0]域變得越來越重要。本書被譽為數據倉庫的“聖經”,從1990年[0第0]1版齣版起,不僅帶動瞭數據倉庫行業的發展,而且至今仍然是數據倉庫方麵的[0優0]秀入門讀物。[0第0]4版涵蓋瞭數據倉庫新技術,保持瞭在這一[0領0]域的先鋒地位。.. 縱觀數據倉庫係統的基本組成部分,讀者[0會0]體驗到數據倉庫設計方[0法0]的更新;各種數據倉庫的遷移策略以及應用在裝載、索引和數據管理方麵的技術。本書為讀者提供瞭數據倉庫[0領0]域的新進展。 本書新增的內容: 在數據倉庫中處理非結構化數據的方[0法0] 在各種不同的存儲介質上存儲數據的方[0法0] 關係型數據庫設計和多維數據庫設計的對比 在規劃數據倉庫項目時如何度量投資迴報 探索更高級的研究主題,包括數據的監控與測試... |
目錄 |
齣版者的話 專傢指導委員[0會0] 譯者序 [0第0]2版前言 [0第0]3版前言 [0第0]4版前言 [0第0]1章 決策支持係統的發展 1 1.1 演化 1 1.1.1 直接存取存儲設備的齣現 2 1.1.2 個人計算機/[0第0]四代編程語言技術 3 1.1.3 進入抽取程序 3 1.1.4 蜘蛛網 4 1.2 自然演化式體係結構的問題 4 1.2.1 數據缺乏可信性 5 1.2.2 生産率問題 6 1.2.3 從數據到信息 8 1.2.4 方[0法0]的變遷 9 1.2.5 體係結構化環境 11 1.2.6 體係結構化環境中的數據集成 12 1.2.7 用戶是誰 13 1.3 開發生命周期 14 1.4 硬件利用模式 15 1.5 為重建工程創造條件 15 1.6 監控數據倉庫環境 17 1.7 小結 19 [0第0]2章 數據倉庫環境 20 2.1 數據倉庫的結構 23 2.2 麵嚮主題 23 2.3 [0第0]1天到[0第0]n天的現象 26 2.4 粒度 28 2.4.1 粒度帶來的好處 29 2.4.2 粒度的一個例子 29 2.4.3 [0[0雙0]0]重粒度 31 2.5 探查與數據挖掘 34 2.6 活樣本數據庫 34 2.7 分區設計方[0法0] 35 2.8 數據倉庫中的數據組織 38 2.9 審計與數據倉庫 41 2.10 數據的同構/異構 41 2.11 數據倉庫中的數據清理 42 2.12 報錶與體係結構化環境 43 2.13 各種環境中的操作型窗口 43 2.14 數據倉庫中的錯誤數據 45 2.15 小結 45 [0第0]3章 設計數據倉庫 47 3.1 從操作型數據開始 47 3.2 數據/過程模型與體係結構化環境 51 3.3 數據倉庫與數據模型 52 3.3.1 數據倉庫的數據模 ?54 3.3.2 中間層數據模型 54 3.3.3 物理數據模型 59 3.4 數據模型與迭代式開發 60 3.5 規範化/反嚮規範化 61 3.6 元數據 67 3.7 數據周期—時間間隔 69 3.8 轉換和集成的復雜性 70 3.9 數據倉庫記錄的觸發 73 3.9.1 事件 73 3.9.2 快照的構成 73 3.9.3 一些例子 74 3.10 概要記錄 74 3.11 管理[0大0]量數據 75 3.12 創建多個概要記錄 76 3.13 從數據倉庫環境到操作型環境 76 3.14 數據倉庫數據的直接操作型訪問 77 3.15 數據倉庫數據的間接訪問 77 3.15.1 航空公司的傭金計算係統 78 3.15.2 零售個性化係統 79 3.15.3 信用審核 80 3.16 數據倉庫數據的間接使用 81 3.17 星形連接 82 3.18 支持操作型數據存儲 86 3.19 需求和Zachman框架 87 3.20 小結 88 [0第0]4章 數據倉庫中的粒度 90 4.1 粗略估算 90 4.2 規劃過程的輸入 91 4.3 溢齣存儲器中的數據 92 4.4 確定粒度級彆 95 4.5 一些反饋循環技巧 96 4.6 確定粒度級彆的幾個例子 97 4.6.1 銀行環境中的粒度級彆 97 4.6.2 製造業環境中的粒度級彆 99 4.6.3 保險業環境中的粒度級彆 100 4.7 填充數據集市 102 4.8 小結 102 [0第0]5章 數據倉庫和技術 103 5.1 管理[0大0]量數據 103 5.2 管理多種介質 104 5.3 索引和監控數據 104 5.4 多種技術的接口 105 5.5 程序員/設計者對數據存放位置的控製 105 5.6 數據的並行存儲和管理 105 5.7 語言接口 107 5.8 數據的有效裝載 107 5.9 有效利用索引 108 5.10 數據壓縮 108 5.11 復閤主鍵 109 5.12 變長數據 109 5.13 加鎖管理 110 5.14 隻涉及索引的處理 110 5.15 快速恢復 110 5.16 其他的技術特徵 110 5.17 DBMS類型和數據倉庫 111 5.18 改變DBMS技術 112 5.19 多維DBMS和數據倉庫 112 5.20 在多種存儲介質上構建數據倉庫 117 5.21 數據倉庫環境中元數據的角色 117 5.22 上下文和內容 119 5.22.1 上下文信息的三種類型 119 5.22.2 捕獲和管理上下文信息 120 5.22.3 迴顧上下文信息管理曆[0史0] 121 5.23 刷新數據倉庫 121 5.24 測試問題 122 5.25 小結 123 [0第0]6章 分布式數據倉庫 124 6.1 分布式數據倉庫的類型 124 6.1.1 局部數據倉庫和全局數據倉庫 124 6.1.2 技術分布式數據倉庫 135 6.1.3 [0獨0]立開發的分布式數據倉庫 136 6.2 開發項目的本質特徵 136 6.3 分布式數據倉庫的開發 139 6.3.1 在分布的地理位置間協調開發 140 6.3.2 企業數據的分布式模型 141 6.3.3 分布式數據倉庫中的元數據 142 6.4 在多種層次上構建數據倉庫 142 6.5 多個小組建立[0當0]前細節級 144 6.5.1 不同層的不同需求 146 6.5.2 其他類型的細節數據 148 6.5.3 元數據 148 6.6 公共細節數據采用多種平颱 150 6.7 小結 150 [0第0]7章 主管信息係統和數據倉庫 152 7.1 EIS概述 152 7.2 一個簡單例子 152 7.3 嚮下鑽取分析 154 7.4 支持嚮下鑽取處理 156 7.5 作為EIS基礎的數據倉庫 156 7.6 到哪裏取數據 158 7.7 事件映射 159 7.8 細節數據和EIS 160 7.9 在EIS中隻保存匯總數據 161 7.10 小結 162 [0第0]8章 外部數據與數據倉庫 163 8.1 數據倉庫中的外部數據 164 8.2 元數據和外部數據 165 8.3 存儲外部數據 167 8.4 外部數據的不同部件 167 8.5 建模與外部數據 168 8.6 輔助報告 168 8.7 外部數據存檔 169 8.8 內部數據與外部數據的比較 169 8.9 小結 169 [0第0]9章 遷移到體係結構化環境 171 9.1 一種遷移方案 171 9.2 反饋循環 176 9.3 策略方麵的考慮 177 9.4 方[0法0]和遷移 179 9.5 數據驅動的開發方[0法0] 180 9.5.1 概念 181 9.5.2 係統開發生命周期 181 9.5.3 智者觀點 182 9.6 小結 182 [0第0]10章 數據倉庫和Web 183 10.1 支持電子[0商0]務環境 189 10.2 將數據從Web移動到數據倉庫 190 10.3 將數據從數據倉庫移動到Web 190 10.4 對Web的支持 190 10.5 小結 191 [0第0]11章 非結構化數據和數據倉庫 192 11.1 兩個[0領0]域的集成 193 11.1.1 文本—公共聯接 193 11.1.2 基本錯誤匹配 195 11.1.3 環境間文本匹配 195 11.1.4 概率匹配 195 11.1.5 匹配所有信息 196 11.2 主題匹配 197 11.2.1 産業特徵主題 197 11.2.2 自然事件主題 199 11.2.3 通過主題和主題詞關聯 200 11.2.4 通過抽象和元數據關聯 200 11.3 兩層數據倉庫 201 11.3.1 非結構化數據倉庫分類 202 11.3.2 非結構化數據倉庫中的文檔 203 11.3.3 非結構化數據可視化 203 11.4 自組織圖(SOM) 204 11.4.1 非結構化數據倉庫 205 11.4.2 數據量和非結構化數據倉庫 205 11.5 適用於兩個環境 206 11.6 小結 207 [0第0]12章 [0大0]型數據倉庫 208 12.1 快速增長的原因 208 12.2 龐[0大0]數據量的影響 209 12.2.1 基本數據管理活動 209 12.2.2 存儲費用 210 12.2.3 實際存儲費用 210 12.2.4 [0大0]型數據量中的數據使用模式 211 12.2.5 一個簡單計算 211 12.2.6 兩類數據 212 12.2.7 數據分類涉及的問題 212 12.3 數據在不同介質的存儲 213 12.3.1 近綫存儲 213 12.3.2 訪問速度和磁盤存儲 214 12.3.3 存檔存儲 215 12.3.4 透明的意義 216 12.4 環境間數據轉移 216 12.4.1 CMSM方[0法0] 217 12.4.2 數據倉庫使用監控器 218 12.4.3 不同存儲介質下數據倉庫的擴展 218 12.5 數據倉庫轉換 219 12.6 總費用 219 12.7 [0大0]容量 219 12.8 小結 220 [0第0]13章 關係模型和多維模型數據庫 設計基礎 222 13.1 關係模型 222 13.2 多維模型 223 13.3 雪花結構 224 13.4 兩種模型的區彆 224 13.4.1 區彆的起源 225 13.4.2 重建關係型數據 225 13.4.3 數據的直接訪問和間接訪問 226 13.4.4 支持將來未[0知0]的需求 227 13.4.5 支持適度變化的需求 227 13.5 [0獨0]立數據集市 229 13.6 建立[0獨0]立數據集市 230 13.7 小結 232 [0第0]14章 數據倉庫高級話題 233 14.1 終用戶的需求和數據倉庫 233 14.1.1 數據倉庫和數據模型 233 14.1.2 關係型的基礎 233 14.1.3 數據倉庫和統計處理 234 14.2 數據倉庫內的資源競爭 234 14.2.1 探查型數據倉庫 235 14.2.2 數據挖掘型數據倉庫 236 14.2.3 凍結探查型數據倉庫 236 14.2.4 外部數據和探查型數據倉庫 237 14.3 同一個處理器處理數據集市和 數據倉庫 237 14.4 數據的生命周期 238 14.5 測試和數據倉庫 239 14.6 追蹤數據倉庫中的數據流 240 14.6.1 數據倉庫中的數據速率 241 14.6.2 “推”和“拉”數據 242 14.7 數據倉庫和基於網絡的電子[0商0]務環境 242 14.7.1 兩種環境之間的界麵 242 14.7.2 粒度管理器 243 14.7.3 概要記錄 244 14.7.4 ODS,概要記錄以及性能 244 14.8 財務數據倉庫 245 14.9 記錄係統 246 14.10 結構體係的概要曆[0史0]—演化 為公司信息工廠 247 14.10.1 CIF的進化 249 14.10.2 障礙 249 14.11 CIF的未來 250 14.11.1 分析 250 14.11.2 ERP/SAP 250 14.11.3 非結構化數據 251 14.11.4 數據量 251 14.12 小結 252 [0第0]15章 數據倉庫的成本論證和 投資迴報 254 15.1 應對競爭 254 15.2 宏觀上的成本論證 254 15.3 微觀上的成本論證 255 15.4 來自遺留環境的信息 256 15.4.1 新信息的成本 257 15.4.2 用數據倉庫收集信息 257 15.4.3 成本比較 257 15.4.4 建立數據倉庫 257 15.4.5 完整的情況圖 258 15.4.6 得到數據的障礙 258 15.5 數據的時間價值 259 15.6 集成的信息 260 15.6.1 曆[0史0]數據的價值 261 15.6.2 曆[0史0]數據和客戶關係模型 261 15.7 小結 261 [0第0]16章 數據倉庫和ODS 263 16.1 互補的結構 263 16.1.1 ODS中的升級 264 16.1.2 曆[0史0]數據與ODS 264 16.1.3 概要記錄 264 16.2 不同種類的ODS 265 16.3 數據庫設計—一種混閤的方式 266 16.4 按比例畫圖 266 16.5 ODS中的事務集成 267 16.6 對ODS處理日進行分片 267 16.7 多個ODS 267 16.8 ODS和網絡環境 268 16.9 ODS的一個例子 268 16.10 小結 269 [0第0]17章 企業信息依從準則和數據倉庫 270 17.1 兩個基本行為 270 17.2 財務依從準則 270 17.2.1 “是什麼” 272 17.2.2 “為什麼” 273 17.3 審計公司的交流信息 274 17.4 小結 276 [0第0]18章 終用戶社區 277 18.1 農民 277 18.2 探險者 277 18.3 礦工 277 18.4 旅行者 278 18.5 整個社區 278 18.6 不同的數據類型 278 18.7 成本論證和ROI分析 278 18.8 小結 279 [0第0]19章 數據倉庫設計的復查要目 280 19.1 何時進行設計復查 280 19.2 誰負責設計復查 281 19.3 有哪些議事日程 281 19.4 結果 281 19.5 復查管理 281 19.6 典型的數據倉庫設計復查 282 19.7 小結 295 術語錶 296 參考文獻 305 |
編輯推薦 |
數據倉庫為企業和組織提供瞭收集、存儲和分析海量業務數據的必要策略。隨著業務活動的日益增長,數據倉庫[0領0]域變得越來越重要。本書被譽為數據倉庫的“聖經”,從1990年[0第0]1版齣版起,不僅帶動瞭數據倉庫行業的發展,而且至今仍然是數據倉庫方麵的[0優0]秀入門讀物。《數據倉庫》(原書[0第0]4版)涵蓋瞭數據倉庫 ,保持瞭在這一[0領0]域的先鋒地位。 縱觀數據倉庫係統的基本組成部分,讀者[0會0]體驗到數據倉庫設計方[0法0]的更新;各種數據倉庫的遷移策略以及應用在裝載、索引和數據管理方麵的技術。本書為讀者提供瞭數據倉庫[0領0]域的新進展。 本書新增的內容: 在數據倉庫中處理非結構化數據的方[0法0] 在各種不同的存儲介質上存儲數據的方[0法0] 關係型數據庫設計和多維數據庫設計的對比 在規劃數據倉庫項目時如何度量投資迴報 探索更高級的研究主題,包括數據的監控與測試 |
评分
评分
评分
评分
评分
评分
评分
评分
本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度,google,bing,sogou 等
© 2025 tushu.tinynews.org All Rights Reserved. 求知書站 版权所有