編輯推薦
在暢銷書作者、SQL傑齣人物Joe Celko的專業指導下學習NoSQL。
掌握每一位SQL專業人士都需要瞭解的非關係型數據庫知識。
本書對非關係型技術的完整概述,讓你能夠更靈活地應對組織需要。數據持續爆炸式增長且越來越復雜,使得SQL對於查詢數據和抽取數據含義的作用被削弱。在這個新時期裏,數據的規模更大、速度更快,你需要利用非關係型技術來大限度地利用手中的信息。通過Joe Celko的這本書,你將瞭解何時、何地使用NoSQL以及為什麼NoSQL比SQL更有益。
? 完整理解NoSQL技術的使用場景。
? 認識列式數據庫、流式數據庫和圖數據庫的利與弊。
? 學習如何轉變思維方式來充分利用非關係型數據庫。
本書涵蓋瞭當今的數據不同於過去的數據的三個方麵,即速度、規模、多樣性。當收集和查詢信息的速度趕不上信息變化的速度時,就不能簡單地將其當作靜態數據處理。本書將幫你理解數據的速度,讓你裝備一些工具來解燃眉之急。舊的數據存儲與訪問模式已不適用於大數據。傑齣專傢Joe Celko將幫你瞭解數據的規模,以及存儲和訪問PB級和EB級數據的不同方式。並不是所有的數據都能適應關係模型,包括基因數據、語義數據以及社交網絡産生的數據。Joe Celko將幫你瞭解數據的種類,以及多種數據所需的可替代的存儲、查詢和管理框架。
內容簡介
本書是根據作者進行培訓和開發的經驗編寫的NoSQL傑齣指南,是瞭解在什麼場景、什麼時候、為什麼NoSQL的好處超過SQL的理想書籍。通過本書,讀者可以對SQL的缺點多於好處的場景有一個完整的理解,而後更好地確定何時使用NoSQL技術可以獲得很大的好處,對列數據庫、流數據庫和圖數據庫的利弊有更深入的理解,並在備受歡迎的SQL專傢Joe Celko的指導下順利過渡到NoSQL。
本書會詳細介紹NoSQL常見的數據庫的曆史、技術原理及其優缺點,這些數據庫包括列式數據庫、圖數據庫、流式數據庫、鍵值數據庫、文本數據庫、地理信息數據庫、指紋數據庫、分析型數據庫、多值數據庫以及層次數據庫等。
本書適閤所有對NoSQL數據庫感興趣的技術人員閱讀。
作者簡介
Joe Celko為ANSI/ISO SQL標準委員會工作瞭10年,並且參與編寫瞭SQL-89和SQL-92標準。
Celko先生是Elsevier/Morgan Kaufmann齣版的一係列關於SQL和RDBMS圖書的作者。他是得剋薩斯奧斯汀的一位獨立谘詢師。他已經為計算機行業和學術齣版寫過1200多個專欄,其中大多數都是關於處理數據和數據庫方麵的。
譯者介紹
範東來 北京航空航天大學碩士,成都數聯銘品(BBD)科技有限公司大數據技術部負責人,大數據平颱架構師,著有《Hadoop海量數據處理》,譯有《解讀NoSQL》,極客學院布道師,研究方嚮為並行圖挖掘、模式分類。
王春生 網名“平凡的香草”,典型的“完美主義+強迫癥+現實主義”綜閤體,追求完美並苛刻。新浪大規模數據庫平颱的設計者和開發者,先後擔任過DBA、架構師、技術總監等職位,對數據庫、網絡、係統等環節的應用和開發均有豐富經驗,曾參與翻譯《Puppet實戰手冊》。微博@平凡的香草。
目錄
第1章 NoSQL和事務處理 1
簡介 1
1.1 批處理中的數據庫事務處理 1
1.2 磁盤處理中的事務處理 2
1.3 ACID 2
1.4 悲觀並發詳解 4
1.4.1 隔離級彆 5
1.4.2 私有的隔離級彆 7
1.5 CAP定理 8
1.6 BASE 9
1.7 服務器端一緻性 10
1.8 錯誤處理 11
1.9 為什麼在這些場景下SQL不能發揮作用 11
總結思考 12
參考文獻 12
第2章 列式數據庫 13
簡介 13
2.1 列式數據庫的曆史 14
2.2 技術原理 19
2.3 查詢優化 19
2.4 多用戶和硬件 19
2.5 執行一個ALTER語句 20
2.6 數據倉庫和列式數據庫 21
總結思考 21
參考文獻 22
第3章 圖數據庫 23
簡介 23
3.1 圖論基礎 24
3.1.1 節點 24
3.1.2 邊 25
3.1.3 圖的結構 25
3.2 RDBMS與圖數據庫 26
3.3 凱文?貝肯問題的六度 26
3.3.1 通用圖的鄰接錶模型 27
3.3.2 通用圖的覆蓋路徑模型 30
3.3.3 真實數據的復雜關係 32
3.4 頂點覆蓋 34
3.5 圖編程工具 35
3.5.1 圖數據庫 36
3.5.2 圖數據庫語言 36
總結思考 39
參考文獻 39
第4章 MapReduce模型 41
簡介 41
4.1 Hadoop分布式文件係統 43
4.2 查詢語言 43
4.2.1 Pig Latin 43
4.2.2 Hive和其他工具 52
總結思考 54
參考文獻 54
第5章 流式數據庫和復雜事件 55
簡介 55
5.1 代並發模型 56
5.1.1 樂觀並發 56
5.1.2 樂觀並發下的隔離級彆 56
5.2 復雜事件處理 58
5.2.1 與事件處理相關的術語 59
5.2.2 事件處理與狀態更改約束 61
5.2.3 事件處理與Petri網 62
5.3 商業産品 63
5.3.1 StreamBase 63
5.3.2 Kx 66
總結思考 68
參考文獻 68
第6章 鍵值存儲 69
簡介 69
6.1 模式與無模式 69
6.2 查詢與檢索 70
6.3 “鍵”的處理 70
6.3.1 Berkeley DB 71
6.3.2 通過樹索引或散列訪問 71
6.4 “值”的處理 71
6.4.1 任意字節數組 72
6.4.2 已知結構的小文件 72
6.5 産品 73
總結思考 75
第7章 文本數據庫 77
簡介 77
7.1 經典文檔管理係統 77
7.1.1 文件索引和存儲 78
7.1.2 關鍵字和題內關鍵字 78
7.1.3 行業標準 79
7.2 文本挖掘與理解 83
7.2.1 語義與語法 83
7.2.2 語義網 84
7.3 語言問題 85
7.3.1 Unicode和ISO標準 86
7.3.2 機器翻譯 86
總結思考 87
參考文獻 88
第8章 地圖數據 89
簡介 89
8.1 GIS查詢 90
8.1.1 簡單位置 90
8.1.2 簡單距離 91
8.1.3 在一個區域中查找數量、密度和內容 91
8.1.4 鄰近關係 91
8.1.5 時間關係 91
8.2 定位 92
8.2.1 經度和緯度 92
8.2.2 層次三角網格 93
8.2.3 街道地址 95
8.2.4 郵政編號 96
8.2.5 ZIP編碼 96
8.2.6 加拿大郵政編碼 96
8.2.7 英國郵政編碼 97
8.3 GIS的SQL擴展 99
總結思考 99
參考文獻 100
第9章 大數據和雲計算 101
簡介 101
9.1 對大數據和雲計算的疑問 102
9.1.1 雲計算僅是一種時尚 103
9.1.2 雲計算沒有內部數據服務器那麼安全 103
9.1.3 雲計算代價高昂 103
9.1.4 雲計算太復雜 103
9.1.5 雲計算對大公司纔有意義 104
9.1.6 隻是技術上的改變 104
9.1.7 如果網絡中斷,雲計算將毫無用處 105
9.2 大數據和數據挖掘 105
9.2.1 用於非傳統分析的大數據 106
9.2.2 係統閤並的大數據 107
總結思考 107
參考文獻 108
第10章 生物特徵、指紋和專業數據庫 109
簡介 109
10.1 原生生物特徵 110
10.2 指紋 111
10.2.1 分類 112
10.2.2 匹配 113
10.2.3 NIST標準 113
10.3 DNA識彆 115
基本原則和技術 116
10.4 麵部數據庫 117
10.4.1 曆史 118
10.4.2 誰在使用麵部數據庫 119
10.4.3 它有多好 120
總結思考 121
參考文獻 121
第11章 分析型數據庫 123
簡介 123
11.1 數據立方體 123
11.2 Codd博士的OLAP規則 124
11.2.1 Codd博士理論的基礎特性 124
11.2.2 獨有特性 126
11.2.3 報錶特性 126
11.2.4 維度控製 127
11.3 MOLAP 127
11.4 ROLAP 128
11.5 HOLAP 128
11.6 OLAP查詢語言 128
11.7 SQL中的聚閤操作符 129
11.7.1 GROUP BY GROUPING SET 129
11.7.2 ROLLUP 130
11.7.3 CUBE 131
11.7.4 用法須知 132
11.8 SQL中的OLAP操作符 132
11.8.1 OLAP功能 133
11.8.2 NTILE(n) 138
11.8.3 嵌套的OLAP函數 138
11.8.4 查詢樣例 139
11.9 稀疏的數據立方體 140
11.9.1 數據立方體 140
11.9.2 維度分層 141
11.9.3 下鑽和切片 142
總結思考 143
參考文獻 143
第12章 多值數據庫或NFNF數據庫 145
簡介 145
12.1 嵌套文件結構 145
12.2 多值係統 147
12.3 NFNF數據庫 149
12.4 現有的錶值擴展 152
12.4.1 Microsoft SQL Server 152
12.4.2 Oracle擴展 153
總結思考 154
第13章 層次數據庫係統和網絡數據庫係統 155
簡介 155
13.1 數據庫類型 155
13.2 數據庫曆史 156
13.2.1 DL/I 157
13.2.2 控製塊 157
13.2.3 數據通信 157
13.2.4 應用程序 157
13.2.5 層次數據庫 158
13.2.6 優勢和劣勢 158
13.3 簡單的層次數據庫 159
13.3.1 Department數據庫 160
13.3.2 Student數據庫 160
13.3.3 設計考量 161
13.3.4 樣例數據庫擴展 161
13.3.5 數據關係 162
13.3.6 層次序列 163
13.3.7 層次數據路徑 163
13.3.8 數據庫記錄 164
13.3.9 段格式 165
13.3.10 段定義 166
13.4 小結 166
總結思考 167
參考文獻 167
術語錶 169
前言/序言
NoSQL權威指南 下載 mobi epub pdf txt 電子書