作 譯 者:羅剛
齣版時間:2018-01 韆 字 數:364
版 次:01-01 頁 數:228
開 本:16開
裝 幀:
I S B N :9787121332333
換 版:
所屬分類:科技 >> 計算機 >> 編程語言
紙質書定價:¥49.0
Elasticsearch搜索集群係統在生産和生活中發揮著越來越重要的作用。本書介紹瞭Elasticsearch的使用、原理、係統優化與擴展應用。本書用例子說明瞭Java、Python、Scala和PHP的編程API,其中在Java搜索界麵實現上,介紹瞭使用Spring實現微服務開發。為瞭擴展Elasticsearch的功能,本書以中文分詞和英文文本分析為例介紹瞭插件開發方法。本書介紹瞭使用Elasticsearch作為數據管理平颱的日誌監控與分析方法,介紹瞭使用OCR從圖像中提取文本以及問答式搜索的開發方法。
第1章 使用Elasticsearch 1
1.1 基本概念 1
1.2 安裝 2
1.3 搜索集群 5
1.4 創建索引 6
1.5 使用Java客戶端接口 9
1.5.1 創建索引 11
1.5.2 增加、刪除與修改數據 14
1.5.3 分析器 16
1.5.4 數據導入 17
1.5.5 通過攝取快速導入數據 17
1.5.6 索引庫結構 17
1.5.7 查詢 18
1.5.8 區間查詢 22
1.5.9 排序 23
1.5.10 分布式搜索 23
1.5.11 過濾器 24
1.5.12 高亮顯示 24
1.5.13 分頁 25
1.5.14 通過聚閤實現分組查詢 26
1.5.15 文本列的聚閤 27
1.5.16 遍曆數據 28
1.5.17 索引文檔 29
1.5.18 Percolate 29
1.6 RESTClient 30
1.6.1 使用攝取 31
1.6.2 代碼實現攝取 33
1.7 使用Jest 33
1.8 Python客戶端 37
1.9 Scala客戶端 40
1.10 PHP客戶端 43
1.11 SQL支持 44
1.12 本章小結 48
第2章 開發插件 49
2.1 搜索中文 49
2.1.1 中文分詞原理 49
2.1.2 中文分詞插件原理 51
2.1.3 開發中文分詞插件 53
2.1.4 中文AnalyzerProvider 55
2.1.5 字詞混閤索引 57
2.2 搜索英文 60
2.2.1 句子切分 60
2.2.2 標注詞性 62
2.3 使用測試套件 64
2.4 本章小結 68
第3章 管理搜索集群 69
3.1 節點類型 69
3.2 管理集群 69
3.3 寫入權限控製 70
3.4 使用X-Pack 71
3.5 快照 72
3.6 Zen發現機製 73
3.7 聯閤搜索 74
3.8 緩存 74
3.9 本章小結 75
第4章 源碼分析 76
4.1 Lucene源碼分析 76
4.1.1 Ivy管理依賴項 76
4.1.2 源碼結構介紹 76
4.2 Gradle 77
4.3 Guice 77
4.4 Joda-Time 79
4.5 Transport 80
4.6 綫程池 80
4.7 模塊 80
4.8 Netty 81
4.9 分布式 81
4.10 本章小結 82
第5章 搜索相關性 83
5.1 BM25檢索模型 83
5.1.1 使用BM25檢索模型 86
5.1.2 參數調優 86
5.2 學習評分 86
5.2.1 基本原理 87
5.2.2 準備數據 87
5.2.3 Elasticsearch學習排名 89
5.3 本章小結 91
第6章 搜索引擎用戶界麵 92
6.1 JSP實現搜索界麵 92
6.1.1 用於顯示搜索結果的自定義標簽 93
6.1.2 使用Listlib 98
6.1.3 實現翻頁 100
6.2 使用Spring實現的搜索界麵 102
6.2.1 實現REST搜索界麵 102
6.2.2 REST API中的HTTP PUT 104
6.2.3 Spring-data-elasticsearch 106
6.2.4 Spring HATEOAS 112
6.3 實現搜索接口 113
6.3.1 編碼識彆 113
6.3.2 布爾搜索 116
6.3.3 搜索結果排序 116
6.4 實現相似文檔搜索 117
6.5 實現AJAX搜索聯想詞 119
6.5.1 估計查詢詞的文檔頻率 119
6.5.2 搜索聯想詞總體結構 119
6.5.3 服務器端處理 120
6.5.4 瀏覽器端處理 125
6.5.5 拼音提示 127
6.5.6 部署總結 127
6.5.7 Suggester 128
6.6 推薦搜索詞 129
6.6.1 挖掘相關搜索詞 130
6.6.2 使用多綫程計算相關搜索詞 132
6.7 查詢意圖理解 133
6.7.1 拼音搜索 133
6.7.2 無結果處理 133
6.8 集成其他功能 134
6.8.1 拼寫檢查 134
6.8.2 分類統計 135
6.8.3 相關搜索 141
6.8.4 再次查找 144
6.8.5 搜索日誌 144
6.9 查詢分析 146
6.9.1 曆史搜索詞記錄 146
6.9.2 日誌信息過濾 147
6.9.3 信息統計 148
6.9.4 挖掘日誌信息 150
6.9.5 查詢詞意圖分析 150
6.10 部署網站 150
6.10.1 部署到Web服務器 151
6.10.2 防止攻擊 152
6.11 本章小結 156
第7章 OCR文字識彆 157
7.1 Tesseract 157
7.2 使用TensorFlow識彆文字 161
7.3 OpenCV 164
7.3.1 預處理 166
7.3.2 文字區域提取 169
7.3.3 糾正偏斜 171
7.3.4 Linux環境支持 172
7.4 JavaCV 172
7.5 本章小結 174
第8章 問答式搜索 176
8.1 生成錶示語義的代碼 176
8.2 信息整閤 181
8.2.1 實體對齊 181
8.2.2 編輯距離 181
8.2.3 Jaro-Winkler距離 187
8.2.4 比較器 189
8.2.5 Cleaner 189
8.2.6 運行過程 190
8.2.7 遺傳算法調整參數 192
8.3 自動問答 193
8.3.1 問句處理器 193
8.3.2 自動發現答案 198
8.4 本章小結 199
第9章 Elastic係統監控 201
9.1 Logstash 201
9.1.1 使用Logstash 201
9.1.2 插件 203
..
書名:從Lucene到Elasticsearch:全文檢索實戰
齣版社: 清華大學齣版社
ISBN:9787302483069
版次:1
包裝:平裝
開本:16開
齣版時間:2017-11-01
用紙:純質紙
頁數:317
字數:525000
定價:79
本書循序漸進介紹瞭信息檢索、布爾檢索、嚮量空間模型、tf-idf、BM25排序算法、Lucene架構、Lucene創建索引、Lucene查詢、Lucene項目實戰、Elasticsearch安裝與配置、Elasticsearch插件安裝、REST API數據操作、映射與模闆、索引彆名、Elasticsearch基本和搜索、Elasticsearch同步數據庫、Elasticsearch集群管理、項目實戰等內容。閱讀本書,讀者能夠掌握信息檢索的核心概念,應用Lucene庫處理全文檢索業務,掌握Elasticsearch分布式搜索引擎的使用方法與技巧。
本書基於Lucene 6.0和Elasticsearch 5.4.0進行講解,技術先進,示例豐富,適閤想學習信息檢索技術的初學者和相關專業的大學生、研究生學習,也很適閤大數據及雲計算平颱構建人員以及有一定基礎的IT開發人員使用。
第1章 信息檢索模型 1
1.1 信息檢索概述 1
1.1.1 信息過載 1
1.1.2 信息檢索定義 2
1.1.3 信息檢索常用術語 3
1.1.4 信息檢索係統 4
1.2 分詞算法 5
1.2.1 分詞算法概述 5
1.2.2 詞典匹配分詞法 6
1.2.3 語義理解分詞法 6
1.2.4 詞頻統計分詞法 7
1.3 倒排索引 7
1.4 布爾檢索模型 9
1.5 tf-idf權重計算 11
1.6 嚮量空間模型 13
1.7 概率檢索模型 16
1.7.1 貝葉斯決策理論 17
1.7.2 二值獨立模型 18
1.7.3 Okapi BM25模型 20
1.7.4 BM25F模型 20
1.8 本章小結 21
第2章 Lucene開發入門 22
2.1 Lucene概述 22
2.1.1 Lucene簡介 22
2.1.2 Lucene特點 22
2.1.3 Lucene架構 23
2.2 Lucene開發準備 25
2.2.1 下載Lucene文件庫 25
2.2.2 工程中引入Lucene 26
2.2.3 下載Luke 27
2.2.4 下載IK分詞工具 28
2.2.5 工程搭建 29
2.3 Lucene分詞詳解 30
2.3.1 Lucene分詞係統 30
2.3.2 分詞器測試 31
2.3.3 IK分詞器配置 34
2.3.4 中文分詞器對比 36
2.3.5 擴展停用詞詞典 38
2.3.6 擴展自定義詞典 38
2.4 Lucene索引詳解 40
2.4.1 Lucene字段類型 40
2.4.2 索引文檔示例 41
2.4.3 Luke中查看索引 46
2.4.4 索引的刪除 48
2.4.5 索引的更新 49
2.5 Lucene查詢詳解 50
2.5.1 搜索入門 51
2.5.2 多域搜索(MultiFieldQueryParser) 52
2.5.3 詞項搜索(TermQuery) 53
2.5.4 布爾搜索(BooleanQuery) 53
2.5.5 範圍搜索(RangeQuery) 54
2.5.6 前綴搜索(PrefixQuery) 55
2.5.7 多關鍵字搜索(PhraseQuery) 55
2.5.8 模糊搜索(FuzzyQuery) 55
2.5.9 通配符搜索(WildcardQuery) 56
2.6 Lucene查詢高亮 56
2.7 Lucene新聞高頻詞提取 58
2.7.1 問題提齣 58
2.7.2 需求分析 58
2.7.3 編程實現 58
2.8 本章小結 61
第3章 Lucene文件檢索項目實戰 62
3.1 需求分析 62
3.2 架構設計 63
3.3 文本內容抽取 64
3.3.1 Tika簡介 64
3.3.2 Tika下載 64
3.3.3 搭建工程 65
3.3.4 內容抽取 66
3.3.5 自動解析 68
3.4 工程搭建 71
3.5 索引文檔 72
3.6 查詢界麵 75
评分
评分
评分
评分
评分
评分
评分
评分
本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度,google,bing,sogou 等
© 2025 tushu.tinynews.org All Rights Reserved. 求知書站 版权所有