編輯推薦
(1)國傢齣版基金項目
(2)“十三五”國傢重點圖書齣版規劃項目
(3)100多萬字的集大成之作
內容簡介
自然語言計算機形式分析是橫跨語言學、計算機科學和數學的一個交叉研究領域,是自然語言計算機處理的關鍵。自然語言是信息主要的負荷者,在當今信息網絡時代,計算機已經日益普及,普通計算機用戶可以使用的語言資源正以驚人的速度飛快增長。互聯網主要是由自然語言構成的,它已經成為瞭極為豐富的語言信息資源;移動通信也是以自然語言為媒介的,它已經滲透到日常生活的各個領域。因此,自然語言計算機形式分析對於國傢的信息化建設,對於互聯網和移動通信的安全具有重要作用。
本書對自然語言處理中的各種理論和方法進行瞭係統的總結和梳理。首先討論瞭自然語言處理的學科定位;接著介紹瞭語言計算的一些先驅研究;然後以主要的篇幅討論自然語言處理中的各種形式模型,包括基於短語結構語法的形式模型、基於閤一運算的形式模型、基於依存和配價的形式模型、基於格語法的形式模型、基於詞匯主義的形式模型、語義自動處理的形式模型、係統功能語法、語用自動處理的形式模型、概率語法、Bayes公式與動態規劃算法、N元語法和數據平滑、隱Markov模型(HMM)、語音自動處理的形式模型、統計機器翻譯的形式模型;同時還討論瞭自然語言處理係統的評測問題;最後從哲學的角度討論瞭自然語言處理中的理性主義和經驗主義,探索理性主義方法和經驗主義方法相結閤的途徑。
本書說理透徹、語言流暢、實例豐富、深入淺齣,適閤從事自然語言處理研究的科研人員、大學師生閱讀,也可以作為人工智能、計算語言學等課程的教學參考書。
作者簡介
馮誌偉,1939年齣生,計算語言學傢,先後在北京大學和中國科學技術大學研究生院獲文科和理科碩士學位。精通英語、德語、法語、俄語、日語等多門外語,具有寬厚、堅實的語言學、數學和計算機科學功底,是一位難得的橫跨文理科的復閤型專傢。50多年來一直從事語言學、數學和計算機科學的跨學科研究,是我國從事自然語言處理和計算語言學研究的學者之一。
內頁插圖
目錄
序
第1章自然語言處理的學科定位
1.1從自然語言處理的過程來考察其學科定位
1.2從自然語言處理的範圍來考察其學科定位
1.3從自然語言處理的曆史來考察其學科定位
1.4當前自然語言處理發展的幾個特點
參考文獻
第2章語言計算研究的先驅
2.1Markov鏈
2.2Zipf定律
2.3Shannon關於“熵”的研究
2.4Bar-Hillel的範疇語法
2.5Harris的語言串分析法
2.6О.С.Кулагина的語言集閤論模型
參考文獻
第3章基於短語結構語法的形式模型
3.1語法的Chomsky層級
3.2有限狀態語法和它的局限性
3.3短語結構語法
3.4遞歸轉移網絡和擴充轉移網絡
3.5自底嚮上分析和自頂嚮下分析
3.6通用句法處理器和綫圖分析法
3.7Earley算法
3.8左角分析法
3.9CYK算法
3.10Tomita算法
3.11管轄約束理論與最簡方案
3.12Joshi的樹鄰接語法
3.13漢字結構的形式描述
3.14Hausser的左結閤語法
參考文獻
第4章基於閤一運算的形式模型
4.1中文信息MMT模型
4.2Kaplan的詞匯功能語法
4.3Martin Kay的功能閤一語法
4.4Gazdar的廣義短語結構語法
4.5Shieber的PATR
4.6Pollard的中心語驅動的短語結構語法
4.7Pereira和Warren的定子句語法
參考文獻
第5章基於依存和配價的形式模型
5.1配價觀念的起源
5.2Tesnière的依存語法
5.3依存語法在自然語言處理中的應用
5.4配價語法
5.5配價語法在自然語言處理中的應用
參考文獻
第6章基於格語法的形式模型
6.1Fillmore的格語法
6.2Fillmore的框架網絡
參考文獻
第7章基於詞匯主義的形式模型
7.1Gross的詞匯語法
7.2鏈語法
7.3詞匯語義學
7.4知識本體
7.5詞網
7.6知網
7.7Pustejovesky的生成詞庫理論
參考文獻
第8章語義自動處理的形式模型
8.1義素分析法
8.2語義場
8.3語義網絡
8.4Montague語法
8.5Wilks的優選語義學
8.6Schank的概念依存理論
8.7Mel’chuk的意義文本理論
8.8詞義排歧方法
參考文獻
第9章係統功能語法
9.1係統功能語法的基本概念
9.2係統功能語法在自然語言處理中的應用
參考文獻
第10章語用自動處理的形式模型
10.1Mann和Thompson的修辭結構理論
10.2文本連貫中的常識推理技術
10.3言語行為理論和會話智能代理
參考文獻
第11章 概率語法
11.1概率上下文無關語法與句子的歧義
11.2概率上下文無關語法的基本原理
11.3概率上下文無關語法的三個假設
11.4概率詞匯化上下文無關語法
參考文獻
第12章Bayes公式與動態規劃算法
12.1拼寫錯誤的檢查與更正
12.2Bayes公式與噪聲信道模型
12.3最小編輯距離算法
12.4發音問題研究中的Bayes方法
12.5發音變異的決策樹模型
12.6加權自動機
12.7嚮前算法
12.8Viterbi算法
附錄
參考文獻
第13章N元語法和數據平滑
13.1N元語法
13.2數據平滑
參考文獻
第14章隱Markov模型(HMM)
14.1HMM概述
14.2HMM在語音識彆中的應用
參考文獻
第15章語音自動處理的形式模型
15.1語音和音位的形式描述方法
15.2聲學語音學和信號
15.3語音自動閤成的方法
15.4語音自動識彆的方法
參考文獻
第16章統計機器翻譯中的形式模型
16.1機器翻譯與噪聲信道模型
16.2最大熵模型
16.3基於平行概率語法的形式模型
16.4基於短語的統計機器翻譯
16.5基於句法的統計機器翻譯
參考文獻
第17章自然語言處理係統的評測
17.1評測的一般原則和方法
17.2語音閤成和文語轉換係統的評測
17.3機器翻譯係統的評測
17.4語料庫係統的評測
17.5國外自然語言處理係統的評測
參考文獻
第18章自然語言處理中的理性主義與經驗主義
18.1哲學中的理性主義和經驗主義
18.2自然語言處理中理性主義和經驗主義的消長
18.3理性主義方法和經驗主義方法的利弊得失
18.4探索理性主義方法和經驗主義方法結閤的途徑
參考文獻
附錄走在文理結閤的道路上——記自然語言處理專傢馮誌偉先生
自然語言計算機形式分析的理論與方法 下載 mobi epub pdf txt 電子書