內容簡介
《辭書研究文庫:計算詞典學論》從辭書現代化技術發展和理論研究的進程可見,計算詞典學是一項復雜的、跨學科的交叉理論體係,計算機信息處理技術、數據庫技術、人工智能技術、多媒體技術和網絡技術對詞典學的研究和詞典編纂技術的滲透越來越快、越來越深入。《辭書研究文庫:計算詞典學論》的修訂或重寫就是要把近十年來我國和西方主要國傢對這些現代技術在詞典學理論和實踐中的應用進行係統的調查和梳理,弄清計算詞典學得以形成的理論基礎和社會基礎以及其研究方嚮和研究任務,以期建立計算詞典學的理論框架,促進我國詞典學研究和詞典編纂時間盡快與現代數字技術相結閤。
內頁插圖
目錄
“辭書研究文庫”總序 曹先擢
前言
第一章 計算詞典學概略
第一節 計算詞典學的基礎
一、計算詞典學的源流
二、計算詞典學的相關理論
三、計算詞典學的相關方法
第二節 計算詞典學的性質特徵
一、計算詞典學的理論特徵
二、計算詞典學的實踐特徵
三、計算詞典學的學科交叉融閤
第三節 計算詞典學與機器詞典
一、機器翻譯的研究
二、機器詞典的開發
三、機器詞典與機讀人用詞典
第四節 計算詞典學的國際背景
一、國際學術環境
二、與計算詞典學相關的國際學術組織
三、語料和數據文本編碼的國際標準
第二章 語料庫與語料庫詞典學
第一節 語料庫概說
第二節 語料庫的基本特徵
一、語料庫的目的性
二、語料庫語料的真實性
三、語料庫語料的典型性
四、語料庫語料的機讀性
五、語料庫語料的標準性
第三節 語料庫的類型
一、按語言種類劃分
二、按語言方式劃分
三、按語料的載體劃分
四、按語言的時域劃分
五、按語言的用途劃分
六、按語料的流通劃分
七、按語料的分布劃分
八、按語料的處理劃分
第四節 語料庫的基本功能
一、語料管理功能
二、語料索引功能
三、語料統計功能
四、語料標注功能
五、語音分析功能
第五節 語料庫的建設與發展
一、語料庫的曆史背景
二、語料庫的發展階段
三、國內語料庫的繁榮發展
四、語料庫發展趨勢
五、小結
第三章 電子詞庫的理論研究與實體構建
第一節 詞庫的理論概說
第二節 詞庫的相對關係
第三節 詞庫的基本內容和特色
第四節 主要詞庫的性能特徵
一、詞網
二、知網
第四章 詞典語料的精加工與數據化
第一節 詞匯屬性速描
一、詞匯屬性速描的主要功能
二、詞匯屬性速描的描述方式
三、詞匯速描的現狀與問題
第二節 英語詞匯數據庫
一、英語詞匯數據庫的設計理念與方法
二、英語詞匯數據庫的容量與數據類型
三、英語詞匯數據庫的信息結構
四、DANTE數據庫的數據結構
第三節 語料庫模式分析
一、語料庫模式分析的理論構想
二、語料庫模式的注釋結構及構造
三、模式分析與模式錶徵
第四節 框架網——詞匯數據庫
一、框架網的設計思想
……
第五章 計算機技術與詞典編纂的創新
第六章 電子詞典的類型與功能設置
第七章 電子詞典數據庫及其內部結構
第八章 電子詞典編纂與製作的原則
第九章 光盤與芯片電子詞典
第十章 網絡電子詞典
第十一章 電子詞典的現狀與發展趨勢
主要參考文獻
精彩書摘
Boguraev &Briscoe(1989:2)認為;“雖然我們的工作並不是編纂詞典,但有一點是明確的,無論從組織結構還是從錶述方式來看,機讀詞典與普通詞典是大不一樣的,計算詞典學的研究範圍還應包括利用計算機技術開發供人使用的詞典數據。”Lender(1991:48)認為,計算詞典學與計算語言學的直接關係在於“詞典也是一種專傢係統”,因為“它或者包含瞭某一種語言一般詞匯的知識,或者包含瞭某一專科領域詞匯的知識”。在自然語言處理領域,為提高係統的處理能力需要更加豐富的詞匯信息,計算詞典學的目標就是好好利用已有的機讀詞典,使其成為自動化語言處理係統潛在的詞匯知識源泉。
Atkins&2ampolll(1994)認為,計算詞典學負責自然語言處理中的電子詞典的設計、編纂和使用。另一方麵,它還包括詞典編纂的技術和輔助工具的設計,包括從各種語言資源中提取例證用數據庫的形式來存儲相關的語言信息,詞典條目的編纂和編輯,以及辭書産品的發行或傳播等。
Badia&Sauri;(2000)認為,計算詞典學的主要任務之一是為自然語言處理構建具有信息性、連貫性和經濟性的詞庫。這種資源需求是因為所謂的語料庫語言學的齣現,它把大量的原始語料作為自然語言處理的輸入,而最後又不得不放棄這種“玩具式工具(toytools)的構想”。然而,從頭開始構建計算機詞庫是一件既費時又費力的事情,那麼在計算詞典學的框架下利用現有的詞典資源來建設詞庫便是一個不錯的選擇。因此,自20世紀80年代開始人們便開始利用機讀詞典自動提取詞匯知識信息。
Hanks(1998)認為,計算詞典學的一個核心問題是語詞的意義能否通過使用實例來驗證。語料分析使我們堅信瞭這樣一個觀點,每一個詞的常規用法都可以在語料中得到檢驗,這些使用常規可以與詞的意義常規和信念(belief)結閤起來。不過他也認為,現在還沒有統一的標準來判斷什麼是常規用法、什麼是拓展用法(如修辭或比喻用法、語義框架等)(Hanks2009)。從上述的專傢觀點來看,計算詞典學與計算語言學、計算詞匯學有著密切聯係,有些研究內容相互交織,難以明確分隔,因為他們研究的主要對象——詞匯及其語言屬性都是一樣的,隻是研究的角度、方法、重點和目的略有不同。從形成曆史來看,計算詞典學的任務首先是解決自然語言處理所需的機讀詞典問題;接著是紙質詞典內容的“電子化”和“機讀性”問題;其三是研究詞典數據庫的建設,以及數據的統計分析、自動存取、自動識彆、自動轉換成各類詞典的問題;其四是研究如何使用計算機輔助詞典的編纂、編輯和修訂,力爭在不遠的將來達到詞典編纂和修訂半自動化的目標,最終嚮基本自動化的方嚮發展;其五是對現有的大型商業詞典進行電子化改造,實現大型詞典的發行無紙化,或設計編纂專門供人閱讀的電子詞典或網絡詞典。在詞典數據處理和編纂數字化方麵,除眾所周知的計算機輔助詞典編纂之外,還有真實連續文本的分析以及詞匯索引和提取。通過索引的方法調查和分析有關語詞在自然話語中的分布,以便考察詞的語法、語義和語用等特徵,獲取詞項的功能和用法信息,同時獲取語詞義項分布或劃分的根據。當然,詞匯索引也是詞典配例的可靠資源。目前,也有人嘗試利用語料庫建立詞典數據庫,在微觀數據結構的基礎上生成詞典。總的來說,計算詞典學研究如何實現詞典語料處理電子化,詞典編纂半自動化或自動化,詞典編排形式化,詞典信息數字化和詞典查檢智能化,以及詞典信息錶述多媒體化。研究的主要內容是:語料的搜集與處理、義項劃分的數據支持(詞頻統計、語義統計、詞的配價結構統計)、綜閤語義分析、例句的提取、輔助詞典編纂、詞典數據庫及其標引、語料庫和數據庫的管理、詞典信息統計、詞典編纂管理、詞典導齣接口等。
……
前言/序言
辭書研究文庫:計算詞典學論 下載 mobi epub pdf txt 電子書