口語機器翻譯 pdf epub mobi txt 电子书下载 2025

☆☆☆☆☆

瑞諾爾（Manny Rayner）等著，宗成慶譯

圖書標籤:

機器翻譯
口語翻譯
語音識彆
自然語言處理
人工智能
計算語言學
深度學習
語音技術
翻譯技術
多語言處理

下载链接在页面底部

facebook linkedin mastodon messenger pinterest reddit telegram twitter viber vkontakte whatsapp 复制链接

想要找书就要到求知書站

tushu.tinynews.org

立刻按 ctrl+D收藏本页

你会得到大惊喜!!

出版社：北京大学出版社

ISBN：9787301171561

版次：1

商品编码：10268925

包装：平装

丛书名：计算语言学与语言科技原文丛书

开本：16开

出版时间：2010-08-01

用纸：胶版纸

页数：337

正文语种：英语，中文

具体描述

內容簡介

計算語言學研究濫觴於上世紀五六十年代的機器翻譯研究。中文的相關研究也幾乎同步開始，1960年起在柏剋萊加州大學研究室，王士元、鄒嘉彥、C.Y.Dougherty等人已開始研究中英、中俄機器翻譯。他們的中文計算語言學研究，可說是與世界最尖端科技同步的。

內頁插圖

導讀
Preface
Acknowledgements
Introduction
1.1 What This Book Is About
1.1.1 Why Do Spoken Language Translation?
1.1.2 What Are the Basic Problems?
1.1.3 What Is It Realistic to Attempt Today?
1.1.4 What Have We Achieved?
1.2 Overall System Architecture
1.3 An Illustrative Example
1.4 In Defence of Hand-Coded Grammars
1.5 Hybrid Transfer
1.5.1 The Need for Grammatical Knowledge
1.5.2 The Need for Preferences
1.6 Speech Processing
1.7 Corpora

Part 1 Language Processing and Corpora
Translation Using the Core Language Engine
2.1 Introduction: Multi-Engine Translation
2.2 Word-to-Word Translation
2.3 Quasi Logical Form
2.3.1 Introduction
2.3.2 Structure of QLF
2.3.3 QLF as a Transfer Formalism: Examples
2.3.4 Head-Head Relations in QLF
2.4 Unification Grammar and QLFs
2.4.1 The CLE Unification Grammar Formalism
2.4.2 Unification Grammar Example: French Noun Phrases
2.4.3 Example 2a: Clauses in Swedish
2.4.4 Example 2b: Relative Clauses in Swedish
2.5 Orthographic Analysis and the Lexicon
2.6 Transfer Rules
2.6.1 Pre- and Posttransfer
2.7 The QLF-Based Processing Path
2.7.1 Linguistic Analysis
2.7.2 Transfer and Transfer Preferences
2.7.3 Generation
2.8 Summary

Grammar Specialisation
3.1 Introduction
3.2 Explanation-Based Learning for Grammar
Specialisation
3.2.1 A Definition of Explanation-Based Learning
3.2.2 Explanation-Based Learning on Unification Grammars
3.2.3 Category Specialisation
3.2.4 Elaborate Cutting-Up Criteria
3.3 An LR Parsing Method for Specialised Grammars
3.3.1 Basic LR Parsing
3.3.2 Prefix Merging
3.3.3 Abstraction
3.4 Empirical Results
3.4.1 Experimental Setup
3.4.2 Discussion of Results
3.5 Conclusions

Choosing among Interpretations
4.1 Properties and Discriminants
4.2 Constituent Pruning
4.2.1 Discriminants for Pruning
4.2.2 Deciding Which Edges to Prune
4.2.3 Probability Estimates for Discriminants
4.2.4 Relation to Other Pruning Methods
4.3 Choosing among QLF Analyses
4.3.1 Analysis Choice: An Example
4.3.2 Further Advantages of a Discriminant Scheme .
4.3.3 Numerical Metrics
4.4 Choosing among Transferred QLFs
4.5 Choosing Paths in the Chart

The TreeBanker
5.1 Motivation
5.2 Representational Issues
5.3 Overview of the TreeBanker
5.4 The Supervised Training Process
5.4.1 Properties and Discriminants in Training
5.4.2 Additional Functionality
5.5 Training for Transfer Choice
5.6 Evaluation and Conclusions

Acquisition of Lexical Entries
6. 1 The Lexical Acquisition Tool, LexMake
6.2 Acquiring Word-to-Word Transfer Rules
6.3 Evaluation and Conclusions

Spelling and Morphology
7.1 Introduction
7.2 The Description Language
7.2.1 Morphophonology
7.2.2 Word Formation and Interfacing to Syntax
7.3 Compilation
7.3.1 Compiling Spelling Patterns
7.3.2 Representing Lexical Roots
7.3.3 Applying Obligatory Rules
7.3.4 Interword Rules
7.3.5 Timings
7.4 Some Examples
7.4.1 Multiple-Letter Spelling Changes
7.4.2 Using Features to Control Rule Application
7.4.3 Interword Spelling Changes
7.5 Debugging the Rules
……
Part 2 Linguistic Coverage
Part 3 Speech Processing

精彩書摘

棒性和係統的自適應能力。同書麵語相比，口語的聲學特性有一定的特殊性，這類語音的基頻、時長、幅度等特徵都隨錶達內容、感情色彩等不同，變化的範圍比朗讀語音大得多，同時還有非語聲信號和噪聲，充分研究這些特性，建立精細的聲學模型非常重要。而且，講話人往往是在較強的背景噪聲或多講話人環境下發音的，如果是電話自動語音翻譯係統，還存在通訊乾擾等其他因素的影響，因此，提高語音識彆在不同說話人、不同聲學環境及通道條件下的魯棒性，在口語翻譯係統中尤其重要。另外，在語言學層麵，口語句子中含有大量的修正、重復、口頭語、省略等非規範語言現象，研究這些特徵，對語言模型進行完善，包括建模、算法和訓練等各個方麵，將有助於提高語音識彆的正確率。
（2）翻譯方法有待於進一步研究。盡管統計翻譯方法具有較高的魯棒性，但是，對非規範語言現象和噪聲的處理能力仍然十分有限，而且這種方法與訓練語料的規模和質量密切相關。統計方法與規則方法的結閤一直是人們所追求的，但是具體如何融閤，多翻譯引擎以什麼樣的集成方式可以獲得最好的係統性能，統計模型賴以訓練的語料規模達到多大纔算充分，非語言信息（手勢、錶情、說話人角色等）如何融人翻譯模型等，諸多問題都遠遠沒有得到解決。
……

前言/序言

　　計算語言學（Computational Lingljistics，CL）在語言科學與信息科學的研究領域扮演關鍵性的角色。語言學理論尋求對語言現象規律性的揭示與完整的解釋。計算語言學正好提供瞭驗證與應用這些規律與解釋的大好機會。作為語言學、信息科學乃至於心理學與認知科學結閤的交叉學科，計算語言學更提供瞭語言學基礎研究與應用研究的絕佳界麵。事實上，計算語言學與人類語言科技（Human Langllage Technology，HLT）可以視為一體兩麵，不可分割。
　　計算語言學研究濫觴於上世紀五六十年代的機器翻譯研究。中文的相關研究也幾乎同步開始，1960年起在柏剋萊加州大學研究室，王士元、鄒嘉彥、C.Y.Dougherty等人已開始研究中英、中俄機器翻譯。他們的中文計算語言學研究，可說是與世界最尖端科技同步的。中國國內中俄翻譯研究也不遑多讓，大約在上世紀50年代中期便已開始。可惜的是，這些中文相關早期機器翻譯研究，由於硬件與軟件的限製，沒能延續下來。中文計算語言學研究比較有係統的進展，還要等到1986年；海峽兩岸在同一年成立瞭兩個緻力於中文計算語言學基礎架構建立的研究群。北京大學的計算語言學研究所在硃德熙先生倡導下成立，隨後一段時間由陸儉明、俞士汶主持。而颱灣“中研院”的中文詞知識庫小組，由謝清俊創立，陳剋健主持，黃居仁1987年返颱後加入。

《語言的魔法：解密跨文化交流的奧秘》在人類文明的長河中，語言始終是溝通的橋梁，是思想傳遞的載體。然而，當不同的語言交織在一起，當地域的隔閡、文化的差異擺在麵前，溝通的順暢便成為瞭一項充滿挑戰的藝術。本書《語言的魔法：解密跨文化交流的奧秘》正是以此為切入點，深入剖析語言在跨文化交流中所扮演的關鍵角色，並以此為綫索，帶領讀者一同探索那些鮮為人知卻又至關重要的語言現象與交流策略。我們生活在一個日益全球化的時代，跨越國界的互動已成為常態。無論是商務談判、學術交流、國際旅遊，還是僅僅是綫上論壇上的觀點碰撞，都離不開語言的參與。然而，我們常常陷入一個誤區：認為隻要掌握瞭某種語言，就能自如地進行跨文化溝通。殊不知，語言的錶象之下，隱藏著一個更為復雜而精妙的體係，它與文化、曆史、思維方式、甚至社會結構都息息相關。本書並非一本關於具體語言學習的教程，也並非探討特定語言之間的翻譯技巧。相反，它著眼於更為宏觀的層麵，試圖揭示語言作為人類獨有能力的本質，以及它如何在不同文化背景下綻放齣不同的光彩，又如何在交流中構建起理解與隔閡的鴻溝。我們將從語言的起源和演變談起，追溯人類是如何從簡單的聲音信號發展齣如今豐富多樣的語言體係。我們會探討不同語言在語音、詞匯、語法上的多樣性，以及這些差異如何反映瞭不同民族對世界的獨特認知方式。舉例來說，某些語言中豐富的色彩詞匯，可能暗示著該文化對於自然環境的細緻觀察和高度重視；而另一些語言中對於時間流逝的獨特錶達，則可能摺射齣一種更為循環或綫性的人生哲學。本書將通過大量的實例和生動的故事，展現語言的這種“文化編碼”功能。我們將分析諸如“含蓄”與“直白”、“集體主義”與“個人主義”等文化價值觀，如何在語言的運用中得到體現，以及這些差異如何影響我們在溝通中的理解和判斷。例如，在一些東方文化中，委婉含蓄的錶達方式被視為一種修辭智慧，常常通過省略、暗示或者轉述來傳遞信息，以避免直接的衝突和冒犯。而在某些西方文化中，清晰、直接的溝通則被視為效率和誠意的錶現。當來自不同文化背景的人們進行交流時，這種語言使用習慣的差異，就可能導緻誤解的産生：一方可能覺得對方含糊其辭、不真誠，另一方則可能覺得對方粗魯、不禮貌。本書將深入剖析這些潛在的“文化陷阱”，並提供一些破譯這些陷阱的思路。除瞭文化價值觀的顯性影響，語言的深層結構，例如語法和句法，同樣對我們的思維模式産生潛移默化的作用。著名的語言學傢薩丕爾-沃爾夫假說（Sapir-Whorf Hypothesis）認為，我們所使用的語言塑造瞭我們的思維方式，甚至影響我們如何感知世界。本書將以更加通俗易懂的方式，探討這一假說的閤理之處，並展示語言結構如何影響我們對空間、時間、因果關係等基本概念的理解。比如，一些語言中名詞的性彆區分，可能潛移默化地影響著人們對男性和女性角色的認知；而另一些語言中動詞的復雜時態和語態，則可能影響人們對事件發生順序和主動被動性的理解。通過對這些語言現象的解讀，我們能更深刻地理解為何不同文化的人們，在麵對同一件事時，會産生如此不同的想法和反應。本書還將觸及“非語言溝通”這一同樣重要的領域。語言並非孤立存在，它總是伴隨著肢體語言、麵部錶情、眼神交流、語調變化等非語言信號。這些信號在跨文化交流中，同樣扮演著至關重要的角色，甚至有時比語言本身更能傳遞真實的情感和意圖。我們將探討不同文化對於眼神接觸、身體距離、手勢、錶情等非語言信號的解讀差異，以及這些差異可能引發的誤會。例如，在某些文化中，直接的眼神接觸被視為誠懇和尊重的錶現，而在另一些文化中，過度的眼神接觸則可能被解讀為挑釁或不敬。同樣，一些在特定文化中錶示友好的手勢，在其他文化中可能帶有負麵的含義。本書將通過大量的案例分析，幫助讀者認識到非語言溝通的重要性，並學習如何更準確地解讀和運用非語言信號，從而提升跨文化溝通的有效性。此外，本書還將探討語言在塑造集體認同和民族精神方麵所起的作用。語言是民族文化傳承的重要載體，它承載著一個民族的曆史記憶、價值觀念和審美情趣。當一個民族的語言受到威脅時，往往意味著其文化傳承麵臨危機。我們將迴顧一些語言瀕危的現象，並探討保護和傳承語言文化的重要性，以及它與跨文化理解之間的微妙聯係。本書的最終目標，是希望讀者能夠超越簡單的語言“詞匯-句子”的學習，而是能夠站在一個更高的視角，去理解語言的豐富性、多樣性和深刻性。我們希望能夠幫助讀者培養一種“跨文化敏感性”，即對不同文化背景下語言運用差異的敏感認識，以及由此産生的同理心和尊重。我們相信，隻有深刻理解語言背後的文化邏輯，掌握跨越語言和文化障礙的有效策略，我們纔能真正建立起通暢、真誠、富有成效的跨文化交流。這不僅僅是為瞭避免誤解和衝突，更是為瞭拓寬我們的視野，豐富我們的認知，最終實現人與人之間、文化與文化之間更深層次的理解與融閤。《語言的魔法：解密跨文化交流的奧秘》將是一次令人著迷的探索之旅。它將帶領你走進語言的奇妙世界，讓你看見語言不僅僅是溝通的工具，更是連接心靈、理解世界的鑰匙。無論你是語言學習者、跨國企業從業者、國際事務研究者，還是任何一位對世界充滿好奇的旅行者，本書都將為你提供全新的視角和寶貴的啓示，幫助你在日益多元化的世界中，遊刃有餘地構建起屬於自己的跨文化溝通之道。讓我們一同踏上這場關於語言、文化與理解的深刻旅程吧。

用户评价

评分☆☆☆☆☆

這本《口語機器翻譯》的橫空齣世，著實讓我這個長期混跡於技術前沿的翻譯工作者捏瞭一把汗，也捏瞭一把期待。我得承認，我一開始帶著一種近乎苛刻的審視態度來翻閱它的。畢竟，口語翻譯這個領域，它不像書麵翻譯那樣有章可循，它充滿瞭瞬息萬變的語境、潛颱詞、文化差異，以及最緻命的——人的情感波動。這本書的作者似乎深諳此道，他們沒有沉湎於對現有神經網絡架構的膚淺羅列，而是將筆觸深入到瞭“實時性”與“自然度”這對孿生難題之中。特彆是關於“延遲補償模型”的章節，我感覺作者在描述一個極其復雜的數學模型時，用詞卻異常的靈動，仿佛在描繪一場高速公路上兩輛賽車的競速，如何精確地在毫秒之間完成信息的交接而不至於發生碰撞。書中對跨文化交際語境對機器翻譯準確度的影響分析，更是鞭闢入裏，它不再是簡單地羅列“失禮”的翻譯案例，而是從認知心理學的角度去剖析，為什麼某些文化背景下的“停頓”或“語氣詞”在被機器處理時會造成災難性的後果。讀完這部分，我甚至開始重新審視我過去處理國際會議同傳時，那些依賴於直覺的瞬間判斷，作者提供瞭一套可以被係統化訓練的思維框架，這對於培養下一代高水平的口語翻譯人纔而言，無疑是提供瞭寶貴的理論基石。這本書的深度，絕非市麵上那些淺嘗輒止的“技術入門指南”所能比擬。

评分☆☆☆☆☆

我是一名母語非英語的播客製作人，長期緻力於將小語種的深度訪談內容推嚮國際。我購買過很多關於機器翻譯的書籍，但大部分都停留在“如何訓練一個基礎模型”的層麵。然而，《口語機器翻譯》卻極其罕見地深入探討瞭“語域（Register）”和“非正式語言的結構重塑”這一核心難題。你知道，在口語交流中，人們大量使用習語、俚語，甚至是自創的詞匯組閤。傳統MT係統麵對這些時往往會崩潰，直接輸齣一串無意義的字符。這本書的第三篇，用非常細膩的筆觸描繪瞭機器如何通過“意圖建模”而非“詞匯匹配”來重構這些非標準輸入。我印象最深的是關於“口頭語的結構簡化”一節，作者詳細解釋瞭機器如何識彆齣冗餘的填充詞（如“那個”、“你知道的”）並優雅地將其剔除，同時不損失原話的語氣和重點。這比單純的刪除要高明得多，它體現瞭一種對人類交流“效率”和“風格”的雙重尊重。這本書的排版和插圖也值得稱贊，大量的流程圖和對比矩陣，讓原本晦澀難懂的概念變得可視化、易於消化。對於像我這樣，需要將機器翻譯結果融入到高度風格化的內容創作中的人來說，這本書提供的工具和理念，簡直是雪中送炭。它教會我的不是如何寫代碼，而是如何讓機器“像人一樣說話”。

评分☆☆☆☆☆

這份評價或許會顯得有些跳躍，因為這本書給我的觸動，實在難以用綫性的邏輯來組織。我主要關注的是人機交互界麵（HCI）在口語翻譯中的應用，而這本書的第八章《情感反饋與動態調整機製》，徹底顛覆瞭我對“實時翻譯設備”的認知。它描述的不是那種“你說話，它翻譯”的簡單閉環，而是一個包含多模態輸入的復雜係統。作者提齣，理想的口語翻譯機器應該能實時捕捉說話者的麵部微錶情、手勢，並將其作為校準翻譯輸齣的輔助信號。例如，當翻譯輸齣與說話者麵部錶情顯示齣的“驚訝”程度不匹配時，係統應立即進行二次修正。這已經超越瞭純粹的“翻譯”，而是進入瞭“情境理解與情感同步”的範疇。書中對“主觀延遲容忍度”的探討也極其精妙，它指齣不同文化和不同任務（比如商務談判與朋友閑聊）對翻譯延遲的容忍度是天壤之彆，機器必須像一個經驗豐富的專業口譯員那樣，根據場域的變化，動態調整自己的響應速度。這本書的宏大視野讓我感到震撼，它把口語機器翻譯放在瞭人工智能、心理學乃至社會學的交叉點上進行審視，其學術深度和前瞻性，足以引領未來十年的研究方嚮。

评分☆☆☆☆☆

說實話，當我翻開《口語機器翻譯》時，我原本期望看到的是一堆堆炫酷的算法圖錶和最新的Transformer變體的對比分析。我錯瞭，這本書的價值，恰恰在於它“反技術堆砌”，而更側重於“應用哲學”的構建。我個人最大的感觸來自它對“口語輸入噪聲處理”那一部分的論述。我們都知道，現實中的口語環境是嘈雜的：背景噪音、說話者口吃、語速的忽快忽慢，這些都是書本上的理想化模型裏缺失的“真實”。作者沒有滿足於使用標準的降噪算法，他們提齣瞭一種基於“情感語義預測”的濾波器，我粗略地理解為，機器要先“聽懂”說話者的情緒傾嚮，纔能更好地過濾掉那些與核心語義無關的乾擾信息。這簡直是革命性的思路！這種思路將機器翻譯從單純的語言學任務，提升到瞭情境感知任務。而且，書中穿插的那些實際案例分析，選取的角度非常刁鑽，不是那種教科書式的完美對話，而是深夜酒吧裏的即興演講、法庭上激烈的質詢，甚至是病房裏醫生與傢屬之間充滿壓力的溝通。通過這些案例，我真切地感受到瞭作者對“機器輔助人類溝通”這一終極目標的虔誠與思考。這本書的敘事節奏非常流暢，它不會讓你覺得自己在啃一本冷冰冰的技術手冊，而更像是在聽一位經驗豐富的大師，娓娓道來他如何馴服這頭技術猛獸。

评分☆☆☆☆☆

我是一名資深的技術文檔編輯，平時的工作就是將各種晦澀難懂的技術規範轉化為普通人能理解的語言。因此，我對任何聲稱能處理“口語”的翻譯工具都抱持著懷疑態度，因為口語的歧義性和即時性，恰恰是文檔化最怕遇到的“敵人”。《口語機器翻譯》在這方麵的論述，簡直像是一部為我們這些“語言結構化”工作者量身定製的指南。我特彆欣賞它在“模糊信息處理與澄清策略”部分所提齣的觀點。作者認為，機器翻譯不應該一味追求“給齣答案”，而在某些高風險的口語場景中，更優策略是“請求澄清”或者“提供多重備選”。書中詳細分析瞭何時機器應該主動打斷，何時應該保持沉默等待上下文，這涉及到的決策樹邏輯之復雜，令人嘆服。它教會我們，完美的翻譯可能並不存在，但最負責任的翻譯一定是知道自己“不知道”的翻譯。這本書的語言風格極其嚴謹，但又不失啓發性，它像一位經驗老道的導師，不直接給你魚，而是教你如何辨彆哪些“魚”是有毒的。對於任何希望將口語機器翻譯技術落地到嚴肅、高風險領域的人士來說，這本書提供的安全邊界和倫理框架，其價值甚至超過瞭其技術細節本身。

评分☆☆☆☆☆

计算语言学研究滥觞于上世纪五六十年代的机器翻译研究。中文的相关研究也几乎同步开始，1960年起在柏克莱加州大学研究室，王士元、邹嘉彦、C.Y.Dougherty等人已开始研究中英、中俄机器翻译。他们的中文计算语言学研究，可说是与世界最尖端科技同步的。中国国内中俄翻译研究也不遑多让，大约在上世纪50年代中期便已开始。可惜的是，这些中文相关早期机器翻译研究，由于硬件与软件的限制，没能延续下来。中文计算语言学研究比较有系统的进展，还要等到1986年；海峡两岸在同一年成立了两个致力于中文计算语言学基础架构建立的研究群。北京大学的计算语言学研究所在朱德熙先生倡导下成立，随后一段时间由陆俭明、俞士汶主持。而台湾“中研院”的中文词知识库小组，由谢清俊创立，陈克健主持，黄居仁1987年返台后加入。

评分☆☆☆☆☆

棒性和系统的自适应能力。同书面语相比，口语的声学特性有一定的特殊性，这类语音的基频、时长、幅度等特征都随表达内容、感情色彩等不同，变化的范围比朗读语音大得多，同时还有非语声信号和噪声，充分研究这些特性，建立精细的声学模型非常重要。而且，讲话人往往是在较强的背景噪声或多讲话人环境下发音的，如果是电话自动语音翻译系统，还存在通讯干扰等其他因素的影响，因此，提高语音识别在不同说话人、不同声学环境及通道条件下的鲁棒性，在口语翻译系统中尤其重要。另外，在语言学层面，口语句子中含有大量的修正、重复、口头语、省略等非规范语言现象，研究这些特征，对语言模型进行完善，包括建模、算法和训练等各个方面，将有助于提高语音识别的正确率。

评分☆☆☆☆☆

（2）翻译方法有待于进一步研究。尽管统计翻译方法具有较高的鲁棒性，但是，对非规范语言现象和噪声的处理能力仍然十分有限，而且这种方法与训练语料的规模和质量密切相关。统计方法与规则方法的结合一直是人们所追求的，但是具体如何融合，多翻译引擎以什么样的集成方式可以获得最好的系统性能，统计模型赖以训练的语料规模达到多大才算充分，非语言信息（手势、表情、说话人角色等）如何融人翻译模型等，诸多问题都远远没有得到解决。

评分☆☆☆☆☆

计算语言学（Computational Lingljistics，CL）在语言科学与信息科学的研究领域扮演关键性的角色。语言学理论寻求对语言现象规律性的揭示与完整的解释。计算语言学正好提供了验证与应用这些规律与解释的大好机会。作为语言学、信息科学乃至于心理学与认知科学结合的交叉学科，计算语言学更提供了语言学基础研究与应用研究的绝佳界面。事实上，计算语言学与人类语言科技（Human Langllage Technology，HLT）可以视为一体两面，不可分割。

评分☆☆☆☆☆

精彩书摘