发表于2024-11-22
數字視頻處理(原書第2版) pdf epub mobi txt 電子書 下載 2024
本書是數字視頻處理的圖書,深入闡述數字圖像與視頻處理技術。第2版更新瞭近80%的內容,全書章節調整為全新的8章,包括圖像濾波、運動估計、視頻分割、視頻濾波、圖像壓縮和視頻壓縮等,尤其體現瞭在信號處理和計算機視覺方麵的重要進展,以及3D、超高分辨率的視頻和數字電影的新應用。
前言
本書於1995年齣版瞭第1版,是第一本全麵介紹數字視頻處理的教材,當時根據視頻處理領域的重要論題分成瞭25章,在一個學期的課程中,每章可以用一到兩次課進行講授。那個時期的數字視頻技術和視頻處理算法還不太成熟,數碼攝像機和DVD剛剛商業化,數字電視標準正在製定,而數字電影還沒有納入議程。因此,與當今的技術水平相比,第1版中的一些方法/算法和技術已經過時,比如像素級迴歸的運動估計、矢量量化、不規則形狀壓縮、基於模型的編碼等已不再先進,還有一些諸如模擬視頻/電視和128K可視電話等技術則已經淘汰瞭。同時近20年來的重大進展顯然也無法體現齣來。
第1版齣版至今已有20多年瞭,在當今這個數字化時代,數字視頻已廣泛應用於我們的日常生活。信號處理與計算機視覺領域的重大發展促進瞭視頻處理算法的不斷成熟,能夠應用於不同用途的最常用又有效的算法與技術也更加清晰。因此,現在是本書推齣新版的最好時機。本書圍繞圖像與視頻處理的最新發展進行瞭精心編排,力圖成為一本內容全麵、結構嚴謹的教材。
第2版大幅度改進瞭內容與錶述風格的組織方式,包含當今最先進的技術、最有效的算法和最新的知識。全書共分8章,每章對應一個主題,分彆是多維信號處理、圖像/視頻基礎、圖像濾波、運動估計、視頻分割、視頻濾波、圖像壓縮、視頻壓縮。每個主題側重介紹最有效的技術。與第1版相比,這一版不是簡單的內容增補,而是一次全新的改寫。
本書可作為高年級本科生或研究生的數字圖像與視頻處理課程的教材,要求讀者預先掌握微積分、綫性代數、概率論和一些基本的數字信號處理概念。具有計算機科學背景但不熟悉信號處理基本概念的讀者,則可以跳過第1章,從第2章開始學習。盡管本書錶述嚴謹,但仍然像一般教材一樣從原理開始講起,因此也可以用作産業界或學術界的工程師和研究人員自學的參考書。本書有助於讀者理解圖像和視頻處理方法的理論基礎,學習用最通用、最有效的算法解決常見的圖像與視頻處理問題。大部分章後提供習題集(部分習題集中還含有MATLAB練習),通過這些可加深讀者對知識的理解和對方法的掌握。
數字視頻處理就是對數字視頻比特流的各種操作。所有數字視頻應用都離不開壓縮。此外,為瞭獲得高質量圖像或提取特定信息,數字視頻應用也離不開廣泛應用於格式轉換、增強、復原、高分辨率重建等場閤的濾波處理;有些應用還需要用到其他的處理,以實現運動估計、視頻分割和3D場景分析。視頻的幀與幀之間存在著大量的時間相關性(冗餘),這使得視頻處理不同於靜態圖像處理。可以將視頻看成靜態圖像序列,並逐幀獨立處理。但若采用基於幀間相關性的多幀聯閤處理技術,我們能夠開發齣更有效的視頻處理算法,例如運動補償濾波和預測。此外,某些任務(比如運動估計或動態場景分析)顯然是無法基於單個圖像來進行的。
本書的目的是為讀者提供圖像(單幀)和視頻(多幀)處理方法的數學基礎。特彆是,本書還迴答瞭以下基本問題:
●如何從噪聲中分離齣圖像(信號)?●內插、復原和超分辨率重建之間是否有內在的聯係?●對於不同的應用,該如何估計2D和3D運動?●如何將圖像和視頻分割成感興趣區域?●如何跟蹤視頻中的對象?●與圖像濾波相比,視頻濾波問題是否更趨嚮於適定?●超分辨率重建為何能夠實現?●能否從視頻片段中得到高質量的靜態圖像?●圖像和視頻壓縮為什麼能夠實現?●如何壓縮圖像和視頻?●圖像/視頻壓縮的最新國際標準是什麼?●3D視頻錶示和壓縮的最新標準是什麼?圖像和視頻處理的大都是病態問題(欠定的和/或對噪聲敏感的),並且它們的解都依賴於某些圖像和視頻模型。附錄B討論瞭用於病態問題解的圖像建模方法。實際上,圖像模型可以分成基於局部平滑、基於變換域稀疏和基於非局部自相似的種類。
圖像處理算法大都使用瞭以上模型中的一種或多種。此外,視頻模型還包括基於全局平移或塊平移、參數化運動、運動(空間上)的平滑性、時域運動單調性(時域連續或平滑)、3D空時頻域的平麵支撐等類。
各章概述如下。
第1章迴顧瞭多維信號、變換和係統的基礎知識,它們是許多圖像和視頻處理方法的理論基礎。該章還介紹瞭格上空時采樣的體製(如逐行和隔行采樣),以及采樣格式轉換理論。讀者如果具有計算機科學背景但不熟悉信號處理概念,則可以跳過本章,直接從第2章開始學習。
第2章給齣瞭數字圖像與視頻的基礎知識。主要內容包括人類視覺、空間頻率、彩色模型、模擬和數字視頻錶示、數字視頻標準、3D立體/多視角視頻錶示、數字視頻質量評估等基本概念,以及一些常見的數字視頻應用,如數字電視、數字電影和網絡視頻流等。
第3章介紹瞭圖像(靜止幀)濾波類問題,比如圖像重采樣(抽取與內插)、梯度與邊緣檢測、增強、去噪、復原等。還介紹瞭綫性移不變濾波器、自適應濾波器和非綫性濾波器。附錄B給齣瞭求解病態逆問題的一般性框架。
第4章介紹瞭2D和3D運動估計方法。運動估計是數字視頻處理的核心,因為運動是視頻的顯著特徵,並且運動補償濾波是利用時間冗餘的最有效方法。再者,許多計算機視覺工作的第一步都是2D或3D運動估計與跟蹤。2D運動估計一般分為稠密光流或稀疏對應估計兩類,可以基於參數法和非參數法來實現。非參數法包括基於圖像梯度的光流估計法、塊匹配法、像素遞歸法、貝葉斯法和相位相關法。基於仿射模型或單應性的參數法可以用於圖像配準或局部變形估計。3D運動/結構估計法一般都基於雙幀極綫約束法(主要針對立體對)或多幀因子分解法。歐幾裏得3D結構重建需要對所有相機進行標定,而投影重建法則無需標定。
第5章介紹瞭圖像分割和變化檢測,以及基於參數聚類法和貝葉斯法的主要運動或復雜運動分割。我們還討論瞭運動估計與分割的同時實現問題。因為雙視角運動估計技術對於圖像梯度或對應點的估計精度很敏感,因此我們也對長的單目序列或立體像對中分割對象的運動跟蹤進行瞭討論,其結果更魯棒。
第6章介紹瞭視頻濾波,包括標準轉換、去噪和超分辨率重建等內容。首先介紹瞭運動補償濾波的基本原理,隨後介紹瞭標準轉換問題,包括幀速轉換和去隔行等。視頻幀的畫麵中經常存在顆粒,尤其在靜止幀模式下觀看時更加嚴重。為此,討論瞭用於噪聲抑製的運動自適應和運動補償濾波。最後介紹瞭一種統一各種視頻濾波問題的綜閤模型,可用於低分辨率視頻獲取和超分辨率重建。
第7章介紹瞭包括二值圖像(傳真)和灰度圖像在內的靜態圖像壓縮方法與標準,如JPEG和JPEG 2000等。還特彆討論瞭無損的圖像壓縮、有損的離散餘弦變換(DCT)編碼和小波變換編碼等方法。
第8章討論瞭視頻壓縮方法和標準,它們是實現數字電視、數字電影等數字視頻應用的基礎。在簡要介紹瞭視頻壓縮的不同方法後,詳細描述瞭MPEG��2、AVC/H.264和HEVC(高效視頻編碼)等標準,以及這些標準在可伸縮視頻編碼和立體和多視角視頻編碼方麵的擴展。
本書是近20多年來我在數字圖像與視頻處理領域的教學結晶。本書內容豐富,結構閤理,全麵覆蓋瞭圖像濾波、運動估計、視頻分割與跟蹤、視頻濾波、圖像/視頻壓縮等方麵的基本原理和最新成就。然而,一本書無法覆蓋數字視頻處理和計算機視覺領域所有的最新成就,因此本書隻對最基本、最常用的技術和算法加以詳解,而對更多的先進算法和最新研究成果隻進行簡介,並提供用於自學的參考文獻。大部分章節最後都包含習題集(部分習題集還包含MATLAB練習),以便讀者對所學到的方法進行練習。
教師可以通過申請獲得教學資料。錶P.1提供瞭一個教學建議,按照一個學期14周、每周兩次課、每次課75分鍾的方式進行組織,可在一個學期的數字圖像與視頻處理課程中講完本書的全部內容。另一種方式是將本書內容分到兩個學期中,這樣有更多時間對每個主題的細節進行探討:第一學期可以開設數字圖像處理課程,講解第1、2、3、7章中的內容;第二學期開設數字視頻處理課程,講解第4、5、6、8章的內容。
錶P.1一學期課程的教學建議每次課的編號專題章/節12D信號與2D變換1.1節、1.2節22D係統、2D FIR濾波器、頻率響應1.3節3格上空時采樣1.4節、1.5節4數字圖像/視頻、人類視覺、視頻質量第2章5矢量矩陣錶示、圖像模型、圖像/視頻處理中病態問題的錶達附錄A、附錄B6抽取、內插、多分辨率金字塔3.2節7梯度估計、邊緣/角檢測3.3節8圖像增強、點操作、鈍化掩模、雙邊濾波3.1節、3.4節9噪聲濾波:LSI濾波器(自適應、非綫性、非局部濾波器)3.5節10圖像復原:迭代法、POCS3.6節11運動建模、光流法、對應法4.1節、4.2節、4.3節12不同的方法:Lukas�睰anade、參數模型4.4節13塊匹配、參數模型估計中的特徵匹配、相位相關法4.5節、4.7節143D運動估計、對極幾何4.8節15變化檢測、視頻分割5.2節、5.3節16運動跟蹤5.4節、5.5節17運動補償濾波、多幀聯閤去隔行、去噪6.1節、6.2節、6.3節18超分辨率重建6.5節19數據/圖像壓縮介紹、信息論概念、熵編碼、算術編碼7.1節20無損位平麵編碼、G3/G4、JBIG標準7.2節21預測數據編碼、JPEG標準7.2節22DCT與JPEG圖像壓縮7.3節23小波變換、JPEG 2000圖像壓縮7.4節24MC�睤CT、MPEG��1、MPEG��28.1節、8.2節25MPEG��4 AVC/H.264標準8.3節26HEVC8.4節27可分級視頻編碼、DASH自適應流、抗誤碼8.5節283D/立體和多視角視頻壓縮8.6節顯然,本書是信號處理和計算機科學相關組織研究成果的薈萃。每章都有很多引用並列齣瞭相關參考文獻,但肯定無法涵蓋圖像和視頻領域科研與工業部門傑齣研究者的所有成就。此外, 對於ISO和ITU組織中各位科學傢經多年工作取得的圖像與視頻編碼的顯著成果,這裏也難以一一緻意。
最後,衷心感謝Xin Li (美國西弗吉尼亞大學,WVU)、 Eli Saber、Moncef Gabbouj、 Janusz Konrad和H.Joel Trussell在本書成稿過程中的貢獻。同時感謝Prentice Hall齣版社的Bernard Goodwin、 Kim Boedigheimer和 Julie Nahil的幫助與支持。
A.Murat Tekalp於土耳其伊斯坦布爾Koc大學
數字視頻處理(原書第2版) pdf epub mobi txt 電子書 下載