中文字幕高清在线,中文字幕在线电影观看,中文字幕在线看,免费国产一区二区三区,男攻调教双性男总裁,热热涩热热狠狠色香蕉综合,亚洲精品网站在线观看不卡无广告

運動估計快速搜索算法的研究的論文

時間:2021-02-26 18:47:28 論文 我要投稿

關于運動估計快速搜索算法的研究的論文

  摘要:h.264是itu-t的vceg(視頻編碼專家組)和iso/iec的mpeg(活動圖象編碼專家組)的聯(lián)合視頻組(jvt:joint videoteam)開發(fā)的一個新的數(shù)字視頻編碼標準,它既是itu-t的h.264,又是1so/iec的mpeg-4的第10部分。新一代標準h.264可以得到更好的壓縮圖像效果、擁有更多的功能和更大的靈活性。本文主要從實時視頻應用的角度,對h 264/avc編碼過程中運動估計模塊快速搜索算法進行了研究。

關于運動估計快速搜索算法的研究的論文

  關鍵詞:視頻編碼 h 264/avc 運動估計 快速搜索算法

  隨著信息技術的發(fā)展和社會的不斷進步,人類對信息的需求越來越豐富,人們希望無論何時何地都能夠方便的、快捷、靈活的通過語音、數(shù)據(jù)、圖像與視頻等多種方式進行通信。數(shù)字信號處理技術、物理媒體與網(wǎng)絡技術、超大規(guī)模集成電路技術突飛猛進的發(fā)展,使得多媒體通信成為研究和應用的熱點。本文主要是針對視頻壓縮中的運動估計快速搜索算法的研究。視頻壓縮后的數(shù)據(jù)流大小的關鍵因素在于能否較好的去除其時間相關性,尋找到最佳的匹配塊。

  1.h.264/avc概述

  與早期的視頻編碼標準(h.261,mpeg-1,mpeg-2,h.263,mpeg-4)類似,h.264/avc也是建立在塊匹配的混合編碼框架上;舅惴ㄒ廊皇峭ㄟ^幀間預測和運動補償來消除視頻序列中的時域冗余,經(jīng)過變換編碼消除頻域冗余。因此基本的功能模塊:例如預測、變換、量化、編碼都沒有發(fā)生根本的變化。

  2.運動估計原理

  2.1運動估計概述

  在基于塊匹配的混合視頻編碼體系中,運動搜索是其中計算復雜性最高的模塊。h.264/avc為了獲得更精確的預測和更高的壓縮比,采用了多種塊模式的運動估計,多參考幀和更高分辨率的運動矢量。雖然這樣可以增加預測的精度,提高壓縮比,但h.264/avc中運動估計的計算復雜性卻因此急劇增加。

  運動搜索快速算法的實質是基于某種策略在減少搜索點數(shù)提高搜索效率的同時,盡可能保持編碼圖像質量不變(與fs的情況相比)。但簡單的減少搜索點數(shù)的算法(例如tts,2-d對數(shù)等快速算法)通常都假設匹配誤差曲面是單峰的,而實際的視頻圖像是非常復雜的,常常不能滿足這樣的假設,因此容易在搜索起始階段落入局部最小點。為解決局部最小點的問題,通常可以采用相鄰塊預測的方法獲得更好的搜索起點。但有些情況下特別是在運動復雜度高的序列中,相鄰塊會包含與當前塊不同的運動對象,因此也會產生錯誤的運動矢量。更好的策略是采用覆蓋整個搜索區(qū)域的全局搜索(global search)的概念,即搜索點在整個搜索區(qū)域的稀疏網(wǎng)格上選擇。雖然這種策略增加了搜索點數(shù),但可以有效的避免在搜索起始階段落入局部最小點以及可能的錯誤起始點預測。

  2.2運動搜索的步驟

  最佳匹配塊的確定是通過運動搜索來實現(xiàn)的,運動搜索包含整數(shù)運動搜索和小數(shù)運動搜索,具體的流程圖如圖2.1所示:

  2.2.1參考幀的選取

  在h.264協(xié)議中,定義了三種基本的幀類型,即i、p、b幀類型,其中i幀只能作為其他幀的參考幀,它本身在編碼的時候,幀內宏塊根據(jù)已經(jīng)編編碼的相鄰塊的數(shù)據(jù)來編碼,不參考其它幀;p幀在編碼的時候,只能參考在時間軸上靠前的幀,包括之前已經(jīng)編碼的i幀以及p幀,即前向預測;b幀則可以雙向預測,它的參考幀可以是時間上“過去”的幀。也可以是時間上“將來”的幀,它的參考幀也可以是i幀以及p幀,b幀只能參考其它幀,其本身不能作為其他幀的參考幀,所以他不會引起預測誤差擴散。在具體的編碼中,當遇到b型幀時,先把它讀到緩存中,編碼后面的p幀,當前后的參考幀都被編碼以后,再編碼b幀。在解碼端,當解碼解到b幀時,則先將它讀入緩存,待到解碼完它后面的p幀,再解碼b幀。

  2.2.2預測運動向量的獲取

  如果對每個塊的運動矢量進行編碼,那么將花費相當數(shù)目的比特數(shù),特別是在選擇小尺寸的塊的情況下。由于一個運動物體會覆蓋多個分塊,所以空間域相鄰塊的運動矢量具有很強的相關性。因此,每個運動矢量可以根據(jù)臨近先前已編碼的塊進行預測,預測得到的運動矢量用mvp表示,當前矢量和預測矢量之間的差值用mvd表示。同時由于物體運動具有連續(xù)性,運動矢量在時間域也存在一定的相關性,因此也可以用臨近參考幀的運動矢量來進行預測。

  2.2.3搜索范圍的確定

  當獲取了預測運動向量以后,在參考幀中找到當前塊的對應塊,此點即對應運動向量(o,o),并以此為基點,向其上下左右擴出運動搜索范圍大小,此即我們需要的運動搜索范圍。

  搜索區(qū)域的選擇一般是相對于當前塊對稱得,左邊和右邊各有d個像素,上邊和下邊各有d個像素。

  3.一種新的運動估計快速搜索算法

  這些年來,許多的快速搜索算法都被提了出來,其中比較好的有三步法,四步法,菱形搜索法等等,它們與全搜索算法相比節(jié)省了大量的運動時間。可是這些算法中大部分不論在水平還是在垂直方向上都是規(guī)則對稱的.,三步法和四步法等等都是如此,但是在實際的運動圖像當中都是水平方向的運動要遠比垂直方向的運動要劇烈的多,這是因為對于一個以常見的現(xiàn)實世界為內容的視頻序列來說,它的前后幀之間的差異來源主要有兩個方面:視頻目標的運動和視頻獲取設備的運動。視頻目標的常見運動集中在水平方向,如汽車和火車的行駛,行人在路上走等;而攝像機的運動一般以平動和水平轉動為主,所以運動向量就應該是以水平方向的運動向量為主。

  從運動向量的搜索過程中我們可以得知,后步的搜索都是建立在前一步的基礎上的,每一步都為下一步指出了運動向量所在的大致方向,而運動向量又是以水平方向的運動向量為主,所以本算法中第一步以偏水平方向的十字搜索模板作為搜索基礎。

  基于偏水平十字及偏向雙鉆石搜索算法(dhcdds)主要是將兩種搜索模版相結合盡可能的以最小的搜索時間準確的確定最佳匹配點,一種是偏水平十字型搜索模板,另一種是偏向雙鉆石搜索模板,其中第一個偏水平十字搜索模板主要是根據(jù)視頻圖像的運動變化主要是集中在水平方向上的特點來初步確定搜索的基本位置,第二個偏向雙鉆石搜索模板是根據(jù)偏水平十字搜索模板的初步定位,進一步使用搜索效果比較理想的雙鉆石搜索模板來確定當前最佳匹配點,直到當前最佳匹配點在中心點或偏中心點才結束搜索過程,然后通過比較幾個候選點的sad值的大小來確定最佳匹配點的位置。該快速運動估計搜索算法所要搜索的點數(shù)較少,提高了編碼效率。

  4.結語

  本文主要對于視頻壓縮中的運動估計快速搜索算法進行了簡單的研究。視頻壓縮后的數(shù)據(jù)流大小的關鍵因素在于能否較好的去除其時間相關性,尋找到最佳的匹配塊。實驗表明在信噪比和比特率變化很小的情況下,搜索時間大為縮短。文中提出的算法僅僅采用了搜索模板的改變來提升搜索速度,相信再結合其他提升搜索速度的辦法,比如說提前終止技術等,就能在此基礎上進一步的提高搜索速度。由于運動估計占了h.264編碼時間中的大部分,所以運動估計搜索速度的提高對于h.264的編碼效率是很重要的。

【運動估計快速搜索算法的研究的論文】相關文章:

運動損傷的預防研究論文02-19

NLOS環(huán)境下信道估計輔助的精確TOA估計論文04-28

學生運動時快速能力的培養(yǎng)論文12-02

航天器桁架結構快速設計方法研究論文04-15

圓周運動的高端備課研究論文11-01

如何培養(yǎng)學生運動時的快速能力教育論文02-18

牛頓第一運動定律研究的論文11-01

排舞運動的文化價值開發(fā)研究論文10-06

運動員心理訓練的應用與研究論文02-18