歡迎登錄中國視覺網!
學術論文頻道
ACADEMIC PAPERS
位置導航:首頁 >> 學術論文 >> 專業論文 >> 基于冗余小波變換的運動估計及DSP實現

基于冗余小波變換的運動估計及DSP實現

發布時間:2019-02-21     來源:中國視覺網       訪問次數:5100


摘要:在視頻壓縮技術中,運動估計是視頻處理系統的一個重要組成部分,同時也是最耗時的一部分。本文提出了一種結合冗余小波變換的運動估計算法,有效地減少了運動估計的運行時間,并在TI公司的TMS320DM642芯片上驗證了該算法的實時性。
關鍵詞:冗余小波;運動估計;視頻壓縮;DSP


Motion Estimation Based on Redundant Wavelet Transform and Its DSP Implementation

Abstract: In the technology of video compressing, motion estimation is the important part of the video compressing system and the most time-consuming part. This article brings forward a new motion estimation algorithm based on redundant wavelet transformation and effectively cuts down the time of the motion estimation. We use the TMS320DM642 to test and verify our algorithm.  
Key words: redundant wavelet; motion estimation; video compression; DSP

1  引 言
   在視頻壓縮算法中,運動估計是非常重要的一部分,運動估計也是視頻壓縮過程中耗時最長的一部分,約占整個壓縮過程運行時間的50%左右[1],所以在保證估計的準確度基礎上減少運動估計運行時間成為視頻壓縮的研究熱點之一。目前運動估計通常采用的搜索算法有:全搜索算法,二維對數算法,“鉆石”搜索算法。全搜索算法一定能夠找到最優的匹配塊,但是計算復雜度很高,硬件實現全搜索算法非常困難。二維對數算法和“鉆石”搜索算法能夠有效減少計算的復雜度,但是搜索到的結果可能是局部最優點,而不是全局最優點。這些算法都是在時域進行,而在變換域進行運動估計則引起了人們的關注。對此文獻[2]提出了冗余小波變換域運動估計方法,利用小波變換的空間方向性,提高搜索精度,但是運算復雜度大,精度不穩定,不利于硬件實現。文獻[3]也提出了一種基于二維小波變換域的運動估計算法,同傳統的時域運動估計相比,可以節省大量的搜索匹配時間,但小波變換不具有平移不變性,在小波變換域內無法確定相鄰幀之間的平移運動,因而會造成大量的誤配預測,從而降低運動補償的效果。
   通過以上分析,我們提出了一種通過冗余小波變換獲得運動特征點和潛在運動區域并在時域進行運動估計的變換域、時域相結合的運動估計算法,在保證匹配的準確性同時有效的減少了搜索匹配時間,并在TI公司的TMS320DM642芯片開發板上驗證其實時性。
2  冗余小波變換運動估計方法
   冗余小波變換近似于連續小波變換,是除去了下采樣的傳統離散小波變換DWT。本文冗余小波變換所采用的基函數為Haar基函數,其尺度函數與小波函數的定義分別為:

   L為小波變換級數。對圖像進行二維冗余小波變換可以先對圖像的行進行一維變換,然后再對列進行一維變換。


2.1冗余小波變換產生運動特征點
   由于冗余小波變換沒有下采樣,不同尺度的時間抽樣率固定,離散小波變換固有的平移變化在這里也消除了,冗余小波變換的結果各子帶的大小與輸入信號的大小相同。本算法采用相鄰尺度子帶系數相乘后求和的方法得到模板[2],計算所有像素點的模板值,如果大于預設的閾值,即確定該點為特征點。這樣整個圖像的運動特征點就確定下來。
模板公式如下:



2.2潛在運動區域的提取

   結合了冗余小波變換的各子帶系數高度相關、方向選擇性、各子帶與輸入信號大小相等以及平移不變的性質,在冗余小波變換域提取潛在運動區域模板。模板由多子帶組成包括近似子帶(LL)、低-高子帶(LH)、高-低子帶(HL)、高-高子帶(HH):



2.3時域運動估計

   通過提取潛在運動區域,可以對前面獲得的運動特征點進行進一步篩?。杭床輝誶痹讜碩虻腦碩卣韉愕腦碩噶恐苯由櫛?/span>0,不進行運動估計,只對落在潛在運動區域的運動特征點進行運動估計。運動估計算法類似于傳統的宏塊匹配法,即在當前幀以特征點為中心取得16*16的宏塊,然后在參考幀以該點位置為中心的64*64(對于圖像邊緣的特征點的搜索,會隨著到邊界的的距離而調整搜索窗)的范圍內搜索匹配宏塊,位移差即該頂點的運動矢量。本文采用的最佳匹配準則為絕對幀間差平均準則(SAD) [4],其數學表達式為:


3  運動估計方法的DSP實現
   本文采用TI公司的TMS320DM642芯片實現該運動估計算法。TMS320DM642是TI公司最新推出的一款針對多媒體處理領域的DSP芯片,芯片內核采用先進的超長指令字(VLIW)結構,每個時鐘周期最高可提供8條32位指令,具有高度的并行性和快速的運行能力。有500MHz/600MHz/720MHz三種時鐘頻率,如果選用600MHz時鐘頻率,其最大處理能力可達到4800×106條指令/s。TMS320DM642芯片在C64系列的基礎上增加了很多外圍設備和接口。

3.1算法實現及流程圖:
   首先主機通過PCI初始化DSP并對其加載程序。DSP開始運行主程序程序, 攝像頭采集的視頻為PAL制, 通過A/D轉換芯片SAA7115轉化成數字信號,得到的數字圖像大小為720*576個像素,4:2:0 格式的YCbCr信號。經過DM642芯片編碼處理后,重建圖像則通過D/A轉換芯片SAA7105轉化成模擬信號輸出到顯示器。程序設計主要采用了TI公司推薦使用的TMS320DM642 Video Port Mini-Driver即視頻端口微型驅動函數。視頻設備硬件驅動一般分為上下兩層,底層為IOM驅動,上層為FVID模式。FVID實際上是DSP/BIOS GIO驅動的簡單封裝。FVID為視頻圖像的輸入和輸出提供了標準的APIs接口。使用FVID提供的函數可以有效地減少便寫代碼的工作量,并且只需要少量修改便可以很方便地將寫好的程序移植到不同的DSP芯片上去,提高了程序適用的靈活性。算法的程序流程圖如圖1所示,其中輸入為原始的視頻序列,經過DCT變換,量化以及運動估計和補償,最后通過VLC變長編碼得到最終的視頻壓縮編碼結果。


圖1 算法程序流程圖

Fig.1 the flow of the algorithm



3.2程序優化處理

由于圖像處理的數據量大,數據處理相關性高,并且具有嚴格的幀、場時間限制,因此如何針對圖像處理的特點對DSP 進行優化編程,充分發揮其性能就成為提高整個系統性能的關鍵。我們從如下幾個方面進行考慮[5~8]:

(1)存儲空間的考慮:DSP存儲空間的配置十分重要。因為DSP對不同的存儲單元的訪問速度是有區別的,對片內寄存器的訪問速度最快,對片內RAM的訪問速度比片外RAM的訪問速度快。因此合理地配置和使用存儲空間,對系統整體效率影響很大。應該盡可能地把訪問比較頻繁的常數表和代碼段裝入片內RAM,如果過大,則把其中一部分裝入片外存儲器。

(2)使用庫函數:TI公司對TMS320DM642的用戶提供了功能強大的IMAGE LIB庫支持。在這個庫中,包含許多常用函數,可以完成DCT/IDCT變換、小波變換、DCT量化等功能。

這些函數都是優化過的,完全能夠實現軟件流水,效率很高。

(3)高速緩存優化:最大化高速緩存的效率是實現總體視頻編碼性能目標的關鍵因素之一。高效的高速緩存可減少由于存儲器活動而造成的CPU停止響應,從而提高處理器的吞吐量。

(4)匯編級的優化:對于程序中特別影響速度的地方,如運動估計、運動補償等部分可以改為線性匯編程序。線性匯編是C6000系列DSP所特有的類匯編工具,只需按照C代碼的自然順序,寫出線性匯編語句,不必考慮功能單元的分配,以及指令的并行性。因此,它比編寫純匯編語句耗時要少,又具有較高的執行效率。DM642強大的匯編優化器通過對輸入的線性匯編代碼分配寄存器和循環優化,能夠將匯編程序轉化為利用流水線方式的高速并行匯編程序。

4  實驗結果及討論
   為了說明本文所述方法的效果,我們先在PC機上分選用fish﹑workman和tennis三個視頻序列,圖像大小都為352*288,幀數都為10幀。使用本文提出算法的對三個視頻序列進行運動估計并編碼,最后解碼輸出,軟件環境為VC++6.0,結果如下:



   由此可見,使用本文所提出的運動估計算法進行視頻壓縮后,解碼可以良好地恢復圖像。同時我們還使用MPEG_4SVP壓縮標準對fish序列﹑workman序列和tennis序列進行壓縮,軟件環境為VC++6.0,并比較運行時間,結果見表1。


對于算法的DSP實現,我們在DM642 EVM開發板上實現該算法,從攝像頭端獲取圖像,到DSP芯片算法處理,最后顯示器端重建回放,每秒可以處理25幀左右,基本達到了實時性。

   對于冗余小波變換帶來的額外時間消耗,我們將小波變換的級數限制在3級以內,但算法的性能也因此受到了限制。本文提出的算法跟目前成熟的運動估計算法如鉆石搜索算法﹑三步法相比,當相鄰幀變化緩慢時(如可視電話?。┚哂幸歡ǖ撓攀?,而當相鄰幀運動變化大而多時,則該方法不具有明顯的優勢甚至要差一些。原因不僅在于小波變換所帶來的時間消耗,而且潛在運動區域將增大,限制搜索域的作用也會減小,此時PMA基本上接近宏塊運動估計搜索域,所以算法性能有所下降。另外該算法對數據量的壓縮比與目前成熟的壓縮算法(如h264)的壓縮比還有一定的差距,這些方面的改進都是日后研究的重點。


5  結 論
   本文提出了一種新型的基于冗余小波變換的運動估計算法,與傳統的宏塊匹配法相比,減少了運算量,通過理論研究和實驗分析,運動潛在區PMA與宏塊搜索方法結合提高了兩者的效率。我們在DM642DSP芯片上驗證了其實時性,該算法可以減少搜索時間,并良好地恢復原始圖像。所以冗余小波變換應用在視頻圖像運動估計和補償上,有很大的發展前景,有待于進一步的深入研究。

參考文獻:

[1] 李群迎,張曉林,劉榮科,姚 遠. 基于TMS320C64x DSPs的MPEG-4實時編碼器設計與實現. 電子技術應用,2005年07期
[2] Suxia Cui, Yong Wang, and James E.Mesh-Based Motion Estimation And Compensation In The Wavelet Domain Using A Redundant Transform.Fowler. IEEE ICIP 2002
[3] Zhang Y-Q and Zafar S.Motion-compensated wavelet transform coding for color video compression. IEEE Transactions on Circuit and SyStems for Video Technology, 1992,2(3): 285~296
[4] 靳濟芳.VisualC++小波變換技術與工程實踐.北京:人民郵電出版社
[5] 宋勝利,曾巒.基于DM642 EVM的MPEG_4編碼器實現.國外電子測量技術,2005年06期
[6] 郭棟,王志良,李正熙,張永忠.基于DSP的實時圖像處理系統.微計算機信息,2005年03期
[7] 郭卓鋒,丁艷.基于DSP的實時圖像處理系統的設計.光學技術,2004年01期
[8] 尹黎明,王玲.運動估計算法及其DSP優化.咸寧學院學報,2005年03期














重庆时时彩在线直播软件 玉米收割机赚钱吧 甘肃十一选五推荐 体彩p5跨度走势图带连线 成都福彩中心官网 山东时时彩计划软件 华东15选5投注技巧 浙江省体育彩票 手机共享wifi 赚钱 怎样才能在直播中赚钱 华人彩票平台骗局 七座suv怎么赚钱 国内航空飞马尼拉航线赚钱么 版主6肖6码 上证指数历年k线图 正版官方真人欢乐捕鱼