MPEG-4編碼器在Intel PXA27X平臺上的實現(xiàn)
0 引 言
隨著人們對消費類電子產(chǎn)品(如,,等)需求不斷增加,特別是對高質(zhì)量高清晰多媒體的要求越來越高,因此視頻質(zhì)量已經(jīng)成為廣大消費者關(guān)注的焦點之一。在視頻的格式方面,一些國際組織和大公司分別提出了自己的標準,如ISO組織的一2,一4,微軟的WMV等。
針對公司的PXA27X處理器(這是一個包含 Wireless MMX技術(shù)基于 Xscale的處理器),以XVID 一4為基礎(chǔ),針對MPEG一4在操作系統(tǒng)中實現(xiàn)視頻的編碼要求。在此首先介紹MPEG一4視頻標準,緊接著闡述視頻標準的關(guān)鍵技術(shù)和MPEG一4視頻編碼軟件部分,最后還介紹了優(yōu)化方法和實際平臺的測試。
l MPEG一4是視頻標準
MPEG一4視頻部分是MPEG一4標準的核心內(nèi)容之一。既提供傳統(tǒng)的基于幀的編碼方法又提供基于視頻對象(VO)的編碼方法。在某一時刻,視頻對象以視頻對象平面(VOP)的形式出現(xiàn),圖1所示為MPEG一4編碼的框架。編碼也主要針對該時刻視頻對象的形狀、運動和紋理這三類信息來進行。
2 MPEG一4視頻編碼關(guān)鍵技術(shù)
MPEG一4視頻基于VOP的編碼就是針對運動信息、形狀信息和紋理信息等3種信息的編碼技術(shù)。
2.1 形狀編碼
MPEG一4首次引入形狀信息的編碼。VO的形狀信息有2類:二值形狀信息和灰度形狀信息。二值形狀信息用0,1表示VOP的形狀。二值信息的編碼采用基于塊的運動補償技術(shù),可以無損或有損編碼?;叶刃螤钚畔⒂?~255之間的數(shù)值表示VOP的透明程度。對灰度形狀信息的編碼是分別對二值形狀及像素亮度值進行編碼。目前對灰度形狀信息的編碼主要采用基于塊的運動補償與DCT方法,在不需要形狀信息的應(yīng)用中(譬如基于規(guī)則矩形框幀的視頻編碼),形狀編碼會被屏蔽掉。這部分編碼是以宏塊為單位進行的。
2.2 運動估計與補償編碼
類似于現(xiàn)有的編碼標準,MPEG一4采用運動預(yù)測和運動補償技術(shù)來去除圖像信息中的時間冗余成分,這些運動信息的編碼技術(shù)可視為由現(xiàn)有標準向任意形狀的 VOP的延伸。VOP的編碼有3種模式,即幀內(nèi)編碼模式(I—VOP)、幀間預(yù)測編碼模式(P—VOP)和雙向預(yù)測編碼模式(B—VOP)。在MFEG一 4中運動預(yù)測和運動補償可以是基于16×16宏塊的,也可以是基于8×8子塊的。為了能適應(yīng)任意形狀的VOP,MPEG一4引入了圖像填充技術(shù)和多邊形匹配技術(shù)。圖像填充技術(shù)利用VOP內(nèi)部的像素值外推VOP外的像素值,以此獲得運動預(yù)測的參考值。對于標準宏塊,采用傳統(tǒng)的基于塊的運動估計和補償技術(shù)。
2.3 紋理編碼
VOP視頻的紋理信息可以表示為亮度成分Y和兩個色度成分Cr,Cb。幀內(nèi)編碼情況下,紋理信息包含有亮度和色度成分;運動補償情況下,紋理信息表示經(jīng)過運動補償后的殘差。紋理編碼的對象可以是幀內(nèi)編碼模式的I—VOP,也可以是幀間預(yù)測編碼模式B—VOP或P—VOP運動補償后的預(yù)測誤差。在幀內(nèi)編碼模式中,對于完全在VOP內(nèi)的像素塊,采用經(jīng)典DCT方法。對于完全位于VOP之外的像素塊則不進行編碼:對于部分在VOP內(nèi),部分在VOP外的像素塊首先采用圖像填充技術(shù)獲得VOP之外的像素值,之后再進行DCT編碼。在幀間編碼模式中,為了對B—VOP和P—VOP運動補償后的預(yù)測誤差進行編碼,將那些位于VOP區(qū)域之外的像素值設(shè)為128。紋理編碼過程如圖1所示,DCT變換、量化、掃描及變長編碼,這些過程與現(xiàn)有標準基本相同。
3 MPEG一4是視頻編碼軟件
MPEG一4是軟件編碼是一個比較大的工程,項目用到的主要函數(shù)有:
mp4_encoder_:初始化編碼的參數(shù),如視頻大小尺寸、碼流、緩沖大??;
encode_MPEG一4:編碼調(diào)用的總函數(shù),文本是基本層;
encode_pvop_MPEG一4對P幀的VOP的編碼的總函數(shù);
ippiBlockMatcn_Imeger_16x16_MVFAST:運動搜索MVFAST(Motion Vector Field AdaDtive Search Technique)。
下面是幀間宏塊編碼的函數(shù):
encode_inter_mb_MPEG一4
(1)lookup_uvmv_MPEG一4:查找色度圖像塊的運動矢量;
(2)ippiComputeTextureErrorBlock_SAD_8u16s:計算塊殘余的紋理誤差;
(3)encode__inter_MPEG一4:DCT變化和量化每塊的系數(shù)。這還得反變化,來重構(gòu)下幀的參考幀;
(4)create_mb_MPEG一4:得到宏塊編碼的信息;
(5)ippiEncodeMV_MPEG一4_8u16s:運動矢量和紋理殘余的編碼;
(6)ippiEncodeVLCZigzag_Inter_MPEG一4_16slu:zigzig掃描和變長編碼。
IPP的函數(shù)合理使用,可以提高性能。如ip—piBlockMatch_InIeger_16x16_MVFAST這個函數(shù)就比ippiMotionEstimation_16x16_MVFAST減少3倍時間。這個函數(shù)是占正個系統(tǒng)最多的時間之一。
4 MPEG一4是視頻編碼優(yōu)化和結(jié)果
這里是針對Intel公司的PXA27X處理器,MPEG一4計算量復(fù)雜,特別是運動搜索,必須對其必要的優(yōu)化,以滿足實時編碼的要求。編譯優(yōu)化是靜態(tài)優(yōu)化,優(yōu)化編譯器可以自動完成程序段和代碼塊范圍內(nèi)的優(yōu)化問題,但由于對算法的流程很難獲取,所以人工優(yōu)化是不必可少的??墒褂脙?nèi)聯(lián)函數(shù),Wireless MMX指令編寫,如WLDRD和WMACS,特別在對數(shù)據(jù)處理時,打包指令是必不可少的指令。合理分配指令周期流水線也是重點,如WLDRD需要4個周期,而WUN—PCKEL只需要1個周期,使用IPP庫函數(shù)將大量節(jié)約開發(fā)時間和提高性能等,按照實際的工程的需要編寫指令。當然對算法的本身優(yōu)化也不必可少,如運動搜索,運動補償算法,將這些函數(shù)優(yōu)化運算時間大量減少。還有對數(shù)據(jù)搬移方面,如何有效應(yīng)用硬件資源也將提高運行的性能,如DMA、緩存、寄存器等。
這里的試驗平臺是南望信息產(chǎn)業(yè)有限公司,主頻可達624 MHz。視頻大小(480×272)透過大量的試驗,測試表明MPEG一4編碼可以滿足用戶拍視頻需求,速度可達到20幀/s,而且有較高的壓縮率,碼流比較低,質(zhì)量也不錯。圖3,4為實際拍攝2幀圖像。
5 結(jié) 語
針對Intel公司的PXA27X微處理器開發(fā)平臺,在操作系統(tǒng)中實現(xiàn)視頻編碼的功能。但是消費類產(chǎn)品對視頻的畫面有更高的要求,同時由于視頻編碼需要消耗大量的電源,電源的管理仍是視頻開發(fā)的研究重點。