MPEG一4編碼器在Intel PXA27X平臺上的實(shí)現(xiàn)
摘 要:提出基于Intel PXA27X微處理器開發(fā)平臺,在Linux操作系統(tǒng)上實(shí)現(xiàn)MPEG一4編碼軟件設(shè)計(jì)。介紹了MPEG一4的視頻標(biāo)準(zhǔn)、編碼關(guān)鍵技術(shù)以及編碼軟件實(shí)現(xiàn)部分,并進(jìn)行針對Intel PXA27X處理器軟件的優(yōu)化和實(shí)際平臺的測試。測試結(jié)果表明作為商用PDA的MPEG一4編碼可以滿足用戶的對視頻的需求,其速度達(dá)到了20幀/s,且有較高的壓縮率,碼流比較平穩(wěn),并有較好的質(zhì)量。
關(guān)鍵詞:MPEG一4;Intel PXA27X;優(yōu)化;Linux
0 引 言
隨著人們對消費(fèi)類電子產(chǎn)品(如PDA,MP4,HDTV等)需求不斷增加,特別是對高質(zhì)量高清晰多媒體的要求越來越高,因此視頻質(zhì)量已經(jīng)成為廣大消費(fèi)者關(guān)注的焦點(diǎn)之一。在視頻的格式方面,一些國際組織和大公司分別提出了自己的標(biāo)準(zhǔn),如ISO組織的MPEG一2,MPEG一4,微軟的WMV等。
針對Intel公司的PXA27X處理器(這是一個包含Intel Wireless MMX技術(shù)基于Intel Xscale的處理器),以XVID MPEG一4為基礎(chǔ),針對MPEG一4在Linux操作系統(tǒng)中實(shí)現(xiàn)視頻的編碼要求。在此首先介紹MPEG一4視頻標(biāo)準(zhǔn),緊接著闡述MPEG-4視頻標(biāo)準(zhǔn)的關(guān)鍵技術(shù)和MPEG一4視頻編碼軟件部分,最后還介紹了優(yōu)化方法和實(shí)際平臺的測試。
l MPEG一4是視頻標(biāo)準(zhǔn)
MPEG一4視頻部分是MPEG一4標(biāo)準(zhǔn)的核心內(nèi)容之一。既提供傳統(tǒng)的基于幀的編碼方法又提供基于視頻對象(VO)的編碼方法。在某一時刻,視頻對象以視頻對象平面(VOP)的形式出現(xiàn),圖1所示為MPEG一4編碼的框架。編碼也主要針對該時刻視頻對象的形狀、運(yùn)動和紋理這三類信息來進(jìn)行。
2 MPEG一4視頻編碼關(guān)鍵技術(shù)
MPEG一4視頻基于VOP的編碼就是針對運(yùn)動信息、形狀信息和紋理信息等3種信息的編碼技術(shù)。
2.1 形狀編碼
MPEG一4首次引入形狀信息的編碼。VO的形狀信息有2類:二值形狀信息和灰度形狀信息。二值形狀信息用0,1表示VOP的形狀。二值信息的編碼采用基于塊的運(yùn)動補(bǔ)償技術(shù),可以無損或有損編碼?;叶刃螤钚畔⒂?~255之間的數(shù)值表示VOP的透明程度。對灰度形狀信息的編碼是分別對二值形狀及像素亮度值進(jìn)行編碼。目前對灰度形狀信息的編碼主要采用基于塊的運(yùn)動補(bǔ)償與DCT方法,在不需要形狀信息的應(yīng)用中(譬如基于規(guī)則矩形框幀的視頻編碼),形狀編碼會被屏蔽掉。這部分編碼是以宏塊為單位進(jìn)行的。
2.2 運(yùn)動估計(jì)與補(bǔ)償編碼
類似于現(xiàn)有的編碼標(biāo)準(zhǔn),MPEG一4采用運(yùn)動預(yù)測和運(yùn)動補(bǔ)償技術(shù)來去除圖像信息中的時間冗余成分,這些運(yùn)動信息的編碼技術(shù)可視為由現(xiàn)有標(biāo)準(zhǔn)向任意形狀的VOP的延伸。VOP的編碼有3種模式,即幀內(nèi)編碼模式(I—VOP)、幀間預(yù)測編碼模式(P—VOP)和雙向預(yù)測編碼模式(B—VOP)。在MFEG一4中運(yùn)動預(yù)測和運(yùn)動補(bǔ)償可以是基于16×16宏塊的,也可以是基于8×8子塊的。為了能適應(yīng)任意形狀的VOP,MPEG一4引入了圖像填充技術(shù)和多邊形匹配技術(shù)。圖像填充技術(shù)利用VOP內(nèi)部的像素值外推VOP外的像素值,以此獲得運(yùn)動預(yù)測的參考值。對于標(biāo)準(zhǔn)宏塊,采用傳統(tǒng)的基于塊的運(yùn)動估計(jì)和補(bǔ)償技術(shù)。
2.3 紋理編碼
VOP視頻的紋理信息可以表示為亮度成分Y和兩個色度成分Cr,Cb。幀內(nèi)編碼情況下,紋理信息包含有亮度和色度成分;運(yùn)動補(bǔ)償情況下,紋理信息表示經(jīng)過運(yùn)動補(bǔ)償后的殘差。紋理編碼的對象可以是幀內(nèi)編碼模式的I—VOP,也可以是幀間預(yù)測編碼模式B—VOP或P—VOP運(yùn)動補(bǔ)償后的預(yù)測誤差。在幀內(nèi)編碼模式中,對于完全在VOP內(nèi)的像素塊,采用經(jīng)典DCT方法。對于完全位于VOP之外的像素塊則不進(jìn)行編碼:對于部分在VOP內(nèi),部分在VOP外的像素塊首先采用圖像填充技術(shù)獲得VOP之外的像素值,之后再進(jìn)行DCT編碼。在幀間編碼模式中,為了對B—VOP和P—VOP運(yùn)動補(bǔ)償后的預(yù)測誤差進(jìn)行編碼,將那些位于VOP區(qū)域之外的像素值設(shè)為128。紋理編碼過程如圖1所示,DCT變換、量化、掃描及變長編碼,這些過程與現(xiàn)有標(biāo)準(zhǔn)基本相同。
3 MPEG一4是視頻編碼軟件
MPEG一4是軟件編碼是一個比較大的工程,項(xiàng)目用到的主要函數(shù)有:
mp4_encoder_init:初始化編碼的參數(shù),如視頻大小尺寸、碼流、緩沖大??;
encode_MPEG一4:編碼調(diào)用的總函數(shù),文本是基本層;
encode_pvop_MPEG一4對P幀的VOP的編碼的總函數(shù);
ippiBlockMatcn_Imeger_16x16_MVFAST:運(yùn)動搜索MVFAST(Motion Vector Field AdaDtive Search Technique)。
下面是幀間宏塊編碼的函數(shù):
encode_inter_mb_MPEG一4
(1)lookup_uvmv_MPEG一4:查找色度圖像塊的運(yùn)動矢量;
(2)ippiComputeTextureErrorBlock_SAD_8u16s:計(jì)算塊殘余的紋理誤差;
(3)encode_block_inter_MPEG一4:DCT變化和量化每塊的系數(shù)。這還得反變化,來重構(gòu)下幀的參考幀;
(4)create_mb_MPEG一4:得到宏塊編碼的信息;
(5)ippiEncodeMV_MPEG一4_8u16s:運(yùn)動矢量和紋理殘余的編碼;
(6)ippiEncodeVLCZigzag_Inter_MPEG一4_16slu:zigzig掃描和變長編碼。
IPP的函數(shù)合理使用,可以提高性能。如ip—piBlockMatch_InIeger_16x16_MVFAST這個函數(shù)就比ippiMotionEstimation_16x16_MVFAST減少3倍時間。這個函數(shù)是占正個系統(tǒng)最多的時間之一。
4 MPEG一4是視頻編碼優(yōu)化和結(jié)果
這里是針對Intel公司的PXA27X處理器,MPEG一4計(jì)算量復(fù)雜,特別是運(yùn)動搜索,必須對其必要的優(yōu)化,以滿足實(shí)時編碼的要求。編譯優(yōu)化是靜態(tài)優(yōu)化,優(yōu)化編譯器可以自動完成程序段和代碼塊范圍內(nèi)的優(yōu)化問題,但由于對算法的流程很難獲取,所以人工優(yōu)化是不必可少的??墒褂脙?nèi)聯(lián)函數(shù),Wireless MMX指令編寫,如WLDRD和WMACS,特別在對數(shù)據(jù)處理時,打包指令是必不可少的指令。合理分配指令周期流水線也是重點(diǎn),如WLDRD需要4個周期,而WUN—PCKEL只需要1個周期,使用IPP庫函數(shù)將大量節(jié)約開發(fā)時間和提高性能等,按照實(shí)際的工程的需要編寫指令。當(dāng)然對算法的本身優(yōu)化也不必可少,如運(yùn)動搜索,運(yùn)動補(bǔ)償算法,將這些函數(shù)優(yōu)化運(yùn)算時間大量減少。還有對數(shù)據(jù)搬移方面,如何有效應(yīng)用硬件資源也將提高運(yùn)行的性能,如DMA、緩存、寄存器等。
這里的試驗(yàn)平臺是南望信息產(chǎn)業(yè)有限公司PDA,主頻可達(dá)624 MHz。視頻大小(480×272)透過大量的試驗(yàn),測試表明MPEG一4編碼可以滿足用戶拍視頻需求,速度可達(dá)到20幀/s,而且有較高的壓縮率,碼流比較低,質(zhì)量也不錯。圖3,4為實(shí)際拍攝2幀圖像。
5 結(jié) 語
針對Intel公司的PXA27X微處理器開發(fā)平臺,在Linux操作系統(tǒng)中實(shí)現(xiàn)視頻編碼的功能。但是消費(fèi)類產(chǎn)品對視頻的畫面有更高的要求,同時由于視頻編碼需要消耗大量的電源,電源的管理仍是視頻開發(fā)的研究重點(diǎn)。