TMS320C6201在MPEG-4視頻解碼器中的應(yīng)用
掃描二維碼
隨時(shí)隨地手機(jī)看文章
關(guān)鍵詞:TMS320C6201 視頻壓縮 MPEG-4 VOP MB IDCT 運(yùn)動(dòng)補(bǔ)償
引言
隨著網(wǎng)絡(luò)和多媒體技術(shù)的發(fā)展,視覺通信的重要性和需求急劇增加,如桌面視頻會(huì)議、移動(dòng)終端、基于因特網(wǎng)的視音頻通信等。隨之而來的是視頻壓縮技術(shù)的迅速發(fā)展和視頻壓縮標(biāo)準(zhǔn)的不斷推出。國際運(yùn)動(dòng)圖像編碼專家組(MPEG)先后推出了MPEG-1、MPEG-2和MPEG-4.MPEG-4是由國際運(yùn)動(dòng)圖像專家組于1998年11月制定的。它是一個(gè)面向多媒體應(yīng)用的壓縮標(biāo)準(zhǔn),其應(yīng)用覆蓋范圍遠(yuǎn)大于MPEG-1和MPEG-2等標(biāo)準(zhǔn)。從移動(dòng)可視電話到專業(yè)視頻編輯,既支持自然圖像,也支持計(jì)算機(jī)合成圖像。最重要的是它支持交互功能。這是由于MPEG-4采用了與其它標(biāo)準(zhǔn)不同的、基于對象的圖像描述方式。目前,國內(nèi)有關(guān)MPEG-4應(yīng)用技術(shù)的研究及開發(fā)的工作正在悄然興起。筆者在研究了MPEG-4視頻標(biāo)準(zhǔn)之后,充分利用TMS320C6201的硬件資源和軟件優(yōu)化,實(shí)時(shí)實(shí)現(xiàn)了嵌入式MPEG-4視頻解碼器。
1 MPEG-4視頻碼流及主要算法
MPEG-4采用了基于對象的壓縮編碼技術(shù)。在編碼前,首先要對視頻序列進(jìn)行分析,從原理圖像中分割出各個(gè)視頻對象,然后南分別對每個(gè)視頻對象單獨(dú)編碼。每個(gè)對象都有自己的形狀信息(shape)、運(yùn)動(dòng)信息(motion)、紋理信息(texture)。對視頻對象的編碼就是對這3種信息進(jìn)行編碼。MPEG-4通過運(yùn)動(dòng)預(yù)測和運(yùn)行補(bǔ)償來去除連續(xù)幀之間的時(shí)間冗余。運(yùn)動(dòng)預(yù)測與運(yùn)動(dòng)補(bǔ)償?shù)木瓤梢詾檎袼亍胂袼鼗?/4像素,另外還增了重疊運(yùn)動(dòng)補(bǔ)償方式。與形狀相關(guān)算法有:基于鄰近信息的算術(shù)編碼、水平和垂直填補(bǔ)、擴(kuò)張?zhí)钛a(bǔ)等。與紋理編碼相關(guān)的算法有:離散余弦變換(DCT)、量化、DCT系數(shù)的DC/AC差分預(yù)測、Zig-Zag掃描、游程編碼、霍夫曼變長編碼等。
筆者實(shí)現(xiàn)的是MPEG-4的SVP(Simple Visual Profile)視頻解碼。視頻序列全部為矩形,所以不存在任意形狀編碼。視頻序列按照視頻對象層VOL(Video Object Layer)、視頻對象平臺(tái)VOP(Video Object Plane)、宏塊MB(Macro Block)視順序編成一串碼流。1個(gè)VOL中包含多個(gè)VOP,1個(gè)VOP中包含多個(gè)MB。MB是碼流中的基本單位。MB又分為幀內(nèi)MB(intraMB)、幀間MB(imterMB)。幀間4VMB(inter4VMB)等幾種。在I-VOP中,所有的宏塊都是intraMB。P-VOP中宏塊有多種可能,可以是intraMB、interMB或inter4VMB。P-VOP中的interMB或inter4VMB的碼流描述如下:
MB碼流=MB形狀+MB頭信息+MV+DCT紋理信息(Y1+Y2+Y3+Y4+U+V)
由于是矩形幀,所以無形狀編碼MB shape部分。
MB頭信息中主要包括4個(gè)參數(shù):not_coded(本MB是否編碼的標(biāo)志位)、mcbpc(色度塊U和V是否編碼的標(biāo)志位)、cbpy(亮度塊Y1~Y4是否編碼的標(biāo)志位)、dquant(本MB中DCT系數(shù)量化步長的增量值)。
MV為運(yùn)動(dòng)矢量,實(shí)際寫入碼流的是運(yùn)動(dòng)矢量誤差值(ΔMV),這是因?yàn)榫幋a中MV采用差分編碼。如果MB是一個(gè)interMB,則表示本MB只有1個(gè)運(yùn)動(dòng)矢量,所以在碼流中只傳1個(gè)ΔMV;如果MB是一個(gè)inter4VMB,則表示本MB有4個(gè)運(yùn)行矢量,即每個(gè)子塊(block)有1個(gè)運(yùn)動(dòng)矢量,所以在碼流中需傳送4個(gè)ΔMV,即mvd1、mvd2、mvd3和mvd4。
最后是一連串經(jīng)過量化、Zig-Zag掃描、游程編碼和霍夫曼變長編碼的DCT系數(shù),按照Y1、Y2、Y3、Y4、U和V的先后順序編碼。
2 TMS320C6201 DSP及EVM板介紹
2.1 TMS320C6201 DSP
TMS320C6201是美國TI公司的C6000系列新一代數(shù)字信號(hào)處理器中的第1個(gè)產(chǎn)品,于1997年3月發(fā)布。它是一個(gè)32bit的定點(diǎn)DSP芯片。該芯片具有8個(gè)相互獨(dú)立的功能單元,可以工作在200MHz的CPU時(shí)鐘頻率,全速運(yùn)行時(shí)可達(dá)到1600 MIPS。其主要特性包括:
*芯片內(nèi)核采用VelociTI TM先進(jìn)的超長指令字(VLIW)結(jié)構(gòu),具有高度的并行性和快速的運(yùn)行能力,每個(gè)時(shí)鐘周期最多可同時(shí)執(zhí)行8條32位指令,并且所有的指令都可以有條件執(zhí)行;
*具有豐富的指令系統(tǒng)且可對字節(jié)操作,支持16位的乘法運(yùn)算;
*有4個(gè)彼此獨(dú)立的快速的DMA通道,可以進(jìn)行多種形式的數(shù)據(jù)傳輸。
*片內(nèi)數(shù)據(jù)存儲(chǔ)區(qū)和程序存儲(chǔ)區(qū)各64KB,并支持多種數(shù)據(jù)寬度8位/16位/32位;32位的外部存儲(chǔ)器接口,提供與片外SDRAM、SDSRAM和SRAM的直接接口。
TMS320C6201的以上特點(diǎn),能滿足視頻圖像處理的實(shí)時(shí)性要求。例如:TMS320C6201 DSP計(jì)算1塊8×8 IDCT(逆變散余弦變換)僅用(168+62)個(gè)時(shí)鐘周期,為1.15μs。
2.2 EVM板
TMS320C6201 EVM板是一塊帶有PCI接口的插卡,除了可以插在計(jì)算機(jī)主板的PCI插槽上使用外,還可以外配電源作為獨(dú)立的模塊工作,并通過XDS510仿真器進(jìn)行調(diào)試。該板上配有1片TMS320C6201 DSP,最高工作在160MHz。
EVM板上提供的片外存儲(chǔ)器包括1組64Kbit×32(256KB)、133MHz的SBSRAM,配置成CE0;2組4MB、100MHz的SDRAM,分別配置成CE2和CE3;另外還可以通過板上的外部存儲(chǔ)器接口(EMIF)擴(kuò)展存儲(chǔ)空間,這些擴(kuò)展存儲(chǔ)器配置成CEI。
3 用TMS320C6201實(shí)現(xiàn)MPEG-4 SVP解碼
3.1 MPEG-4視頻解碼原理
MPEG-4的一個(gè)VOP的解碼過程如圖1所示,解碼器用這一過程從編碼位流中恢復(fù)視頻對象。不難看出,解碼器主要由形狀解碼器、運(yùn)動(dòng)解碼器和紋理解碼器3部分組成。
3.2 程序流程
整個(gè)程序采用模塊化設(shè)計(jì),以優(yōu)化C語言編程為主。限于篇幅,僅列出主程序流程(如圖2所示)和MB解碼流程(如圖3所示)。
主程序在初始化后,首先從碼流中解出VOL和VOP的頭,然后根據(jù)這些頭信息以宏塊為單位進(jìn)行解碼。MB解碼單獨(dú)做成函數(shù),也是首先解出頭信息,據(jù)此判斷出宏塊類型:幀內(nèi)MB、幀間MB或幀間4VMB。幀內(nèi)MB解碼是以1塊為單位作紋理解碼,解出的紋理值在block[6][64]中,最后存入解碼后宏塊行緩存區(qū)內(nèi);2種幀間MB解碼相同部分都是先解出運(yùn)動(dòng)矢量MV,根據(jù)MV進(jìn)行運(yùn)動(dòng)補(bǔ)償?shù)玫筋A(yù)測值存入解碼后宏塊行緩存區(qū),再以塊為單位進(jìn)行紋理解碼,解出殘差值存入block[6][64]中,最后將block[6][64]加入到解碼后宏塊門緩存區(qū)中得到最后結(jié)果。不同的是,在解碼MV時(shí)intraMB解出1個(gè)MV;而inter4VMB解出4個(gè)MV。因此,運(yùn)動(dòng)補(bǔ)償時(shí),一個(gè)按宏塊做,一個(gè)按塊做。另外還有一種情況,就是P-VOP中的MB沒有被編碼(not_coded=1),碼流中沒有此宏塊的數(shù)據(jù),應(yīng)該MV=0、DCT系數(shù)全為0處理,即從前一幀同樣位置處找到參考?jí)K作為當(dāng)前宏塊的結(jié)果。
3.3 存儲(chǔ)器分配
MPEG-4 SVP解碼器是在EVM板上編程實(shí)現(xiàn)的。由于TMS320C6201 DSP片內(nèi)數(shù)據(jù)存儲(chǔ)空量只有64KB,而圖像處理的數(shù)據(jù)量非常大,因此,合理有效地分析存儲(chǔ)空間是解碼設(shè)計(jì)中的關(guān)鍵問題。內(nèi)部64KB存儲(chǔ)空間內(nèi)開辟了一些空間用于暫存解碼中常用的一些信息,具體設(shè)置如表1所列。
表1 內(nèi)部數(shù)據(jù)存儲(chǔ)器空間分配
全局變量 | 所占空間/B |
變長解碼(VLD)表 | 4906 |
Zig-Zag掃 | 192 |
VOL、VOP和MB的頭信息 | 108 |
DC/AC預(yù)測和MB模式 | 5560 |
MV預(yù)測 | 9504 |
量化步長 | 396 |
解碼輸出緩存區(qū)(1個(gè)宏塊行) | 8448 |
輸入的壓縮碼流緩存區(qū) | 10K |
合 計(jì) |
38.3K |
輸入的壓縮碼流和解碼后的視頻輸出都存儲(chǔ)在片外。輸入的壓縮碼流在程序開始前由PC機(jī)傳輸?shù)紼VM板的外部存儲(chǔ)器中保存,解碼時(shí)分批將數(shù)據(jù)通過DMA方式復(fù)制到片內(nèi)。片內(nèi)設(shè)置1個(gè)壓縮碼流緩存區(qū)。解碼后的視頻序列存放在外部存儲(chǔ)器中,在內(nèi)部緩存1個(gè)宏塊行,每解完1個(gè)宏塊行后,就用DMA傳輸?shù)酵獠看鎯?chǔ)器中。
3.4 程序優(yōu)化
(1)軟件開發(fā)流程及開發(fā)工具
整個(gè)程序的編寫和調(diào)試按照C6000軟件開發(fā)流程進(jìn)行,流程分為:產(chǎn)生C代碼、優(yōu)化C代碼和編寫線性匯編程序3個(gè)階段。使用的開發(fā)工具是TI的集成開發(fā)環(huán)境CCS(Code Composer Studio)。在CCS下,可以對軟件進(jìn)行編輯、編譯、調(diào)試、代碼性能測試(profile)等所有工作。
(2)程序優(yōu)化措施
為使程序優(yōu)化,采取如下措施:
①為編寫出優(yōu)化的C程序,在編程時(shí)盡量按照C6000環(huán)境下支持的優(yōu)化C的方法進(jìn)行編程,這樣有助于C編譯器產(chǎn)生高效的匯編代碼。
②使用TI提供的庫函數(shù),大大提高了編程效率。
③使用DMA傳數(shù),提高了CPU的效率。
在解碼程序中用DMA方式實(shí)現(xiàn)了下列數(shù)據(jù)的傳輸:
*碼流輸入——碼流從片外存儲(chǔ)器傳輸?shù)狡瑑?nèi);
*解碼后的結(jié)果輸出——解碼完一宏塊行后,將結(jié)果從片內(nèi)傳輸?shù)狡獗4妫?/P>
*頂部和低部的填充;
*運(yùn)動(dòng)補(bǔ)償時(shí),將在片外找到的參考?jí)K傳輸?shù)狡瑑?nèi)。
(3)采用線性匯編對某些程序段做進(jìn)一步優(yōu)化。
為了提高代碼性能,對影響應(yīng)用程序的代碼可以用線性匯編重新編寫。
3.5 MPEG-4 SVP解碼器的特性及測試結(jié)果
按照上述思路所實(shí)現(xiàn)的MPEG-4 SVP視頻解碼器完全符合MPEG-4的SVP規(guī)范,其特點(diǎn)如表2所列。輸入圖像分辨率可為QCIF或CIF,輸入比特率為64Kbps、128Kbps和384Kbps,輸出圖像格式為4:2:0YUV,最大解碼速率為30幀/s。
表2 MPEG-4 SVP視頻解碼器特性表
壓縮標(biāo)準(zhǔn) | MPEG-4SVP |
輸入圖像分辨率 | QCIF(176×144),CIF(352×288) |
像素精度 | 8bit/pixel |
掃描格式 | 逐行掃描 |
輸入比特率/Kbps | 64,128,384 |
最大解碼幀率 | 最高30幀/s |
輸出圖像格式 | 4:2:0 YUV |
在解碼軟件是在EVM板上調(diào)試通過的,解碼時(shí)間可在CCS環(huán)境下測得。對于不同的圖像解碼所用的時(shí)間是有差異的。筆者對多種情況的碼流進(jìn)行了測試,在1秒內(nèi)都能解出25~30幀,甚至更多幀從而實(shí)現(xiàn)了實(shí)時(shí)解碼。
結(jié)束語
筆者在研究了MPEG-4的視頻編解碼算法之后,成功地在TMS320C6201 EVM板上編程實(shí)現(xiàn)子MPEG-4 SVP的實(shí)時(shí)解碼,為最終設(shè)計(jì)出獨(dú)立的MPEG-4解碼器打下了基礎(chǔ)。此解碼器可以嵌入到某些移動(dòng)終端中,用于解碼VPEG-4碼流,如PDA、機(jī)頂盒和住宅網(wǎng)關(guān)等;還可以與相應(yīng)的編碼器配套用于遠(yuǎn)程監(jiān)控中。