當(dāng)前位置:首頁(yè) > 電源 > 數(shù)字電源
[導(dǎo)讀]詳細(xì)闡述了針對(duì)ARM平臺(tái)的MPEG4視頻解碼算法的優(yōu)化方法。實(shí)驗(yàn)數(shù)據(jù)表明,優(yōu)化后的解碼器性能得到了全面提升。還結(jié)合ARM7TDMI的Easy ARM2200開(kāi)發(fā)平臺(tái),給出了嵌入式MPEG-4視頻解碼的實(shí)時(shí)實(shí)現(xiàn)。

    摘  要  詳細(xì)闡述了針對(duì)ARM平臺(tái)的MPEG4視頻解碼算法的優(yōu)化方法。實(shí)驗(yàn)數(shù)據(jù)表明,優(yōu)化后的解碼器性能得到了全面提升。還結(jié)合ARM7TDMI的Easy ARM2200開(kāi)發(fā)平臺(tái),給出了嵌入式MPEG-4視頻解碼的實(shí)時(shí)實(shí)現(xiàn)。
    關(guān)鍵詞  ARM,MPEG4,嵌入系統(tǒng),視頻解碼器

1  引  言

    本文旨在研究基于ARM微處理器的MPEG-4視頻解碼技術(shù),主要應(yīng)用在手持移動(dòng)設(shè)備中。利用嵌入式系統(tǒng)實(shí)現(xiàn)MPEG-4視頻解碼,處理器的選擇是關(guān)鍵。在嵌入式系統(tǒng)中常用的RISC處理器是ARM核,主要是因?yàn)樗哂畜w積小,功耗低,成本低,性價(jià)比高的特點(diǎn),這對(duì)于移動(dòng)應(yīng)用領(lǐng)域非常重要。ARM7系列微處理器為低功耗的32位RISC處理器,最適合于對(duì)價(jià)位和功耗要求較高的消費(fèi)類應(yīng)用。本解碼器定位于低分辨率和低幀率的應(yīng)用場(chǎng)合,因此選擇在ARM7TDMI核上實(shí)現(xiàn)解碼功能。要實(shí)現(xiàn)更高幀率和分辨率的解碼,可將軟件直接應(yīng)用在更高端的處理器上。

2  MPEG-4視頻解碼算法的優(yōu)化與實(shí)現(xiàn)

    MPEG-4標(biāo)準(zhǔn)可以劃分為一套子標(biāo)準(zhǔn),標(biāo)準(zhǔn)的每一部分都有各自最適合的應(yīng)用場(chǎng)合。MPEG-4 SVP就是一種特殊的、簡(jiǎn)單的MPEG-4實(shí)現(xiàn),SVP代表Simple Visual Profile。這部分是專門針對(duì)手持式產(chǎn)品中無(wú)線視頻傳輸應(yīng)用場(chǎng)合而制定的。由于本解碼器應(yīng)用在手持移動(dòng)設(shè)備視頻解碼的場(chǎng)合,因此選用MPEG-4 SVP作為解碼算法。
    本文選用ARM7TDMI作為核心處理器進(jìn)行MPEG-4視頻解碼器的開(kāi)發(fā)。在實(shí)際開(kāi)發(fā)過(guò)程中,針對(duì)ARM7TDMI的結(jié)構(gòu)和MPEG-4的算法特點(diǎn),做了大量?jī)?yōu)化工作,保證了解碼的精度,大幅度提高了解碼的速度。解碼器的具體功能如表1所列。

表1  基于ARM7TDMI的MPEG-4視頻解碼器功能表

功能

系統(tǒng)實(shí)現(xiàn)

壓縮標(biāo)準(zhǔn) MPEG-4 SVP
輸入圖像分辨率 QCIF(176×144,如果選用更高端處理器,則可支持更高分辨率)
解碼幀率 15fps(如果選用更高端處理器,則可支持更高幀率)
VOP類型 IVOP+PVOP
DC/AC逆預(yù)測(cè) 支持
Inter4V模式 支持
逆量化方法 H.263(MPEG可選)
逆掃描方式 Zigzag掃描+水平交替掃描+垂直交替掃描
輸出圖像格式 4∶2∶0  YUV

2.1 解碼器算法
    解碼過(guò)程實(shí)際上就是從視頻編碼碼流中恢復(fù)出VOP數(shù)據(jù)的過(guò)程。圖1描述了一個(gè)視頻解碼過(guò)程。解碼器主要包含兩部分: 運(yùn)動(dòng)解碼和紋理解碼。I幀中只含有紋理信息,因此只須解碼紋理信息即可恢復(fù)I幀。而P幀中不僅包含紋理信息,還包含運(yùn)動(dòng)信息,所以須解碼運(yùn)動(dòng)信息,獲得運(yùn)動(dòng)矢量并進(jìn)行運(yùn)動(dòng)補(bǔ)償。另外,還須進(jìn)行紋理解碼獲得殘差值,將這兩部分組合起來(lái)才能重建P幀。


圖1  MPEG4 SVP的解碼過(guò)程

    解碼器的實(shí)現(xiàn)主要是提供一個(gè)簡(jiǎn)單的接口函數(shù),供解碼時(shí)調(diào)用。該接口函數(shù)根據(jù)解碼的不同需要和不同階段提供了5個(gè)入口。5個(gè)接口函數(shù)中: 4個(gè)供初始化、預(yù)處理及后續(xù)處理時(shí)調(diào)用;剩余1個(gè)是幀解碼的實(shí)現(xiàn)函數(shù)。圖2為幀解碼主程序的流程圖。


圖2  幀解碼主程序的流程圖。

    解碼過(guò)程的計(jì)算主要集中在如下幾個(gè)模塊:IDCT、運(yùn)動(dòng)補(bǔ)償MC、逆量化、逆掃描、逆預(yù)測(cè)以及變長(zhǎng)解碼VLD。表2給出了優(yōu)化前解碼過(guò)程的特征信息。
    從表2中可以看出,上述運(yùn)算模塊在解碼過(guò)程中占有很大比例。對(duì)以上各模塊進(jìn)行優(yōu)化的效果將直接反映在解碼器的實(shí)時(shí)效率上。

表2  優(yōu)化前解碼過(guò)程的特征信息

各單元名稱

各單元所占時(shí)間比例/%

IDCT

40

逆量化,逆掃描和逆預(yù)測(cè)

24

數(shù)據(jù)分析和變長(zhǎng)解碼

14

2.2 ARM平臺(tái)下算法的優(yōu)化
    ARM結(jié)構(gòu)是基于RISC原理的,指令集和相關(guān)的解碼機(jī)制都比CISC要簡(jiǎn)單得多。它能高效地輸出指令,快速送出實(shí)時(shí)中斷響應(yīng);它還進(jìn)行了管道設(shè)置,處理和存儲(chǔ)系統(tǒng)的所有部分可以持續(xù)地運(yùn)轉(zhuǎn)。在典型的情況下,當(dāng)一條指令被執(zhí)行時(shí),其后續(xù)指令正在被解碼;而第三條指令便從存儲(chǔ)器中取出。ARM7TDMI并不具有指令或數(shù)據(jù)的高速緩存,主要被用于控制核心,而非數(shù)據(jù)處理。但通過(guò)對(duì)其特性的靈活運(yùn)用,可以使其非常容易地應(yīng)用于視頻解碼過(guò)程。對(duì)MPEG4視頻解碼器的算法優(yōu)化主要從以下幾方面入手:
    (1) 算法的優(yōu)化
    這里是指高級(jí)C語(yǔ)言轉(zhuǎn)化算法以簡(jiǎn)化計(jì)算量, 用最佳算法實(shí)現(xiàn)解碼中的各模塊。 
    ① IDCT算法的選擇
    IDCT運(yùn)行次數(shù)多,運(yùn)算量很大,其變換的快慢直接影響解碼的速度。本文采用一種稱為AAN的快速算法。其一維8點(diǎn)的DCT變換通過(guò)16點(diǎn)DFT來(lái)實(shí)現(xiàn),而16點(diǎn)DFT又可通過(guò)FFT實(shí)現(xiàn);二維8×8的DCT運(yùn)算僅需80次乘法和464次加法操作,大大減小了這部分的運(yùn)算量。用AAN算法實(shí)現(xiàn)IDCT運(yùn)算時(shí),實(shí)際上是用IDFT取代IDCT,所以首先要得到DFT系數(shù)。方法是逆量化后直接將DCT系數(shù)分別乘以尺度因子,也就是說(shuō)將尺度變換與逆量化結(jié)合。
    ② 除法運(yùn)算的消除
    一個(gè)除法操作須花費(fèi)60~120個(gè)周期進(jìn)行處理,而一個(gè)乘法操作最多需要4個(gè)周期。在除法可以被乘法代替而不喪失準(zhǔn)確性的計(jì)算中,這樣做是非常有好處的。在反向DC系數(shù)預(yù)測(cè)過(guò)程中,DC系數(shù)重構(gòu)后,立即對(duì)其進(jìn)行逆量化,從而消除除法運(yùn)算。
    ③ 存儲(chǔ)訪問(wèn)的減少
    在任何實(shí)現(xiàn)中盡可能減少存儲(chǔ)訪問(wèn)都是非常有價(jià)值的。由于ARM7TDMI內(nèi)沒(méi)有緩存,每次訪問(wèn)都是對(duì)外部存儲(chǔ)器進(jìn)行的,所以這樣做尤為重要。通過(guò)在任何可能的地方結(jié)合解碼過(guò)程,訪問(wèn)的次數(shù)即可減少。I幀中反向DC系數(shù)預(yù)測(cè)與DC系數(shù)逆量化的結(jié)合、逆掃描與變長(zhǎng)解碼的結(jié)合,以及逆量化與IDCT的結(jié)合,P幀中變長(zhǎng)解碼、逆掃描與反量化的結(jié)合,對(duì)于每個(gè)非零系數(shù)只需一次讀入和一次存儲(chǔ)。同時(shí),像素重建也在IDCT之后立即進(jìn)行。這樣對(duì)每個(gè)系數(shù)來(lái)說(shuō),又減少了一次讀入和存儲(chǔ)。
    (2) 根據(jù)ARM7TDMI芯片結(jié)構(gòu)的優(yōu)化
    這里的優(yōu)化主要體現(xiàn)在節(jié)約寄存器資源。任何一種芯片的寄存器資源都是有限的,ARM7TDMI的通用寄存器總數(shù)為31個(gè),對(duì)于小規(guī)模應(yīng)用程序是足夠了,但在MPEG4解碼過(guò)程中往往會(huì)用到較多的寄存器,所以仍須節(jié)儉。方法如下: 其一,在可能的情況下盡量少用寄存器,比如可對(duì)一個(gè)寄存器多次使用。其二,根據(jù)具體情況選擇最優(yōu)的變量類型,在局部變量中,使用int類型效率最高;而對(duì)于全局變量,使用short類型,則可減小Flash的使用量。
    (3) 匯編/結(jié)構(gòu)層的優(yōu)化
    盡管編譯器可以產(chǎn)生匯編代碼,但為了使代碼效率更高,根據(jù)ARM7TDMI的特性對(duì)模塊IDCT、IQ、VLD、DC/AC預(yù)測(cè)和MC進(jìn)行手工匯編編碼。下面詳細(xì)闡述不同的優(yōu)化方法及其所使用的模塊。
    ① 內(nèi)部循環(huán)的解開(kāi)
    循環(huán)的解開(kāi)其實(shí)也是為了增強(qiáng)程序中的并行處理能力。對(duì)于解循環(huán),不能在解開(kāi)的循環(huán)中保留線性過(guò)程,即指令在執(zhí)行過(guò)程中的結(jié)果不能作為后續(xù)指令的輸入數(shù)據(jù);否則也就失去了并行處理能力,解循環(huán)也就失去了意義。
    ② 乘法和除法盡量用移位運(yùn)算來(lái)完成
    對(duì)于2的冪次乘法或除法使用移位將會(huì)提高不少效率,一條除法指令使用的周期數(shù)遠(yuǎn)遠(yuǎn)多于移位指令。
    ③ 盡可能將循環(huán)內(nèi)部的負(fù)荷放到循環(huán)外面
    這點(diǎn)很重要,因?yàn)樵S多循環(huán)內(nèi)部包括一條或幾條運(yùn)算語(yǔ)句,這些語(yǔ)句將被重復(fù)運(yùn)算,因此如果事先設(shè)定一個(gè)變量,然后賦上那幾條運(yùn)算語(yǔ)句的值,并替換到循環(huán)外部,則會(huì)極大地節(jié)省芯片資源,特別是對(duì)于循環(huán)中含有除法運(yùn)算的情況。在逆量化循環(huán)運(yùn)算中,存在著大量冗余計(jì)算,原因在于逆量化運(yùn)算中參數(shù)的重復(fù)計(jì)算,而對(duì)于每幀解碼VOP,這些參數(shù)是唯一的。因此,可將這些參數(shù)的計(jì)算放到逆量化循環(huán)外面,則每幀只須計(jì)算一次。這樣即可節(jié)約大量的指令周期。
    ④ 功能參數(shù)的優(yōu)化數(shù)量
    在ARM編譯的過(guò)程中,子程序的參數(shù)是通過(guò)寄存器R0~R3來(lái)傳遞的。如果所傳遞的參數(shù)多于4個(gè),那么超出的參數(shù)將被壓入棧內(nèi);當(dāng)它們?cè)诤瘮?shù)中被第一次訪問(wèn)時(shí),便會(huì)從棧中彈出。通過(guò)把參數(shù)的數(shù)量減少到4個(gè)或者少于4個(gè),則可直接使用,而無(wú)需任何的調(diào)入,因?yàn)檫@些值都可從寄存器中獲得。
    ⑤ 利用LDM和STM減少存儲(chǔ)器的訪問(wèn)
    批量加載/存儲(chǔ)指令可以實(shí)現(xiàn)在一組寄存器和一塊連續(xù)的內(nèi)存單元之間傳輸數(shù)據(jù)。LDM為加載多個(gè)寄存器;STM為存儲(chǔ)多個(gè)寄存器。這種特性非常有用,因?yàn)榕c單字加載/存儲(chǔ)相比,它在執(zhí)行周期上花費(fèi)更少。因此它在IDCT中得到了有效的利用,用于同一時(shí)刻取出一行的所有系數(shù)。同樣在運(yùn)動(dòng)補(bǔ)償過(guò)程中,一組數(shù)據(jù)字在指令的一次執(zhí)行中獲得,并且暫時(shí)存儲(chǔ)在多個(gè)寄存器中以便日后使用。
    ⑥ 指令的有條件執(zhí)行
    有條件執(zhí)行的特性被ARM7TDMI的所有算法和數(shù)據(jù)移位指令支持。這是一項(xiàng)可選的特性。它在指令被執(zhí)行時(shí)設(shè)置標(biāo)記。有條件執(zhí)行通常用于循環(huán)退出條件和飽和條件,可以節(jié)省退出循環(huán)中的一個(gè)指令CMP。對(duì)于循環(huán)次數(shù)很多的情況,即使是一個(gè)指令的減少也有很大的好處。在變長(zhǎng)解碼中就很好地利用了這種特性。
    ⑦ 一種用于運(yùn)動(dòng)補(bǔ)償?shù)挠行?yōu)化方法
    解碼過(guò)程中處理的像素是8位。如果運(yùn)動(dòng)補(bǔ)償是在字節(jié)或像素的基礎(chǔ)上執(zhí)行,那么字節(jié)加載和存儲(chǔ)將被使用,它是存儲(chǔ)器訪問(wèn)中代價(jià)最高的操作。因?yàn)锳RM7TDMI是32位微處理器,存儲(chǔ)器可以按字讀取數(shù)據(jù),因此設(shè)計(jì)出一種有效的運(yùn)動(dòng)補(bǔ)償方法,即在字?jǐn)?shù)據(jù)的基礎(chǔ)上進(jìn)行操作。利用這種方法,便可以用一種非常有效的方式同時(shí)對(duì)4像素進(jìn)行運(yùn)動(dòng)補(bǔ)償。
    下面以水平方向的半像素補(bǔ)償為例,講述補(bǔ)償?shù)倪^(guò)程。補(bǔ)償?shù)脑砣鐖D3所示。
    首先讀入一個(gè)字到寄存器中,從低到高的數(shù)據(jù)依次對(duì)應(yīng)的是像素0、像素1、像素2和像素3;然后將讀碼流指針增加1字節(jié),再讀取下一個(gè)字到另一寄存器中,從低到高的數(shù)據(jù)依次對(duì)應(yīng)的為像素1、像素2、像素3和像素4。示意圖如圖4所示。


    圖3  半像素內(nèi)插示意圖                             圖4  4像素補(bǔ)償原理示意圖

    半像素補(bǔ)償可由x=(A+B+1-rounding_control)/2來(lái)實(shí)現(xiàn)。式中: A和B為參考幀中兩個(gè)相鄰的像素?cái)?shù)據(jù);rounding_control可取0或1。
    按照補(bǔ)償公式對(duì)上述兩個(gè)寄存器進(jìn)行相加移位操作,但是對(duì)應(yīng)像素兩兩相加時(shí)可能會(huì)產(chǎn)生進(jìn)位。為了解決這個(gè)問(wèn)題,須設(shè)置保護(hù)位,具體方法如下:

  • 將上述兩個(gè)寄存器中的任意一個(gè)(如寄存器1)與0xFEFEFEFF相“與”,則寄存器1中像素1、2、3的最低位被清0,即將后一字節(jié)的最低位設(shè)置為前一字節(jié)的保護(hù)位。而對(duì)于第3字節(jié),因?yàn)榧拇嫫鞅旧韼в羞M(jìn)位狀態(tài)標(biāo)志,所以無(wú)需另外設(shè)置。
  • 如果rounding_control為0,則將寄存器2與0x01010101相加,然后再和0xFEFEFEFF相“與”,設(shè)置進(jìn)位保護(hù)位;如果rounding_control為1,則直接將寄存器2和0xFEFEFEFF相“與”。
  • 將以上兩步的結(jié)果相加,判斷進(jìn)位狀態(tài)標(biāo)志。若有進(jìn)位,則將相加結(jié)果的最高位,即寄存器的第31位置1,最后右移1位。所得結(jié)果即補(bǔ)償后的4個(gè)像素值。

    在同時(shí)對(duì)4像素進(jìn)行補(bǔ)償?shù)倪^(guò)程中,只有當(dāng)相鄰兩像素的最高位都為1時(shí),才會(huì)有進(jìn)位產(chǎn)生。使用這種補(bǔ)償方法其實(shí)犧牲了部分精度,但這里只是使所影響的像素值增加了1,所以影響并不大,而且可以使補(bǔ)償速度大大提升。同時(shí)對(duì)4像素進(jìn)行補(bǔ)償?shù)倪^(guò)程中,寄存器加載需要3個(gè)周期,存儲(chǔ)需要2個(gè)周期,共有兩次加載和一次存儲(chǔ)操作,中間的加法和移位操作需要6個(gè)指令周期,共需14個(gè)周期。如果對(duì)上面4個(gè)像素分別進(jìn)行補(bǔ)償,則需5次加載操作和4次存儲(chǔ)操作,共23個(gè)周期,另外中間計(jì)算還需12個(gè)周期,所以共需35個(gè)周期??梢?jiàn),犧牲部分精度換取補(bǔ)償速度是很值得的。
    對(duì)于垂直方向和水平垂直方向的半像素補(bǔ)償,其原理與水平方向相同。

3  實(shí)驗(yàn)結(jié)果與數(shù)據(jù)分析

    通過(guò)優(yōu)化,MPEG4的解碼性能有了較大的提升。在ADS1.2環(huán)境下分別對(duì)各模塊進(jìn)行C算法優(yōu)化和ARM代碼優(yōu)化,結(jié)果如表3所列。按調(diào)用一次模塊函數(shù)所需周期數(shù)進(jìn)行統(tǒng)計(jì)。

表3  仿真器上各模塊單獨(dú)統(tǒng)計(jì)(使用QCIF格式圖像news)

所優(yōu)化模塊名稱

C優(yōu)化(cycles)/個(gè)

ARM優(yōu)化(cycles)/個(gè)

優(yōu)化率/%

DC/AC預(yù)測(cè)

703

534

24.04

逆掃描/VLD

1 730

1 118

35.38

逆量化/IDCT

6 032

2 562

57.53

運(yùn)動(dòng)補(bǔ)償

17 143

8 471

50.59

    這些模塊是解碼過(guò)程中經(jīng)常會(huì)調(diào)用的函數(shù),因此,這些函數(shù)的優(yōu)化將使解碼速度有明顯的提高。
    表4比較了不同序列的15幀QCIF格式視頻解碼優(yōu)化前后所需的帶寬。這些圖像具有不同的復(fù)雜度,因而結(jié)果也不一樣。

表4  對(duì)不同序列的優(yōu)化結(jié)果(15fps QCIF格式)

視頻序列①

優(yōu)化前所需帶寬/MHz

優(yōu)化后所需帶寬/MHz

news

27.24

16.86

foreman

64.83

48.78

miss_am

27.71

15.95

carphone

52.54

34.52

salesman

28.06

16.56

trevor

52.56

34.24

 注: ① 為標(biāo)準(zhǔn)視頻測(cè)試序列。

    解碼速度基本取決于圖像畫(huà)面的運(yùn)動(dòng)情況和顏色是否豐富。從上面的數(shù)據(jù)可以看出對(duì)于不同的序列,其解碼速度也不同。news、salesman和miss_am之所以很快,是因?yàn)閳D像背景靜止,只有肩部和頭部有運(yùn)動(dòng),所以P幀的編碼數(shù)據(jù)量較少,解碼速度較高。另外,如果圖像很簡(jiǎn)單(單調(diào)),其能量集中到DC系數(shù)(直流分量)上,交流系數(shù)會(huì)出現(xiàn)多個(gè)零,因此變長(zhǎng)解碼速度就會(huì)較高,從而節(jié)約了解碼時(shí)間。 
    從仿真速度分析,通過(guò)本文所總結(jié)的ARM7TDMI上視頻解碼的優(yōu)化方法,可以使MPEG4視頻解碼節(jié)約大量的數(shù)據(jù)處理時(shí)間。由實(shí)驗(yàn)結(jié)果可見(jiàn),本視頻解碼器能較好地滿足低分辨率、低幀率場(chǎng)合實(shí)時(shí)解碼的要求。

4  MPEG4視頻解碼的嵌入式系統(tǒng)實(shí)現(xiàn)

    實(shí)現(xiàn)本解碼器的主要硬件平臺(tái)是Easy ARM2200,如圖5所示。它是一款功能強(qiáng)大的32位ARM單片機(jī)開(kāi)發(fā)板,采用了Philips公司的ARM7TDMI?S核,以及總線開(kāi)放的單片機(jī)LPC2210,具有JTAG調(diào)試功能。


圖5  Easy ARM2200開(kāi)發(fā)板

    開(kāi)發(fā)板上除了提供鍵盤、LED和RS232等一些常用功能部件外,還具有4Mb SRAM、16Mb FLASH、IDE硬盤接口、CF存儲(chǔ)卡接口、以太網(wǎng)接口和Modem接口等。
    本文選擇在μClinux操作系統(tǒng)上調(diào)試MPEG4解碼程序。調(diào)試過(guò)程分為以下幾個(gè)步驟:

  • 建立μClinux開(kāi)發(fā)環(huán)境;
  • 在μClinux下開(kāi)發(fā)應(yīng)用程序;
  • 添加應(yīng)用程序到目標(biāo)系統(tǒng)并調(diào)試。

    圖6 為一個(gè)基于μClinux的嵌入式系統(tǒng)典型框架結(jié)構(gòu)圖。


圖6  基于μClinux嵌入式系統(tǒng)框圖

    (1) 建立μClinux開(kāi)發(fā)環(huán)境
    為了實(shí)現(xiàn)基于μClinux的應(yīng)用系統(tǒng)的開(kāi)發(fā),建立或擁有一個(gè)完備的μClinux開(kāi)發(fā)環(huán)境是十分必要的。建立μClinux開(kāi)發(fā)環(huán)境主要包括以下3個(gè)步驟:

  • 建立交叉編譯器;
  • 編譯μClinux內(nèi)核;
  • 加載內(nèi)核。

    在完成上述所有工作后,一個(gè)嵌入式應(yīng)用開(kāi)發(fā)平臺(tái)就已經(jīng)搭建好了。在這個(gè)平臺(tái)之上,可以根據(jù)不同需要開(kāi)發(fā)嵌入式應(yīng)用。
    (2) 在μClinux下開(kāi)發(fā)應(yīng)用程序
    基于μClinux系統(tǒng)的應(yīng)用程序的開(kāi)發(fā),通常是在標(biāo)準(zhǔn)Linux平臺(tái)上用交叉編譯工具arm?elf?gcc來(lái)完成的。ADS和arm?elf?gcc都是ARM公司提供的軟件開(kāi)發(fā)工具,它們都支持ARM指令集,但部分偽指令集不同。因此為了將在ADS1.2環(huán)境下優(yōu)化好的源代碼移植到arm?elf?gcc環(huán)境下,就需要對(duì)源代碼的偽指令作修改, 然后用arm?elf?gcc編譯源文件,以生成可在目標(biāo)板上運(yùn)行的可執(zhí)行程序。
    (3) 添加應(yīng)用程序到目標(biāo)系統(tǒng)并調(diào)試
    要在硬件板上調(diào)試,就必須首先把應(yīng)用軟件的可執(zhí)行程序添加到目標(biāo)系統(tǒng)中。有多種途徑可以達(dá)到這一目的。本文使用的是網(wǎng)絡(luò)方法,通過(guò)以太網(wǎng)接口從網(wǎng)絡(luò)添加用戶程序到目標(biāo)系統(tǒng)中運(yùn)行。
    完成上述工作后,MPEG4解碼程序就可以在μClinux系統(tǒng)上運(yùn)行了,解碼結(jié)果數(shù)據(jù)流通過(guò)以太網(wǎng)動(dòng)態(tài)傳輸?shù)絇C機(jī)上。對(duì)幾個(gè)典型QCIF格式圖像解碼的幀率如表5所列。

表5  在μClinux操作系統(tǒng)中MPEG4視頻解碼的幀率

視頻序列

解碼的實(shí)際幀率/幀/s

news

35

foreman

16

miss_am

37

carphone

17

salesman

36

trevor

17

    觀察發(fā)現(xiàn)與前面的軟件仿真結(jié)果是一致的。對(duì)于序列news、miss_am和salesman這些運(yùn)動(dòng)動(dòng)作不太大的圖像,解碼幀率明顯較高;而對(duì)于foreman、carphone和trevor這些運(yùn)動(dòng)動(dòng)作較大的圖像,解碼幀率就較低。
    實(shí)驗(yàn)結(jié)果表明,本系統(tǒng)可以實(shí)現(xiàn)低幀率、低分辨率的嵌入式MPEG4視頻實(shí)時(shí)解碼。

5  結(jié)束語(yǔ)

    本文重點(diǎn)研究了基于ARM開(kāi)發(fā)平臺(tái)對(duì)MPEG4實(shí)時(shí)解碼的算法優(yōu)化及其硬件實(shí)現(xiàn)。主要完成了以下幾方面工作: 針對(duì)ARM7TDMI的體系結(jié)構(gòu),對(duì)解碼的關(guān)鍵部分進(jìn)行了算法優(yōu)化和代碼優(yōu)化,從而極大地提高了解碼速度;針對(duì)具體的硬件平臺(tái)——基于ARM7TDMI的Eeay ARM2200開(kāi)發(fā)板,建立了μClinux開(kāi)發(fā)環(huán)境,在其上開(kāi)發(fā)應(yīng)用程序,添加到目標(biāo)系統(tǒng)中并調(diào)試,最后完成了15fps的MPEG4視頻解碼嵌入式系統(tǒng)的實(shí)時(shí)實(shí)現(xiàn)。
    隨著人們對(duì)視覺(jué)媒體的要求越來(lái)越高,基于嵌入式系統(tǒng)視頻解碼技術(shù)將具有越來(lái)越廣闊的前景。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉