當(dāng)前位置:首頁 > 嵌入式 > 嵌入式軟件
[導(dǎo)讀]基于OMAP的MPEG-4實(shí)時解碼器的實(shí)現(xiàn)

 隨著移動通信和多媒體技術(shù)的發(fā)展,人們對通信的要求已不滿足于傳統(tǒng)的語音業(yè)務(wù),而是追求更高品質(zhì)的視頻、音頻等多媒體信息服務(wù)。在多媒體通信中,視頻區(qū)別于音頻和文字的顯著特點(diǎn)是其大數(shù)據(jù)量以及高處理復(fù)雜度?,F(xiàn)有的移動終端一般采用DSP芯片作為核心,DSP芯片在數(shù)據(jù)處理方面具有較多的優(yōu)勢,但其系統(tǒng)處理和控制能力比較弱。第三代移動通信(3G)終端需要提供更多更復(fù)雜的服務(wù)如實(shí)時視頻交互等,原有的DSP芯片很難滿足這些需求[1]。TI公司提出了開放式多媒體應(yīng)用平臺OMAP(Open Multimedia Applications Platform)體系結(jié)構(gòu),并為此設(shè)計(jì)了OMAP處理器。筆者利用本文提出的方法在使用TI OMAP1510的PocketPC上實(shí)現(xiàn)了MPEG-4簡單級(simple profile)解碼,基本滿足了實(shí)時的要求,同時保持了較好的質(zhì)量。
1 開放式多媒體平臺(OMAP)
    OMAP采用一種獨(dú)特的雙核結(jié)構(gòu),把控制性能較強(qiáng)的ARM處理器與高性能低功耗的DSP核結(jié)合,是一種開放式的、可編程的基于DSP的體系結(jié)構(gòu)。主要目標(biāo)是滿足2.5G和3G網(wǎng)絡(luò)上移動電話、PDA上的語音與多媒體需要。
1.1 OMAP的硬件平臺
    OMAP硬件平臺主要由DSP核、ARM核以及業(yè)務(wù)控制器(Traffic Controller)組成。這三部分可以獨(dú)立地進(jìn)行時鐘管理,有效地控制功耗。OMAP硬件平臺采用雙核技術(shù)提高操作系統(tǒng)的效率和優(yōu)化多媒體代碼的執(zhí)行。實(shí)時性任務(wù)如實(shí)時視頻通信等由DSP完成,非實(shí)時性任務(wù)和系統(tǒng)控制工作如界面交互、操作系統(tǒng)等由ARM完成[2]。例如,使用者在進(jìn)行視頻通信時可以同時使用操作系統(tǒng)上的應(yīng)用軟件如Word、Excel等,這樣分別利用了DSP低功耗而又較強(qiáng)數(shù)據(jù)處理能力和ARM的較強(qiáng)控制能力的優(yōu)勢。與傳統(tǒng)只使用ARM或者只使用DSP芯片的移動終端相比,OMAP成功地解決了性能與功耗的最佳組合問題。
    OMAP硬件平臺不斷升級,以滿足日益增長的應(yīng)用需求。本文使用OMAP1510芯片,它的兩個關(guān)鍵部分是TI增強(qiáng)型ARM925(TI925T)和TMS320C55x DSP。TMS320C55x DSP的工作主頻為200MHz,內(nèi)部有32K字雙存取SRAM,48K字單存取SRAM和12K字的高速指令緩存。它具有高度的并行能力,32位讀寫和功能強(qiáng)大的EMIF、雙流水線的獨(dú)立操作以及雙MAC的運(yùn)算能力。它采用了三項(xiàng)關(guān)鍵的革新技術(shù):增大的空閑省電區(qū)域、變長指令、擴(kuò)大的并行機(jī)制。此外TMS320C55x DSP核增加了處理運(yùn)動估計(jì)、離散余弦變換(DCT)、離散余弦反變換(IDCT)、1/2像素插值的硬件加速器,降低了視頻處理的功耗,其結(jié)構(gòu)對于多媒體應(yīng)用高度優(yōu)化,適合低功耗的實(shí)時語音圖像處理。TI增強(qiáng)型ARM925采用ARM9TDMI技術(shù),工作主頻為175MHz,有16K字節(jié)的高速指令緩存、8K字節(jié)的高速數(shù)據(jù)緩存和17個字的寫緩沖。ARM和DSP都可以訪問內(nèi)部SRAM和外部存儲器接口,但ARM是平臺的核心,它能訪問全部16M字節(jié)的內(nèi)存空間和DSP的128K字節(jié)的I/O空間。
1.2 OMAP的軟件平臺
    OMAP的軟件結(jié)構(gòu)建立在兩個操作系統(tǒng)之上,一個是基于ARM的操作系統(tǒng)如WindowsCE、Linux等;另一個是基于DSP的實(shí)時操作系統(tǒng)(RTOS)DSP/BIOS。無縫連接兩個操作系統(tǒng)的關(guān)鍵技術(shù)是DSP/BIOS橋。DSP/BIOS橋建立的這種連接使ARM端的客戶能與DSP上的任務(wù)交換信息和數(shù)據(jù)[3]。對于軟件開發(fā)者來說,DSP/BIOS橋提供了一種使用DSP的無縫接口,開發(fā)者可以在GPP(通用處理器,包括ARM)上使用標(biāo)準(zhǔn)應(yīng)用編程接口訪問并控制DSP的運(yùn)行環(huán)境。
2 MPEG-4實(shí)時視頻解碼在OMAP上的軟件實(shí)現(xiàn)
2.1 MPEG-4解碼流程

    MPEG-4標(biāo)準(zhǔn)因其給出多種抗誤碼工具而適于應(yīng)用在無線信道環(huán)境下的多媒體通信[4]。本文實(shí)現(xiàn)的是主要應(yīng)用于無線通信的簡單級(simple profile)[5],因而只使用了I幀和P幀。其解碼的流程如圖1所示。如果是I幀,碼流中主要是紋理信息,經(jīng)過可變長(VLC)解碼、反掃描、反預(yù)測、反量化和反DCT(IDCT)可以直接得到重構(gòu)的幀。如果是P幀,碼流中還含有運(yùn)動矢量信息,經(jīng)過VLC解碼、反掃描、反預(yù)測、反量化和反DCT得到的只是殘差信息。利用解碼得到的運(yùn)動矢量、殘差信息和參考幀進(jìn)行運(yùn)動補(bǔ)償可以得到重構(gòu)的幀。

 


2.2 在OMAP1510上的程序結(jié)構(gòu)
    在OMAP上開發(fā)程序通常分為兩部分,一部分是使用Embedded Visual C開發(fā)ARM端程序,另一部分是使用TI CCS開發(fā)DSP端程序。前者主要是為了使設(shè)計(jì)的算法與xDAIS(eXpressDSP TM算法標(biāo)準(zhǔn))兼容,在ARM端程序中調(diào)用一些DSP/BIOS橋的API實(shí)現(xiàn)在DSP上初始化信號處理任務(wù)、與DSP任務(wù)交換消息、對來自DSP和從DSP發(fā)出的數(shù)據(jù)流進(jìn)行緩沖、暫停、繼續(xù)、刪除DSP任務(wù)并進(jìn)行資源狀態(tài)查詢等。而具體的功能實(shí)現(xiàn)則是在DSP端完成。圖2顯示了TI-enhanced ARM925應(yīng)用程序與DSP節(jié)點(diǎn)之間的關(guān)系。

 


    通過寫節(jié)點(diǎn)封裝器的創(chuàng)建、執(zhí)行及刪除函數(shù),將xDAIS算法封裝于DSP節(jié)點(diǎn)中。創(chuàng)建函數(shù)可分配節(jié)點(diǎn)處理和xDAIS算法所需的存儲器,還可分配節(jié)點(diǎn)的相關(guān)模塊。這些模塊是傳遞到執(zhí)行和刪除函數(shù)的一種結(jié)構(gòu)。創(chuàng)建函數(shù)還可給出xDAIS算法的實(shí)例,并可將其激活,還可初始化任何在任務(wù)執(zhí)行前必須初始化的數(shù)據(jù)或參數(shù)。執(zhí)行函數(shù)是主要的分派函數(shù),在此函數(shù)執(zhí)行階段中一般不分配存儲器及其它資源。執(zhí)行函數(shù)一般包括消息處理循環(huán),該循環(huán)可中斷函數(shù)并等待來自ARM925的消息或數(shù)據(jù)流,然后節(jié)點(diǎn)將這些消息或數(shù)據(jù)分派到合適的xDAIS控制或處理任務(wù)中去。同時執(zhí)行函數(shù)查詢DSP/BIOS橋所發(fā)送的指示函數(shù)退出循環(huán)的特殊消息,然后檢查定制消息或流數(shù)據(jù),并對這些消息或數(shù)據(jù)流進(jìn)行適當(dāng)處理。刪除函數(shù)清空創(chuàng)建函數(shù)所分配的資源,包括相關(guān)模塊和數(shù)據(jù)流。刪除函數(shù)還必須關(guān)閉算法、釋放存儲器以及分配給節(jié)點(diǎn)的其它資源。
2.3 程序的優(yōu)化考慮
    (1)合理分配存儲位置。TMS320C55x的片內(nèi)存儲器容量小而存取速度快,片外存儲器容量大但存取速度慢。在分配存儲器的時候應(yīng)考慮到這個特點(diǎn)合理地安排程序各部分。對于那些使用頻繁的變量應(yīng)考慮放在片內(nèi),如VLC表、運(yùn)動矢量、反量化、反DCT的系數(shù)以及其它中間變量都應(yīng)放在片內(nèi),而對于那些執(zhí)行次數(shù)比較少或者比較大的變量如參考幀和當(dāng)前解碼出的幀則應(yīng)該放在片外。此外由于編譯和分配空間是以文件為單位的,所以應(yīng)當(dāng)把使用頻繁的函數(shù)盡量放在相同的幾個文件中,再將這幾個文件放入片內(nèi)存儲器以高效地利用有限的片內(nèi)資源。
    (2)數(shù)據(jù)傳輸?shù)墓芾怼τ谝曨l解碼工作來說,TMS320C55x的片內(nèi)存儲器資源不是很多,必須合理利用。例如一幀4:2:0的QCIF(176×144)圖像,如果以緊湊的方式(2個字節(jié)存到一個16bit的字中)存放也需要18K字。因此不可能在解碼時把一整幀都放在片內(nèi),而應(yīng)考慮使用DMA在需要時把圖像的一部分傳入片內(nèi)進(jìn)行處理。此外,為了使CPU訪問和DMA傳輸同時無沖突地進(jìn)行,將數(shù)據(jù)訪問設(shè)計(jì)成乒乓結(jié)構(gòu)。在解I幀時片內(nèi)準(zhǔn)備兩個大小為一宏塊行的存儲區(qū)用于存放YUV數(shù)據(jù),CPU將解碼的一宏塊行數(shù)據(jù)放在其中一塊后,DMA把這一宏塊行的數(shù)據(jù)傳輸?shù)狡鈱?yīng)的位置,同時CPU解下一宏塊行的數(shù)據(jù)并將結(jié)果放在另外一塊存儲區(qū),DMA再傳送此塊的數(shù)據(jù),如此反復(fù)執(zhí)行。選擇兩宏塊行大小的原因是不能使用片內(nèi)太多的存儲器資源,同時如果每次解碼傳輸?shù)臄?shù)據(jù)太少將過于頻繁地啟動DMA,導(dǎo)致效率下降,折衷考慮決定在片內(nèi)為解碼數(shù)據(jù)開辟兩宏塊行大小的緩存。而在解P幀的時候因?yàn)橐茸x入?yún)⒖紟哪承?shù)據(jù)所以更為復(fù)雜。在片內(nèi)開辟兩塊緩存,用以存放對Inter宏塊進(jìn)行運(yùn)動補(bǔ)償所需的參考幀中對應(yīng)搜索范圍內(nèi)的數(shù)據(jù),同時準(zhǔn)備兩個宏塊大小的片內(nèi)空間用于存放當(dāng)前宏塊解碼的結(jié)果(為描述方便稱為M1和M2)。此時需要使用兩個DMA通道,通道1負(fù)責(zé)將解當(dāng)前宏塊進(jìn)行運(yùn)動補(bǔ)償時所需的參考幀部分?jǐn)?shù)據(jù)讀到片內(nèi)緩存中,通道2負(fù)責(zé)將解碼的數(shù)據(jù)傳輸?shù)狡鈱?yīng)的空間。先啟動通道1讀所需參考幀數(shù)據(jù)到緩存1,CPU用這些數(shù)據(jù)和讀入的碼流對Inter宏塊進(jìn)行運(yùn)動補(bǔ)償解出當(dāng)前宏塊的數(shù)據(jù)放入M1,同時通道1讀下一宏塊所需的參考幀數(shù)據(jù)到緩存2。之后CPU、通道1、通道2并行工作,CPU利用緩存2的數(shù)據(jù)解下一宏塊放入M2,通道1再讀數(shù)據(jù)到緩存1中,通道2將解碼的數(shù)據(jù)從M1傳輸?shù)狡鈱?yīng)的空間,如此循環(huán),P幀利用DMA解碼如圖3所示。

 


    (3)使用TI提供的IMGLIB庫函數(shù)。IMGLIB是專門為圖像處理和視頻提供的庫,用來提高視頻處理速度。這些庫函數(shù)中有的是軟件庫函數(shù),是用匯編寫成的高效代碼例如反量化函數(shù)IMG_dequantize_8x8等;有的則是硬件庫函數(shù),它們利用OMAP1510芯片中一些專門為視頻編解碼的硬件加速模塊來處理數(shù)據(jù),如利用反DCT模塊的IMG_idct_8x8等,這些函數(shù)處理數(shù)據(jù)的速度更快,效率更高。在使用某些庫函數(shù)的時候需要按照其接口的要求調(diào)整。
    (4)使用DSP內(nèi)部固定的intrinsics指令,這些指令主要執(zhí)行一些簡單的算術(shù)操作,由于它們是由優(yōu)化的匯編代碼寫成,因而使用它們可以提高代碼執(zhí)行的效率。
    (5)其它一些優(yōu)化考慮和措施。為了使程序的效率更高,采用了一些代碼優(yōu)化的措施,例如將一些循環(huán)內(nèi)部展開,特別是對多重循環(huán)的控制,如果外層循環(huán)較少,可將內(nèi)層循環(huán)展開,把轉(zhuǎn)移條件結(jié)合起來,以減少內(nèi)層與外層之間的相互聯(lián)系,減少判斷轉(zhuǎn)移并實(shí)現(xiàn)并行操作。又如利用DMA來代替原有的復(fù)制函數(shù)、為方便將浮點(diǎn)數(shù)定點(diǎn)化、使用移位操作代替乘除法等。此外,在應(yīng)用到多媒體通信中,采用支持?jǐn)?shù)據(jù)分割的方法來有效控制無線通信中可能產(chǎn)生的誤碼。
3 測試結(jié)果
    使用QCIF(176×144)的兩測試碼流foreman和carphone(各編碼100幀)在使用數(shù)據(jù)分割和沒使用數(shù)據(jù)分割的情況下得到的解碼速度(包括顯示部分)如表1所示。

 


    從表1可以看出,本文提出的方法基本上能夠滿足MPEG-4實(shí)時解碼的需求,即使對比較復(fù)雜的使用數(shù)據(jù)分割的序列,仍能達(dá)到25幀/秒(fps)以上,圖像的質(zhì)量也比較好,因此適合在無線終端實(shí)現(xiàn)多媒體的應(yīng)用。
    OMAP平臺因其獨(dú)有的雙核結(jié)構(gòu)和為無線應(yīng)用提供了一個強(qiáng)大的軟硬件基礎(chǔ)。本文結(jié)合其在MPEG-4解碼中應(yīng)用的實(shí)例,具體闡述了OMAP1510的軟件優(yōu)化開發(fā)方法,并基本上實(shí)現(xiàn)了實(shí)時解碼,希望能對使用OMAP或準(zhǔn)備使用的開發(fā)人員具有借鑒意義。
參考文獻(xiàn)
1 Jamil Chaoi. Dedicated Systems Magazine. 2001 Q2.
2 謝 凱.開放式的多媒體應(yīng)用平臺OMAP.電子技術(shù)應(yīng)用,2001;27(11)
3 TI公司. OMAP1510 Multimedia Processor Technical Reference Manual. Dec.2002
4 宋 彬,常義林.視頻通信抗誤碼方法研究的新進(jìn)展.電子學(xué)報(bào),2002;(10)
5 ISO/IEC JTC 1/SC 29/WG 11 N 3056, Information technology-Coding of audio-viusal objects-Part2:Visual, Version 1.0, Jan ,2000

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉