當(dāng)前位置:首頁 > 嵌入式 > 嵌入式硬件
[導(dǎo)讀]MPEG-4視頻編碼技術(shù)可以在較小的帶寬下傳輸高質(zhì)量的視頻數(shù)據(jù),節(jié)省大量存儲(chǔ)空間,但編碼復(fù)雜度也較高,目前豐要有3種實(shí)現(xiàn)方案:在通用PC上編程實(shí)現(xiàn);通過ASIC硬件實(shí)現(xiàn)以及使用通用DSP芯片。

引言

MPEG-4視頻編碼技術(shù)可以在較小的帶寬下傳輸高質(zhì)量的視頻數(shù)據(jù),節(jié)省大量存儲(chǔ)空間,但編碼復(fù)雜度也較高,目前豐要有3種實(shí)現(xiàn)方案:在通用PC上編程實(shí)現(xiàn);通過ASIC硬件實(shí)現(xiàn)以及使用通用DSP芯片實(shí)現(xiàn)。與前兩者相比,通用DSP芯片實(shí)現(xiàn)方案具有以下優(yōu)勢:運(yùn)算性能強(qiáng);可升級性好,與PC類似,通用DSP芯片的功能仍是通過編程來實(shí)現(xiàn)的,能快速、方便地進(jìn)行軟件升級及添加新的功能,以適應(yīng)技術(shù)發(fā)展和市場變化;成本低、功耗低、適應(yīng)場合廣泛。

系統(tǒng)硬件設(shè)計(jì)

編碼系統(tǒng)處理核心為ADSP-BF533(以下簡稱BF533),利用其多功能并行接口PPI采集視頻數(shù)據(jù),該P(yáng)PI具有DMA功能,無需內(nèi)核干預(yù)便可進(jìn)行高速數(shù)據(jù)傳輸,傳輸完成后可自動(dòng)向內(nèi)核發(fā)出DMA中斷。

視頻采集部分選用0mniVision公司的CIF級彩色CMOS圖像傳感芯片OV6630,其最大分辨率為352×288,采集速率最高可達(dá)60fps,且片內(nèi)硬件實(shí)現(xiàn)了原始RGB數(shù)據(jù)到4:2:2YUV格式數(shù)據(jù)的轉(zhuǎn)換,用戶無需自行編寫復(fù)雜的RGB轉(zhuǎn)YUV應(yīng)用程序,大大減少了代碼量,很適合用作MPEG-4編碼。

設(shè)置OV6630輸出為4:2:2 YUV視頻數(shù)據(jù)格式,BF533的PPI即可直接接收該格式視頻數(shù)據(jù)。二者可實(shí)現(xiàn)無縫連接,無需中間電路。

考慮到目前還有大量模擬制式的攝像機(jī)仍在廣泛應(yīng)用,系統(tǒng)中還增加了視頻ADC ADV7183,該芯片可以把PAL制模擬電視信號轉(zhuǎn)為ITU-R656標(biāo)準(zhǔn)4:2:2格式數(shù)字視頻,同樣將ADV7183輸出端口與BF533的PPI相連。這樣,既可以采用系統(tǒng)自帶CMOS圖像傳感器采集視頻,也可以外接PAL制模擬攝像機(jī),用戶可自由選擇。

由于BF533片內(nèi)存儲(chǔ)空間有限,而視頻采集、編碼數(shù)據(jù)量巨大,選用一片Hynix公司的4MBSDRAM HY57V56162(內(nèi)含4個(gè)內(nèi)部子集)作為BF533片外大容量動(dòng)態(tài)存儲(chǔ)器。同時(shí),為存放程序啟動(dòng)代碼,利用一片容量為1MB的閃存芯片PSD4256G6V構(gòu)成BF533的片外非易失性存儲(chǔ)器。系統(tǒng)硬件構(gòu)成如圖1所示。

編碼器設(shè)計(jì)實(shí)現(xiàn)

存儲(chǔ)器空間分配

BF533采用統(tǒng)一的32位、共4GB可尋址空間,包括位于片內(nèi)的L1高速SRAM,片外的同步存儲(chǔ)器空間SDRAMSpace,以及異步存儲(chǔ)器空間(A syn chronousMemory Space)。

片內(nèi)Ll SRAM包括:64KB指令SRAM、16KB指令Cache/SRAM、32KB數(shù)據(jù)SRAM、32KB數(shù)據(jù)Cache/SRAM,以及4KB便簽存儲(chǔ)器。
L1 SRAM工作在內(nèi)核時(shí)鐘頻率,內(nèi)核可以對其進(jìn)行高速帶寬訪問。它是所有存儲(chǔ)器中訪問速度最快的,但容量有限,因此,只應(yīng)將那些最關(guān)鍵的代碼和數(shù)據(jù)存放在L1SRAM里。同時(shí),指令Cache和數(shù)據(jù)Cache全部使能,這樣可以大大提高訪問片外存儲(chǔ)器的效率。Cache設(shè)置是通過相應(yīng)的I M E M_C O N T R O L、DMEM_CONTROL,以及CPLB寄存器配置實(shí)現(xiàn)的。

由于BF533片內(nèi)存儲(chǔ)空間有限,而原始視頻數(shù)據(jù)量較大:CIF級4:2:2格式每幀圖像占用的空間為202752字節(jié),如果采用模擬PAL制式視頻輸入,每幀占用空間更是高達(dá)829440字節(jié),只能將其放至SDRAM中。同樣,視頻編碼數(shù)據(jù)也應(yīng)存放在SDRAM中。此外,系統(tǒng)啟動(dòng)完成Boot loader引導(dǎo)后,主要關(guān)鍵代碼放在片內(nèi)L1程序SRAM中執(zhí)行,但大部分程序代碼仍需從SDRAM中執(zhí)行。由于SDRAM特殊的讀/寫方式,如果下次訪問內(nèi)存頁與當(dāng)前活動(dòng)頁(Active Page)不同,即出現(xiàn)了頁錯(cuò)失(Page Miss),SDRAM就必須首先關(guān)閉當(dāng)前頁,再打開新的頁,大大降低了SDRAM讀寫速率。而該系統(tǒng)中SDRAM又需存儲(chǔ)多種數(shù)據(jù),內(nèi)核、DMA均需要頻繁訪問SDRAM,因此,應(yīng)精心分配SDRAM空間,以使頁錯(cuò)失現(xiàn)象盡量少發(fā)生。

BF533的SDRAM控制器(SDC)可以支持SDRAM每個(gè)內(nèi)部子集中的一個(gè)活動(dòng)頁,且在這4個(gè)I-Bank中進(jìn)行切換時(shí)無需任何延遲。這樣,將不同的數(shù)據(jù)、代碼映射至不同的I-Bank,可使頁錯(cuò)失現(xiàn)象降到最少,進(jìn)而改善訪問SDRAM的效率。

由于需要實(shí)時(shí)編碼,為保證視頻采集和壓縮可以同步執(zhí)行,采用乒乓緩沖技術(shù):設(shè)置了兩塊視頻幀接收緩沖區(qū)BUF1和BUF2,采用BF533的DMA傳輸鏈方式進(jìn)行傳輸。當(dāng)某一DMA緩沖區(qū)填滿后,內(nèi)核對其作MPEG-4編碼(同時(shí)也在構(gòu)建參考幀),此時(shí)DMA開始對另一塊緩沖區(qū)進(jìn)行填充。由于BUF1、BUF2、程序代碼以及參考幀均位于不同的I-Bank,減少了SDRAM頁面切換的機(jī)會(huì),實(shí)現(xiàn)了對SDRAM的高效訪問。

MPEG-4程序流程

MPEG-4編碼是基于宏塊(Macro Block)進(jìn)行的,每個(gè)宏塊包含4個(gè)8×8亮度子塊和2個(gè)8×8色度子塊。MPEG-4編碼原理主要包括對I幀和P幀的編碼,P幀比I幀多出了運(yùn)動(dòng)估計(jì)和補(bǔ)償模塊,二者編碼流程如圖2所示。

代碼編寫及優(yōu)化

BF533支持C/C++高級語言,但高級語言執(zhí)行效率較低,為達(dá)到最大執(zhí)行效率,采用全匯編語言實(shí)現(xiàn)MPEG-4編碼。

對于I幀編碼,主要的運(yùn)算量是前向離散余弦變換FDCT和反向離散余弦變換IDCT,這里采用了ADI提供的優(yōu)化代碼,它基于chen氏快速DCT算法,大量運(yùn)用了BF533特有的并行指令,完成一次8×8 DCT僅需293個(gè)時(shí)鐘周期。

與I幀相比,P幀編碼相對復(fù)雜,其中,運(yùn)動(dòng)估計(jì)是P幀編碼最費(fèi)時(shí)的部分,即在參考幀中搜索與當(dāng)前編碼宏塊或子塊最匹配的位置。
SAD(絕對誤差和)準(zhǔn)則具有無需乘除運(yùn)算、實(shí)現(xiàn)簡單方便等優(yōu)點(diǎn),選用它作為運(yùn)動(dòng)估計(jì)匹配準(zhǔn)則。

運(yùn)動(dòng)估計(jì)搜索算法則采用菱形搜索法(又稱鉆石搜索法),搜索精度為半像素,菱形搜索法具有簡單、魯棒、高效的特點(diǎn)。

Blackfin匯編指令集中有專門用于SAD計(jì)算的指令SAA(src_reg_O,src_reg_1),一條該指令即可同時(shí)完成4個(gè)字節(jié)的SAD計(jì)算。此外,綜合使用其它一些視頻專用操作指令,如BYTEPACK(_將4個(gè)字節(jié)打包至一個(gè)3 2位寄存器中)、BYTEUNPACK(與BYTEPACK功能相反)、BYTEOPl6M(對4個(gè)字節(jié)作減法處理),可以使代碼運(yùn)行效率得到顯著改善。

BF533集成開發(fā)環(huán)境VisualDSP++中還提供了Profile功能,可以利用該功能對程序代碼性能進(jìn)行評估,發(fā)現(xiàn)程序執(zhí)行的瓶頸,從而進(jìn)行有針對性的優(yōu)化。主要的優(yōu)化方法有:

1.盡量減少分支、條件判斷指令,因?yàn)檫@些指令會(huì)破壞BF533流水線,造成額外的時(shí)鐘延遲;同時(shí),對部分較簡單的子程序用宏改寫,免去子程序調(diào)用過程中的堆棧操作和參數(shù)傳遞;
2.采用并行執(zhí)行指令,BF533并非超標(biāo)量結(jié)構(gòu)DSP,但仍能有限地支持最多3條指令并行執(zhí)行,如:saa(r1:0,r3:2)Ⅱr0=[i0++]Ⅱr2=[i1++];使用該并行指令即可在一個(gè)時(shí)鐘周期內(nèi)完成4個(gè)字節(jié)的SAD計(jì)算,同時(shí)完成r0、r2的數(shù)據(jù)更新,以便下次計(jì)算;
3.在DCT/IDCT的量化過程及其它一些模塊中,要牽涉到除法,而BF533計(jì)算除法需要耗費(fèi)大量時(shí)鐘周期,因此,這里將除法變?yōu)槌艘粤炕蜃拥牡箶?shù),求倒數(shù)可以通過查找表方式實(shí)現(xiàn)。再結(jié)合移位操作,即可在基本不損失精度的同時(shí)達(dá)到高效計(jì)算除法的目的。

經(jīng)過前述的優(yōu)化過程后,成功地在BF533上實(shí)現(xiàn)了MPEG-4 SP的CIF級實(shí)時(shí)編碼。此外,對于CIF級CMOS傳感器OV6630,系統(tǒng)可以直接對其實(shí)時(shí)編碼。但如果是外接PAL制式模擬攝像頭,經(jīng)ADV7183作A/D轉(zhuǎn)換后,其分辨率為720×576,受BF533的性能限制,尚無法對該級別分辨率做到實(shí)時(shí)編碼,因此,應(yīng)先使其分辨率降為352×288,然后再作:MPEG-4編碼。

實(shí)驗(yàn)結(jié)果

BF533內(nèi)核時(shí)鐘(CLK)設(shè)為594MHz,系統(tǒng)時(shí)鐘(SLK)為118.8MHz。選取CIF級標(biāo)準(zhǔn)測試序列flower(幀速率為25fps,共75幀)對系統(tǒng)進(jìn)行驗(yàn)證。

圖3、圖4給出了分別采用I幀編碼和P幀編碼后的重建圖像。I幀編碼壓縮率為11.5:1,重建圖像信噪比為33.43dB。P幀編碼壓縮率則達(dá)到了65.7:1,重建圖像信噪比為32.65dB。經(jīng)采用BF533片內(nèi)實(shí)時(shí)時(shí)鐘RTC精確計(jì)時(shí),整個(gè)視頻序列共75幀,編碼耗費(fèi)2.27s,平均編碼率達(dá)到了33fps,滿足實(shí)時(shí)編碼要求。


結(jié)語

本文介紹了CIF級別的MPEG-4 SP實(shí)時(shí)編碼在BF533 DSP;DSP片上的實(shí)現(xiàn),該編碼器可以靈活地選用系統(tǒng)自帶CMOS傳感器及用戶自選PAL制模擬攝像機(jī)兩種視頻采集源。該系統(tǒng)可以用在IP可視電話、交通檢測、超市監(jiān)視、智能小區(qū)安保等領(lǐng)域,具有很強(qiáng)的實(shí)用價(jià)值

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動(dòng)力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉