基于TMS320C64xDSPs的MPEG-4實(shí)時(shí)編碼器設(shè)計(jì)與實(shí)現(xiàn)
掃描二維碼
隨時(shí)隨地手機(jī)看文章
;;; 摘要:設(shè)計(jì)并實(shí)現(xiàn)了一種基于TMS320C64x系列高性能通用DSPs的MPEG-4 Simple Profile編碼器。詳細(xì)介紹了系統(tǒng)的硬件結(jié)構(gòu)和工作流程。為解決高分辨率視頻編碼的實(shí)時(shí)性問(wèn)題,采用預(yù)測(cè)技術(shù)的運(yùn)動(dòng)估計(jì)計(jì)算法以及基于C64x CPU的軟件優(yōu)化技術(shù)。實(shí)驗(yàn)結(jié)果表明編碼器對(duì)D1分辨率(720×576)視頻的編碼速率達(dá)到25幀/秒以上,且具有較低的碼率和較好的圖像質(zhì)量。 ;;;; 關(guān)鍵詞:MPEG-4 TMS320C64x 軟件優(yōu)化 運(yùn)動(dòng)估計(jì)信息時(shí)代對(duì)于視頻通訊的需求越來(lái)越廣,從較低碼率的可視電話(huà)、視頻會(huì)議、實(shí)時(shí)監(jiān)控到高碼率的空中偵察、數(shù)字電視等,迫切要求將高效率、高質(zhì)量的視頻壓縮算法實(shí)用化。MPEG-4于2000年正式成為國(guó)標(biāo)標(biāo)準(zhǔn)并不斷地?cái)U(kuò)展。它不僅支持碼率低于64kbps的多媒體通信,還能支持廣播級(jí)的視頻應(yīng)用。與以前的視頻標(biāo)準(zhǔn)相比,MPEG-4可以提供更高的壓縮效率、更好的交互性以及更強(qiáng)的抗誤碼能力。目前,MPEG-4已經(jīng)成為視頻壓縮標(biāo)準(zhǔn)的主流。MPEG-4算法非常復(fù)雜,其編碼碼的實(shí)時(shí)性難以保證,通常只能實(shí)現(xiàn)對(duì)中低分辨率視頻的實(shí)時(shí)編碼。本文基于TI公司的C64x系列DSPs設(shè)計(jì)并實(shí)現(xiàn)了一種MPEG-4編碼器,實(shí)現(xiàn)了對(duì)DI分辨率(720×576)視頻的實(shí)時(shí)編碼,且在保證輸出碼率低于1Mbps的同時(shí),解碼圖像具有較高的峰值信噪比和較好的視覺(jué)效果。
1 編碼系統(tǒng)的硬件結(jié)構(gòu)編碼系統(tǒng)以TMS320DM642高性能通用DSP芯片為核心。圖1為系統(tǒng)框圖。1.1 TMS320DM642芯片的特點(diǎn)DM642屬于TI公司的C64x系列DSPs。Veloci TI結(jié)構(gòu)使C6000 DSPs在視頻和圖像處理中得到廣泛應(yīng)用。CPU的VLIW結(jié)構(gòu)由多個(gè)并行運(yùn)行的執(zhí)行單元組成,這些單元在單個(gè)周期內(nèi)可執(zhí)行多種指令。并行是C6000獲得高性能的關(guān)鍵。C64x在C6000的基礎(chǔ)上有一些重要的改進(jìn)。除了有更高的時(shí)鐘頻率外,C64x從以前的Veloci TI結(jié)構(gòu)擴(kuò)展到Veloci TI.2結(jié)構(gòu),包含了許多新的指令,增加了額外的數(shù)據(jù)通道,寄存器的數(shù)量也增加了一倍。這些擴(kuò)展使得CPU可以在一個(gè)時(shí)鐘周期內(nèi)處理更多的數(shù)據(jù),從而獲得更高的運(yùn)算性能。DM642芯片集成了各種片內(nèi)外設(shè),使得開(kāi)發(fā)視頻和圖像領(lǐng)域的應(yīng)用更為方便。它帶有三個(gè)可配置的視頻端口,提供與視頻輸入、視頻輸出以及碼流輸入的無(wú)縫接口。這些視頻端口支持許多格式的視頻輸入/輸出,包括BT.656、HDTV Y/C、RGB以及MPEG-2碼流的輸入。利用DM642開(kāi)發(fā)視頻編碼器,其視頻輸入部分只需要一塊視頻采集芯片即可,如Phillips的SAA7113,無(wú)需外加邏輯控制電路和FIFO緩存,使硬件系統(tǒng)更為簡(jiǎn)單和穩(wěn)定。DM642的其它外設(shè)包括:10Mbps/100Mbps的以太網(wǎng)口(EMAC)、多通道音頻串口(McASP)、外部存儲(chǔ)器接口(EMAC)、主機(jī)接口(HPI)、多通道緩沖串口(McBSP以及PCI接口等。1.2 系統(tǒng)工作流程該編碼系統(tǒng)可分為圖像壓縮卡和主機(jī)兩部分。其工作流程如圖2所示。首先主機(jī)通過(guò)PCI初始化DSP并對(duì)其加載程序;DSP開(kāi)始運(yùn)行MPEG-4編碼程序,從視頻端口獲取實(shí)時(shí)采集的視頻,如圖1所示。SAA7113輸出BT.656格式的數(shù)字視頻,作為DM642 VPORT的輸入,VPORT輸出YUV(4:2:0)格式的圖像,作為編碼程序的輸入;DSP完成一幀圖像的編碼,通過(guò)PCI向主機(jī)發(fā)出中斷;主機(jī)響應(yīng)中斷,從DSP 存儲(chǔ)空間讀取原始圖像數(shù)據(jù)和壓縮后的碼流。主機(jī)程序在VC++環(huán)境下編寫(xiě),提供與用戶(hù)交互的界面,可對(duì)數(shù)據(jù)進(jìn)行各種處理,包括原始視頻的實(shí)時(shí)播放、保存,壓縮碼流的實(shí)時(shí)解壓播放、保存、回放、網(wǎng)絡(luò)傳輸,從網(wǎng)絡(luò)接收壓縮碼流實(shí)時(shí)解壓回放等。
;;; 需要注意的是原始圖像和壓縮碼流在DSP中的存儲(chǔ)。視頻端口、編碼程序和主機(jī)都要訪問(wèn)原始圖像,例如在某一時(shí)刻,編碼程序訪問(wèn)當(dāng)前幀圖像,主機(jī)讀取上一幀圖像,而視頻端口正在輸入下一幀圖像,為了避免訪問(wèn)沖突,原始圖像在DSP中采用三緩沖區(qū)進(jìn)行管理。壓縮碼流由編碼程序?qū)懭搿V鳈C(jī)讀取,所以采用乒乓制進(jìn)行存儲(chǔ)。1.3 內(nèi)存分配DM642片內(nèi)只有256KB的存儲(chǔ)空間,因此當(dāng)前幀、參考幀和當(dāng)前幀的重建幀都必須放至片外存儲(chǔ)器,壓縮碼流若被主機(jī)讀取,也放至片外。其它數(shù)據(jù)如程序代碼、全局變量、VLC碼表、各編碼模塊產(chǎn)生的中間數(shù)據(jù)等均可放至片內(nèi)。由于CPU訪問(wèn)片外的速度通常要比訪問(wèn)片內(nèi)慢幾十倍,片外數(shù)據(jù)的傳輸通常成為程序運(yùn)行時(shí)的瓶頸,即使代碼