基于TMS320C64xDSPs的MPEG-4實時編碼器設(shè)計與實現(xiàn)
;;; 摘要:設(shè)計并實現(xiàn)了一種基于TMS320C64x系列高性能通用DSPs的MPEG-4 Simple Profile編碼器。詳細介紹了系統(tǒng)的硬件結(jié)構(gòu)和工作流程。為解決高分辨率視頻編碼的實時性問題,采用預測技術(shù)的運動估計計算法以及基于C64x CPU的軟件優(yōu)化技術(shù)。實驗結(jié)果表明編碼器對D1分辨率(720×576)視頻的編碼速率達到25幀/秒以上,且具有較低的碼率和較好的圖像質(zhì)量。 ;;;; 關(guān)鍵詞:MPEG-4 TMS320C64x 軟件優(yōu)化 運動估計信息時代對于視頻通訊的需求越來越廣,從較低碼率的可視電話、視頻會議、實時監(jiān)控到高碼率的空中偵察、數(shù)字電視等,迫切要求將高效率、高質(zhì)量的視頻壓縮算法實用化。MPEG-4于2000年正式成為國標標準并不斷地擴展。它不僅支持碼率低于64kbps的多媒體通信,還能支持廣播級的視頻應用。與以前的視頻標準相比,MPEG-4可以提供更高的壓縮效率、更好的交互性以及更強的抗誤碼能力。目前,MPEG-4已經(jīng)成為視頻壓縮標準的主流。MPEG-4算法非常復雜,其編碼碼的實時性難以保證,通常只能實現(xiàn)對中低分辨率視頻的實時編碼。本文基于TI公司的C64x系列DSPs設(shè)計并實現(xiàn)了一種MPEG-4編碼器,實現(xiàn)了對DI分辨率(720×576)視頻的實時編碼,且在保證輸出碼率低于1Mbps的同時,解碼圖像具有較高的峰值信噪比和較好的視覺效果。
1 編碼系統(tǒng)的硬件結(jié)構(gòu)編碼系統(tǒng)以TMS320DM642高性能通用DSP芯片為核心。圖1為系統(tǒng)框圖。1.1 TMS320DM642芯片的特點DM642屬于TI公司的C64x系列DSPs。Veloci TI結(jié)構(gòu)使C6000 DSPs在視頻和圖像處理中得到廣泛應用。CPU的VLIW結(jié)構(gòu)由多個并行運行的執(zhí)行單元組成,這些單元在單個周期內(nèi)可執(zhí)行多種指令。并行是C6000獲得高性能的關(guān)鍵。C64x在C6000的基礎(chǔ)上有一些重要的改進。除了有更高的時鐘頻率外,C64x從以前的Veloci TI結(jié)構(gòu)擴展到Veloci TI.2結(jié)構(gòu),包含了許多新的指令,增加了額外的數(shù)據(jù)通道,寄存器的數(shù)量也增加了一倍。這些擴展使得CPU可以在一個時鐘周期內(nèi)處理更多的數(shù)據(jù),從而獲得更高的運算性能。DM642芯片集成了各種片內(nèi)外設(shè),使得開發(fā)視頻和圖像領(lǐng)域的應用更為方便。它帶有三個可配置的視頻端口,提供與視頻輸入、視頻輸出以及碼流輸入的無縫接口。這些視頻端口支持許多格式的視頻輸入/輸出,包括BT.656、HDTV Y/C、RGB以及MPEG-2碼流的輸入。利用DM642開發(fā)視頻編碼器,其視頻輸入部分只需要一塊視頻采集芯片即可,如Phillips的SAA7113,無需外加邏輯控制電路和FIFO緩存,使硬件系統(tǒng)更為簡單和穩(wěn)定。DM642的其它外設(shè)包括:10Mbps/100Mbps的以太網(wǎng)口(EMAC)、多通道音頻串口(McASP)、外部存儲器接口(EMAC)、主機接口(HPI)、多通道緩沖串口(McBSP以及PCI接口等。1.2 系統(tǒng)工作流程該編碼系統(tǒng)可分為圖像壓縮卡和主機兩部分。其工作流程如圖2所示。首先主機通過PCI初始化DSP并對其加載程序;DSP開始運行MPEG-4編碼程序,從視頻端口獲取實時采集的視頻,如圖1所示。SAA7113輸出BT.656格式的數(shù)字視頻,作為DM642 VPORT的輸入,VPORT輸出YUV(4:2:0)格式的圖像,作為編碼程序的輸入;DSP完成一幀圖像的編碼,通過PCI向主機發(fā)出中斷;主機響應中斷,從DSP 存儲空間讀取原始圖像數(shù)據(jù)和壓縮后的碼流。主機程序在VC++環(huán)境下編寫,提供與用戶交互的界面,可對數(shù)據(jù)進行各種處理,包括原始視頻的實時播放、保存,壓縮碼流的實時解壓播放、保存、回放、網(wǎng)絡(luò)傳輸,從網(wǎng)絡(luò)接收壓縮碼流實時解壓回放等。
;;; 需要注意的是原始圖像和壓縮碼流在DSP中的存儲。視頻端口、編碼程序和主機都要訪問原始圖像,例如在某一時刻,編碼程序訪問當前幀圖像,主機讀取上一幀圖像,而視頻端口正在輸入下一幀圖像,為了避免訪問沖突,原始圖像在DSP中采用三緩沖區(qū)進行管理。壓縮碼流由編碼程序?qū)懭?。主機讀取,所以采用乒乓制進行存儲。1.3 內(nèi)存分配DM642片內(nèi)只有256KB的存儲空間,因此當前幀、參考幀和當前幀的重建幀都必須放至片外存儲器,壓縮碼流若被主機讀取,也放至片外。其它數(shù)據(jù)如程序代碼、全局變量、VLC碼表、各編碼模塊產(chǎn)生的中間數(shù)據(jù)等均可放至片內(nèi)。由于CPU訪問片外的速度通常要比訪問片內(nèi)慢幾十倍,片外數(shù)據(jù)的傳輸通常成為程序運行時的瓶頸,即使代碼