1 C5509 DSP 處理器的特點和工作原理
1.1 C5509 DSP的性能概述
C5509有32×16bit指令緩沖隊列,可實現(xiàn)高效的塊循環(huán)操作;兩個17×17bit的MAC單元,可在單周期內(nèi)執(zhí)行兩次MAC操作;1個40bit的ALU、1個40bit的桶型移位器,4個40bit的累加器可執(zhí)行比C54系列DSP更高效的算術運算,在400MHz的晶振驅(qū)動下,可達到800MIPS的性能。以44.1kHz采樣率的MP3數(shù)據(jù)流為例,對128kbit/s數(shù)據(jù)率的MP3數(shù)據(jù)進行解碼?;舴蚵獯a、IMDCT、子帶合成等運算模塊共需消耗1.3MIPS的CPU資源,對于平均每秒必須解碼44.6幀數(shù)據(jù)來講,總運算量為44.6×1.3=57.98MIPS,C5509完全可以滿足此速度要求。
C5509還具有128K×16bit的片上RAM,其中包括64KB的DARAM、192KB的SARAM和64KB的片上ROM。
與眾多TMS320系列DSP處理器一樣,C5509采用了哈佛結構,共有12組獨立總線,其中包括3組數(shù)據(jù)讀總線、2組數(shù)據(jù)寫總線、5組數(shù)據(jù)地址總線、1組程序讀總線和1組程序地址總線,這些總線并行地為各個計算單元提供指令和操作碼,從而為高速的數(shù)據(jù)運算提供了有力的保障。
1.2 C5509 DSP的外設介紹
C5509提供了專用的外部存儲器接口(EMIF),用于控制DSP與外部存儲器之間所有數(shù)據(jù)的傳輸??膳cEMIF無縫鏈接的存儲器有:異步存儲器(ROM、FLASH、 SRAM)、同步突發(fā)SRAM、同步DRAM(SDRAM),并可支持可選的32、16、8位數(shù)據(jù)訪問。對EMIF編程時,必須根據(jù)實際的外部存儲器考慮如何分配片內(nèi)使能空間(CE)。通過EMIF接口,主處理器可將數(shù)據(jù)和程序置于片外,從而節(jié)省了片上硬件資源。
其次,C5509有3個獨立的多通道緩存串口(McBSP),使得C5509能夠直接與其他C55xx系列DSP、多媒體數(shù)字信號編解碼器等設備高速互連,這些McBSP可以提供全速雙工通信,并支持128通道的收發(fā),接收或者發(fā)送可以選擇使用獨立的時鐘,字寬為8、12、16、20、24位任選。
為保證與常見的異步通信模塊進行數(shù)據(jù)通信,C5509提供了與TL16C550C等專用異步通信接口IC互連的UART,外部數(shù)據(jù)經(jīng)由TL16C550C進出DSP的UART,最終交給片內(nèi)CPU處理。圖1為與C5509配合使用的典型專用異步通信接口IC(TL16C550C)的管腳圖。
C5509的UART每接到數(shù)據(jù)就會產(chǎn)生相應的中斷請求,通知CPU及時采集數(shù)據(jù),將Rx線上的串行數(shù)據(jù)放入接收寄存器中,在滿足緩沖區(qū)長度后,寄存器的并行數(shù)據(jù)再交給CPU做后續(xù)處理。
2 解碼算法說明
2.1 MP3文件的格式
MP3文件以幀為基本單位,每幀的構成如表1所示。由于MP3文件數(shù)據(jù)格式采用了比特池技術,故主數(shù)據(jù)有可能在幀頭之前,具體位置可由幀邊信息所包含的main_data_begin變量獲得。
解碼時首先將一定長度(本系統(tǒng)為2kbit)的數(shù)據(jù)讀入C5509的內(nèi)部RAM中,然后尋找?guī)耐阶謘ync_word(FFF)。如果找到同步字,則以其為首的32bit即為幀頭。由幀頭中的校驗位可知是否有校驗數(shù)據(jù),如無,則其后的256bit數(shù)據(jù)即為幀邊信息。主數(shù)據(jù)一般包含兩個粒度組(gr)的數(shù)據(jù),每個粒度組又包含左右聲道(ch)兩部分的數(shù)據(jù)信息,各個聲道數(shù)據(jù)可獨立解碼,故將每個粒度單個聲道解碼的程序編寫為單個的*.c文件,以適應單聲道或者其他MP3格式的解碼。MP3編碼根據(jù)人類心理聲學,將每個粒度組分為三部分數(shù)據(jù):第一部分對應低頻采樣的Big_values(大值區(qū)),用較大絕對值的量化值存放低頻值;第二部分為Count1區(qū),用絕對值較小的量化值存放中頻值,所有量化值的可能取值為1,0,-1;第三部分為編碼為零的Zero高頻區(qū),零數(shù)據(jù)無須在MP3文件中出現(xiàn),只需在解碼時詢問每個粒度組的計數(shù)是否已經(jīng)達到576。若計數(shù)為576,則說明該粒度組已解完576個頻率線的量化值。
上述幀邊信息存儲了供后續(xù)解碼的全部重要信息。為方便引用,將其定義為結構體。部分元素的定義和注釋如下:
struct Granule {
unsigned part2_3_length; //用以計算Count1
//區(qū)位置;
unsigned big_values; //用以計算Big_values
//區(qū)位置;
unsigned table_select[3]; //用以確定查找哪一
//個霍夫曼表;
……
};
table_select[3]的值就是霍夫曼表的下標h,可在解主數(shù)據(jù)時鎖定某個具體的霍夫曼表。
2.2 MP3數(shù)據(jù)的霍夫曼解碼原理
如上小節(jié)所述,每個粒度組的數(shù)據(jù)根據(jù)聲學特性將0到奈奎斯特頻率的頻率線分為Big_values、Count1和Zero三個區(qū)。在解碼時,Big_values區(qū)對應的霍夫曼碼表格式如表2所示,而Count1區(qū)碼表格式如表3所示。
[!--empirenews.page--]
存放霍夫曼碼表的文件huffman.h中包含32個供Big_values區(qū)查詢用的碼表和2個供Count1區(qū)查詢用的碼表。為了方便快速查得短長度的編碼值,還增加了輔助表h_cue[34][16]。當開始解主數(shù)據(jù)時,將定長(例如32位)數(shù)據(jù)dataword()入棧,首先移出該緩存區(qū)的前四位數(shù)據(jù),作為查輔助表的頭數(shù)據(jù)lead,然后根據(jù)lead值和幀邊信息中的霍夫曼查找表下標h,得出輔助表的具體數(shù)據(jù)h_cue[h][lead],這個數(shù)據(jù)只是指向Big_values區(qū)或者Count1區(qū)某個表的首地址h_tab,具體要用到該表的哪個數(shù)據(jù)仍需程序提供一個偏移量繼續(xù)判斷。此時可以先由緩存區(qū)中去掉lead四個位的數(shù)據(jù)與鎖定的霍夫曼表對比,如果這后面的數(shù)據(jù)與被鎖定的霍夫曼表頭的碼字一致,則可馬上得到解碼的數(shù)據(jù);若是兩個碼字不一致,則還需由h_cue[h][lead]和h_cue[h][lead+1]的差值得到偏移量,從而最終得到正確的解碼數(shù)據(jù)。(格式如表2和表3所示)。
另外,由于MP3編碼中對絕對值小于等于15的量化值直接編碼,對絕對值大于15的量化值采用ESC(附加值)編碼,所以在得到加碼數(shù)據(jù)后還需判斷是否要為其添加附加值和符號位。詳細的解碼流程如圖2所示。
MP3解碼的主要運算量集中在霍夫曼解碼、反量化、IMDCT、子帶合成四個運算模塊,而霍夫曼解碼占整個運算量總和的1/5。利用CCS的Profile工具對44.1kHz采樣率、128kbps比特率的MP3數(shù)據(jù)進行運算復雜度的估算,可得本系統(tǒng)的解碼模塊消耗的運算量為1.3MIPS。由此可知,對于每秒解50幀以上的實時解碼,DSP要承擔65MIPS的運算復雜度,利DSP實現(xiàn)的本解碼模塊是完全可以勝任的。