當(dāng)前位置:首頁 > 模擬 > 模擬
[導(dǎo)讀]介紹了MP3解碼器的工作原理,分析了各個(gè)解碼環(huán)節(jié)的計(jì)算量和消耗時(shí)間。將MP3解碼過程中耗時(shí)最多的子帶綜合濾波環(huán)節(jié)使用矩陣乘法器單元做了優(yōu)化和改進(jìn),提出一種可大幅度提高M(jìn)P3實(shí)時(shí)解碼效率的軟硬件協(xié)同設(shè)計(jì)方法,并在SoC仿真平臺(tái)上得到實(shí)時(shí)驗(yàn)證,達(dá)到了較好的優(yōu)化效果。由于SoC的設(shè)計(jì)方法比較靈活,可以根據(jù)實(shí)際需要設(shè)計(jì)硬件模塊,所以該設(shè)計(jì)具有方便、靈活和可靠性高等特點(diǎn),是工程實(shí)用價(jià)值較高的解碼器。

0 引言
    MP3(MPEG Audio Layer 3)是一種以高保真為前提實(shí)現(xiàn)的高效壓縮技術(shù)。MP3音頻編碼器復(fù)雜,壓縮率很高,但其音色和音質(zhì)還可以保持基本完整,因此該音頻格式文件在計(jì)算機(jī)、網(wǎng)絡(luò)和各種電子設(shè)備上都得到了廣泛運(yùn)用。
    由于MP3音頻解碼相對(duì)比較復(fù)雜,為了達(dá)到在控制成本的范圍內(nèi)實(shí)現(xiàn)快速解碼的要求,提出了在SoC上通過增加矩陣乘法器運(yùn)行快速的兩個(gè)16點(diǎn)DCT算法,進(jìn)一步提高MP3解碼速度的可行性方案。

1 MP3解碼流程分析
   
MP3解碼的流程如圖1所示,解碼的主要過程包括同步處理、解幀頭、解邊帶信息、解比例因子、Huffman解碼、逆量化、頻率線重排序、立體聲處理、混疊重建、改進(jìn)離散余弦逆變換(IMDCT)、頻率倒置處理、子代綜合濾波,最后輸出原始的PCM數(shù)據(jù)。


    在這些過程中由于IMDCT和子帶綜合濾波的算法比較復(fù)雜,占用硬件資源較多,處理時(shí)間長(zhǎng),因此功耗所占比例相應(yīng)較高。表1是在DSP平臺(tái)上成功移植后,對(duì)代碼進(jìn)行耗時(shí)分析的結(jié)果。
    根據(jù)表1可知,子帶綜合濾波占了整個(gè)解碼時(shí)間的60 %以上,是決定解碼速度的最關(guān)鍵模塊;其次是長(zhǎng)塊IMDCT運(yùn)算,占了整個(gè)解碼時(shí)間的10%以上。若采用MPEG-1建議的算法流程,數(shù)值計(jì)算主要集中在子帶綜合濾波上。以兩聲道48 kHz采樣率為例,乘法運(yùn)算量為(48 000/32)×(64×32+512)×2=7 680 000次/s。因此,子帶綜合濾波是MP3解碼器的優(yōu)化重點(diǎn),減少子帶綜合濾波的計(jì)算量和計(jì)算時(shí)間是MP3解碼器實(shí)現(xiàn)的核心。



2 子帶綜合濾波分析
   
子帶綜合濾波是MP3解碼的最后一部分,也是解碼過程中最為耗時(shí)的關(guān)鍵步驟。它負(fù)責(zé)從IMDCT的輸出值中把PCM值還原出來,可以分成5個(gè)步驟。首先是Matrixing(矩陣)運(yùn)算,即,2,…,63。由公式可知,它從32個(gè)子帶Sk的每個(gè)子帶中取出一個(gè)值組成32個(gè)值送入一個(gè)矩陣中進(jìn)行運(yùn)算,然后把輸出Vi的64個(gè)結(jié)果放入一個(gè)1 024的先入先出(FIFO)緩存中,再?gòu)? 024值中取出一半,組成一個(gè)512矢量Ui,并對(duì)這512矢量進(jìn)行加窗運(yùn)算,即Wi=UiDi,i=1,2,…,511,加窗系數(shù)Di由MP3官方協(xié)議AnnexB Table3-B.3提供。最后將加窗結(jié)果Wi進(jìn)行疊加生成32個(gè)時(shí)域PCM輸出。
    1次矩陣運(yùn)算乘法和加法運(yùn)算過程分別為1 024次和992次,完成1個(gè)聲道的解碼需要18次矩陣運(yùn)算。矩陣運(yùn)算是子帶綜合濾波的關(guān)鍵步驟。實(shí)際上,Konstantinos Konstantinides提出的方法,只需要做一些變化就可以通過32點(diǎn)DCT變換成矩陣運(yùn)算。
2.1 32點(diǎn)快速DCT算法分析
   
快速DCT變換算法主要基于系數(shù)矩陣分裂方法,增加輸入的預(yù)處理,使得乘法和加法計(jì)算量減半。32點(diǎn)的DCT變換到矩陣運(yùn)算如圖2所示。其中V(1×64)表示矩陣的輸出,A,B都是長(zhǎng)度為1×16的矢量,(A,B)表示32點(diǎn)DCT的輸出。


    由于32點(diǎn)的DCT可以分解成2個(gè)16點(diǎn)的DCT變換,依次類推可以分解成8點(diǎn)的DCT變換,考慮到定點(diǎn)數(shù)字信號(hào)處理中的有限字長(zhǎng)效應(yīng),實(shí)際只需分解1次,將32點(diǎn)DCT化成2個(gè)16點(diǎn)的DCT。簡(jiǎn)化子帶濾波流程以及使用快速DCT變換后,子帶綜合濾波部分的運(yùn)算量可以減少約60 %。
    由32點(diǎn)DCT分解為2個(gè)16點(diǎn)DCT過程推導(dǎo)如下:

2.2 基于矩陣乘法器的快速DCT算法優(yōu)化
   
3×3矩陣乘法器由觸發(fā)器和乘累加器組成,是高性能DSP處理器的重要部件,也是實(shí)時(shí)處理的核心,其速度直接影響DSP處理器的速度。矩陣乘法器的實(shí)現(xiàn)有很多種,基本上都基于并行計(jì)算原則。由于每列結(jié)果與其他列不相關(guān),因此可以通過增加乘法器多列同時(shí)計(jì)算,經(jīng)過n次乘累加就可以得到最后結(jié)果。圖3給出矩陣乘法器的結(jié)構(gòu)。


    顯然,這種結(jié)構(gòu)的計(jì)算速度很快,但是使用乘法器會(huì)因矩陣維數(shù)n的增加而快速增加,使用的觸發(fā)器也很多。在很多場(chǎng)合下,只要滿足處理速度的要求,完全沒有必要浪費(fèi)這么多硬件資源,而是只要1個(gè)乘累加單元流水作業(yè),分步計(jì)算每1列結(jié)果既可。在做乘累加計(jì)算1個(gè)元素時(shí)候,準(zhǔn)備下一組參與運(yùn)算的數(shù)據(jù),如此循環(huán),同樣可以獲得較高的處理速度。
    在該設(shè)計(jì)中,由于B矩陣是1×n的一維向量輸入數(shù)據(jù),A矩陣為DCT系數(shù)矩陣,A矩陣中的元素為n個(gè)系數(shù)的線性組合,因此整個(gè)矩陣乘法器需要2組n個(gè)觸發(fā)器分別存放輸入數(shù)據(jù)和n個(gè)系數(shù),1個(gè)乘累加單元。輸入數(shù)據(jù)X[0:n],從X[O]到X[n]循環(huán)n次進(jìn)入乘法器,使用選擇信號(hào)Assi-gn[0:n]選擇系數(shù)C[0:n],另外系數(shù)符號(hào)由Sign信號(hào)軟件控制,基本結(jié)構(gòu)如圖4所示。


    由于DCT計(jì)算本質(zhì)上就是n×n矩陣乘法運(yùn)算,而n×n矩陣乘法器是在通用乘法器的基礎(chǔ)上增加2組分別存放系數(shù)矩陣的系數(shù)C(n)和輸入X(n)的n個(gè)寄存器,使之實(shí)現(xiàn)長(zhǎng)度為n的乘累加功能,同時(shí)還需保存上次乘法結(jié)果。其中,DCT中的系數(shù)是一組n維基的n種線性組合。只需1次輸入n個(gè)系數(shù),使用軟件進(jìn)行選擇和符號(hào)控制就可實(shí)現(xiàn)這些不同系數(shù)組合,無需反復(fù)往寄存器中置數(shù),大大提高了取數(shù)/置數(shù)的效率,節(jié)省了整個(gè)DCT的運(yùn)算時(shí)間。
    因此在計(jì)算32點(diǎn)的DCT,可將32點(diǎn)DCT分解為2個(gè)16點(diǎn)的DCT計(jì)算,計(jì)算量也減少1倍??梢允褂?組16×16的矩陣乘法器并行計(jì)算,使得計(jì)算時(shí)間大幅減少。表2是通過增加矩陣乘法器優(yōu)化處理后,子帶綜合濾波使用不同實(shí)現(xiàn)方式所需要的時(shí)間。


    結(jié)果表明,第2.1節(jié)中使用快速32點(diǎn)DCT算法改進(jìn)子帶綜合濾波計(jì)算是有效的,直接減少59%的計(jì)算時(shí)間。在采用并行2個(gè)16×16矩陣乘法器加速快速32點(diǎn)DCT的計(jì)算,可以取得明顯的效果:使得計(jì)算時(shí)間比原算法減少了約91.4%,而且硬件上只增加1個(gè)乘法器和30個(gè)數(shù)據(jù)鎖存器,以及部分控制電路。使用軟硬件協(xié)同操作就可以獲得子帶綜合濾波計(jì)算速度上的大幅度上升。

3 結(jié)語
   
該設(shè)計(jì)面向SoC實(shí)現(xiàn)了利用增加矩陣乘法器就可加快基于32點(diǎn)快速DCT算法的MP3解碼中子帶綜合濾波的處理速度,大大緩解了系統(tǒng)的頸瓶,使得采用系統(tǒng)主頻比較低(fs≤100 MHz)的SoC平臺(tái)進(jìn)行MP3的解碼成為可能。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉