當(dāng)前位置:首頁 > 嵌入式 > 嵌入式硬件
[導(dǎo)讀]0 引 言MP3(MPEG I Audio Layer 3)格式是基于電影專家組系統(tǒng)(Motion Picture Expert Group,MPEG)壓縮標(biāo)準的一種聲音文件格式,其壓縮比根據(jù)采樣頻率、壓縮位率和聲音模式

0 引 言

MP3(MPEG I Audio Layer 3)格式是基于電影專家組系統(tǒng)(Motion Picture Expert Group,MPEG)壓縮標(biāo)準的一種聲音文件格式,其壓縮比根據(jù)采樣頻率、壓縮位率和聲音模式的不同而有所變化。MP3具有很高的壓縮率,可以達到 1:12。一分鐘左右的CD音樂經(jīng)過MP3格式壓縮編碼后,可以壓縮到1兆左右的容量,其音色和音質(zhì)還可以保持基本完整而不失真。隨著數(shù)字音樂的不斷普及,現(xiàn)在MP3音樂已經(jīng)不僅局限于MPEG視頻應(yīng)用中,而是以一種獨立的數(shù)字音樂壓縮技術(shù)出現(xiàn)在計算機、網(wǎng)絡(luò)和各種電子設(shè)備上。目前市場流行的MP3播放器是基于DSP和專用芯片的解決方案,通過硬件或?qū)S盟惴▽崿F(xiàn)解碼,具有良好的實時性。而消費類電子產(chǎn)品正朝著多功能、低成本的方向發(fā)展。隨著ARM9功能的不斷增強,利用系統(tǒng)本身處理器實現(xiàn)MP3軟解碼成為可能。另外,軟件實現(xiàn)更便于產(chǎn)品功能的升級和維護,可以預(yù)見,嵌入式MP3軟解碼器的應(yīng)用將越來越廣泛。這里在分析MPEG I Audio Lay-er3解碼算法的基礎(chǔ)上,提出基于ARM946E處理器實現(xiàn)解碼算法的軟件優(yōu)化方法。

1 MPEG Audio Layer3的解碼流程

MP3解碼算法流程如圖1所示。

 

主要過程包括:數(shù)據(jù)流解碼、Huffman解壓縮、反量化與重排序、立體聲解碼、IMDCT和子帶合成運算等。其中Huffman解碼與反量化、IMDCT和子帶合成等3個過程在MP3解碼過程中占用了最多的CPU和內(nèi)存資源,是嵌入式系統(tǒng)實現(xiàn)軟件解碼的關(guān)鍵。

2 ARM946E處理器

ARM946E處理器屬于ARM9內(nèi)核帶有E擴展的一個可綜合版本,執(zhí)行v5TE架構(gòu)指令。采用5級流水線,存儲器系統(tǒng)根據(jù)哈佛體系結(jié)構(gòu)重新設(shè)計,獨立的數(shù)據(jù)和指令總線。帶有一套存儲器子系統(tǒng),以提高系統(tǒng)性能和支持大型操作系統(tǒng)。

如圖2所示,存儲器子系統(tǒng)包含1個存儲器保護單元(MPU)、高速緩存(Cache)和寫緩沖(Write Buffer);CPU通過該子系統(tǒng)與系統(tǒng)存儲器相連。

 

相對于ARM7,ARM9E性能上的提高主要表現(xiàn)在工作頻率、改進的硬件特性及優(yōu)化的指令執(zhí)行效率。另外,ARM9E集成了輕量級的DSP處理能力,以很小的成本(CPU增加功能需要增加硬件)換來非常實用的DSP性能。充分利用好芯片資源是實現(xiàn)MP3解碼優(yōu)化的關(guān)鍵。

3 算法優(yōu)化

針對MP3中涉及較大運算的Huffman解碼與反量化、IMDCT和子帶合成,分別提出算法優(yōu)化處理。3.1 定長查找冗余表Huffman解碼算法Huffman解碼器可以通過從頭至尾逐一檢測各符號,以查表比較的方式進行解碼。即從一維的bit流中分辨出各個長度不同的Huffman碼字,然后進行復(fù)雜的匹配。

由于LayeIⅢ中的Huffman碼表組長度不一,會增加碼字的搜索時間。定長查找冗余表法擴充Huff_man查找表,每次選取定長N bit碼流作為查找索引。查找表中包括跳轉(zhuǎn)指針和編碼值。若節(jié)點索引值為跳轉(zhuǎn)指針時,將通過擴充Huff-man查找表得知此Huffman編碼的后續(xù) bit數(shù),并跳轉(zhuǎn)到另外一個節(jié)點;然后再根據(jù)后續(xù)bit數(shù)從碼流中取值;接著從上次跳轉(zhuǎn)節(jié)點開始查找,如此重復(fù)直到找出對應(yīng)huffman編碼的內(nèi)容。查找表利用Union數(shù)據(jù)結(jié)構(gòu)實現(xiàn),可減小Huffman表占用的空間。假設(shè)一Huff-man編碼長度為l,采用傳統(tǒng)算法需要1次移位操作和1次比較,使用定長查找法只需[z/N]次查找和[l/N]次比較操作。

表1,表2是Huffman解碼的舉例說明:

 

 

 

計算量可降低一半。

子帶合成濾波在解碼過程中包括了32點到64點的IMDCT處理,如式(3)所示:

 

由于N(i)(k)具有對稱特性,可以得出:

 

只要計算0≤i

4 代碼優(yōu)化

根據(jù)ARM946E處理器硬件特點,對實時性要求較高的關(guān)鍵程序進行C語言和ARM匯編級代碼優(yōu)化。

4.1 減計數(shù)循環(huán)體

IMDCT和子帶合成濾波器組2個運算量最大部分中有多個循環(huán)體運算,為了提高執(zhí)行效率,推薦使用減計數(shù)循環(huán)體。

如表3所示,對于固定次數(shù)的循環(huán),減計數(shù)循環(huán)比增計數(shù)循環(huán)速度快。這是因為每次增計數(shù)循環(huán)體外加3條指令,而減計數(shù)循環(huán)體外只有2條指令,減循環(huán)終止條件為減計數(shù)到零,而不是計數(shù)增加到某個特定的限制值。由于減計數(shù)結(jié)果已存儲在指令條件標(biāo)志里,省去與零比較指令。

 

4.2 內(nèi)聯(lián)函數(shù)和內(nèi)嵌匯編

MP3解碼算法中定點化乘法都是通過函數(shù)調(diào)用來實現(xiàn),每次調(diào)用需要開銷23~28個時鐘周期,其中超過15個周期用于函數(shù)調(diào)用時PC指針以及寄存器壓棧保護上。采用內(nèi)聯(lián)函數(shù)方式(使用關(guān)鍵字_inline聲明)或宏指令,在編譯階段代碼段將被直接展開。另外armcc編譯器允許在C源程序中使用內(nèi)嵌匯編 (但代碼可移植性差),使用包括匯編的內(nèi)嵌函數(shù),可以使編譯器支持通常不能有效使用的ARM指令和優(yōu)化方法,例如C編譯器不支持的ARM v5E擴展指令。使用內(nèi)聯(lián)函數(shù)結(jié)合內(nèi)嵌匯編實現(xiàn)移位乘法,可使平均時鐘周期縮短為6~8個。[!--empirenews.page--]

4.3 ARM DSP擴展指令的運用

ARM946E處理器支持ARMDSP擴展指令,主要包括3個類型:

(1)單周期的16×16和32×16 MAC操作;

(2)對原有的算術(shù)運算指令增加了飽和處理擴展;

(3)前導(dǎo)零(CLZ)運算指令,提高歸一化、浮點運算以及除法操作的性能。

ARM處理器不支持浮點運算,經(jīng)過測試及分析,定點運算中數(shù)值的截斷誤差選擇為28 b,其可以達到較好的解碼音質(zhì),不會因為爆音過多而影響播放效果。

完成類似的乘法功能,ARM的SMULL(32×32)指令需要3個周期,而ARMDSP擴展指令SMULWT(32×16)只需要1個周期。從數(shù)據(jù)的準確性上分析,由于乘數(shù)的精度為16 b,最終結(jié)果有些差異,但由于MP3解碼運算都是基于28 b的定點數(shù)值的,所以通常的運算都是一個運算結(jié)果跟某一個固定定點表中的數(shù)據(jù)相乘的。若選擇固定定點表中數(shù)據(jù)的高16 b數(shù)據(jù)進行運算,運算的結(jié)果誤差在1 b以內(nèi)。

為了驗證使用ARMDSP擴展

指令的優(yōu)化效果,在系統(tǒng)120 MHz主頻下,以128 Kb/s的壓縮速率進行編碼測試,采用的測試文件如表4所示。

 

上述3個MP3測試文件的比特率均為128 Kb/s,使用這三首MP3歌曲進行解碼分析結(jié)果如圖3所示。

 

實驗表明,使用ARM DSP擴展指令比使用ARM一般指令解碼性能平均提高17.5%,主觀聽覺上音質(zhì)效果無差異。

5 結(jié) 語

這里充分利用ARM946E處理器的DSP擴展指令特點提高程序代碼的執(zhí)行效率,對3個關(guān)鍵模塊:Huff-man解碼,IMDCT運算,合成子帶濾波進行算法優(yōu)化及簡化處理,減少了各模塊的運算量,同時從C語言和ARM匯編層次來優(yōu)化代碼,取得了較好的實時MP3解碼效果。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉