基于ARM的嵌入式系統(tǒng)的MP3軟解碼器研究與實(shí)現(xiàn)
為了減少功耗與降低成本,根據(jù)ARM芯片對(duì)C語言良好支持的特點(diǎn),在深度剖析MP3解碼算法、分析C語言在ARM芯片上編程的優(yōu)化方法的基礎(chǔ)上,通過軟件形式實(shí)現(xiàn)MP3音頻解碼器,便一些無硬件解碼器支持的ARM嵌入式系統(tǒng)完成MP3解碼任務(wù),從而實(shí)現(xiàn)基于ARM的嵌入式系統(tǒng)的MP3軟解碼器,可以有效地降低系統(tǒng)功耗,提高解碼效率,更好地?cái)U(kuò)展和增強(qiáng)便攜嵌入式系統(tǒng)多媒體功能。
隨著便攜式嵌入式系統(tǒng)的發(fā)展,嵌入式多媒體技術(shù)正在影響并改變著人們的日常生活,多媒體音頻編碼解碼技術(shù)也越來越受到關(guān)注和重視。筆者提出了一種MP3音頻解碼通過軟件方式在嵌入式系統(tǒng)上實(shí)現(xiàn)的解決方案。該方案以目前比較高效的MP3解碼算法為基礎(chǔ),靈活的取代了基于DSP的硬件解碼方案,在低消耗處理器資源的前提下,實(shí)現(xiàn)能與硬件解碼相媲美的效果。從而節(jié)省了研發(fā)或購買DSP芯片的費(fèi)用,還可以方便快捷的兼容MPEG新提出的解碼標(biāo)準(zhǔn),這是該方案最重要的現(xiàn)實(shí)意義。
目前國外在MP3軟解碼方面的研究有兩大成果,一個(gè)是開源MP3解碼項(xiàng)目mpg123,一個(gè)是開源嵌入式MP3解碼庫libmad。這兩個(gè)開源項(xiàng)目中使用的解碼算法參考了很多國際學(xué)術(shù)論文。前者被廣泛用于播放器軟件,例如Mplaver,千千靜聽等;后者則更加適用于嵌入式系統(tǒng),已經(jīng)被成功移植到Symbian手機(jī)系統(tǒng)上。
1 MP3解碼算法分析
MP3解碼主要包括以下過程:預(yù)處理(Preprocessing)、霍夫曼編碼(HufFMan decoding)、反量化(Requantization)、重排列(Reorder ing)、立體聲解碼(Stereo decoding)、混迭消除(Alias reduction)、反離散余弦變換(IMDCT transform)、頻域轉(zhuǎn)換(Frequencyinvers ion)、子帶合成濾波(Synthesis fiLTErbank),最后生成聲卡可以直接讀取的PCM采樣。MP3解碼流程具體如圖1所示。
2 ARM處理器以及其程序設(shè)計(jì)優(yōu)化
為了在ARM處理器下快速穩(wěn)定的運(yùn)行解碼器,除了浮點(diǎn)轉(zhuǎn)化為定點(diǎn)的策略,還要根據(jù)硬件特點(diǎn)進(jìn)一步進(jìn)行程序優(yōu)化:首先減小運(yùn)算強(qiáng)度,利用位移操作代替乘除運(yùn)算,通常需要乘除以2的冪次方都可以用左右移n位來完成,比如3×8等價(jià)于3<<3;利用乘法代替乘方運(yùn)算,ARM核中內(nèi)建有乘法器,因此可以通過乘法運(yùn)算來代替調(diào)用C庫函數(shù)乘方運(yùn)算以節(jié)約函數(shù)調(diào)用開銷;利用與運(yùn)算代替求余運(yùn)算。通常and指令比%操作效率要高;使用內(nèi)聯(lián)函數(shù),ARM下支持C語言inline關(guān)鍵字,這時(shí)的函數(shù)直接在調(diào)用處代碼展開,省去了函數(shù)調(diào)用開銷,不過它的缺點(diǎn)是代碼量增加;使用寄存器變量,CPU對(duì)寄存器的存取要比對(duì)內(nèi)存的存取快得多,因此為變量分配一個(gè)寄存器,將有助于代碼的優(yōu)化和運(yùn)行效率的提高。
避免除法,ARM指令集中沒有除法指令,其除法是通過調(diào)用C庫函數(shù)實(shí)現(xiàn),一個(gè)32位的除法通常需要20~140個(gè)時(shí)鐘周期。因此,除法是程序效率的瓶頸,應(yīng)盡量避免使用。用查表法代替計(jì)算,在CPU資源緊張而內(nèi)存資源富裕的情況下,可以用空間來換取運(yùn)行速度,例如在反離散余弦變換算法中需要頻繁的計(jì)算正弦和余弦函數(shù)值,可以預(yù)先將函數(shù)值計(jì)算出來以常量放到內(nèi)存里,需要計(jì)算時(shí)直接通過內(nèi)存地址提取需要的值。
3 解碼器結(jié)構(gòu)設(shè)計(jì)與實(shí)現(xiàn)
在對(duì)現(xiàn)有算法進(jìn)行研究的基礎(chǔ)上,筆者設(shè)計(jì)出一個(gè)性能優(yōu)良、結(jié)構(gòu)靈活、可移植性強(qiáng)的MP3軟解碼器。解碼器主要包括以下模塊:解碼器引擎初始化,緩沖區(qū)輸入輸出控制,幀解碼模塊,注銷解碼器引擎等。
3.1解碼器引擎初始化
用MP3文件初始化解碼器,初始化過程中,解碼器讀取每一幀的幀頭信息而不對(duì)數(shù)據(jù)進(jìn)行解碼,快速計(jì)算出該文件的播放時(shí)間,并根據(jù)文件大小以秒或分鐘為單位內(nèi)建解碼位置索引。解碼位置索引的目的是為了快速的根據(jù)時(shí)間定位待解碼數(shù)據(jù)在文件中的位置。
3.2 緩沖區(qū)輸入輸出控制
考慮到嵌入式系統(tǒng)內(nèi)存較小的情況,解碼器輸入緩沖區(qū)定義為8 kB,這樣既可以流暢的解碼數(shù)據(jù),又不會(huì)暫用很大緩沖區(qū)內(nèi)存,解碼引擎以bit為單位讀取數(shù)據(jù),所以輸入控制應(yīng)該實(shí)現(xiàn)快速讀取緩沖區(qū)中1個(gè)或多個(gè)bit數(shù)據(jù)的操作。
對(duì)于文件形式的MP3數(shù)據(jù),在解碼器輸入緩沖區(qū)上層內(nèi)建一個(gè)文件緩沖結(jié)構(gòu),減少系統(tǒng)IO操作次數(shù),首先將文件中一部分待解碼數(shù)據(jù)讀入文件緩沖,當(dāng)解碼引擎發(fā)出數(shù)據(jù)請(qǐng)求時(shí),由文件緩存向解碼器輸入緩沖區(qū)寫入數(shù)據(jù)。
文件緩沖提供以下操作:
文件緩沖創(chuàng)建:以打開的文件指針創(chuàng)建文件緩沖區(qū),返回緩沖結(jié)構(gòu)指針。
緩沖區(qū)注銷:釋放緩沖區(qū)創(chuàng)建時(shí)的在堆中申請(qǐng)的內(nèi)存,并關(guān)閉打開的文件指針。
緩沖區(qū)結(jié)束判斷:當(dāng)緩沖區(qū)讀取指針到達(dá)緩沖區(qū)結(jié)尾時(shí),eof被復(fù)制為真,返回eof的值。
獲取緩沖區(qū)操作錯(cuò)誤:每次操作中,若出現(xiàn)錯(cuò)誤error被賦值為對(duì)應(yīng)的錯(cuò)誤值,否則賦值為0。返回error的值。
讀取指定大小的內(nèi)容:從緩沖區(qū)當(dāng)前讀取位置,讀取指定大小的字節(jié),并返回讀取到的數(shù)據(jù)開始位置指針。
對(duì)于以流形式的MP3數(shù)據(jù),當(dāng)解碼引擎發(fā)出數(shù)據(jù)請(qǐng)求時(shí),直接由數(shù)據(jù)流緩存向解碼器輸入?yún)^(qū)寫入數(shù)據(jù)。
數(shù)據(jù)流緩存提供的功能有以下幾點(diǎn):
初始化:該功能申請(qǐng)堆中的一塊內(nèi)存,用于以后存放緩存數(shù)據(jù)。
注銷:負(fù)責(zé)釋放初始化時(shí)申請(qǐng)的內(nèi)存。
寫入數(shù)據(jù):向緩存的當(dāng)前寫入位置后寫入指定大小的數(shù)據(jù)。
跳過指定大小數(shù)據(jù):將當(dāng)前讀取位置移動(dòng)到指定位置。
獲取錯(cuò)誤信息:返回操作過程中產(chǎn)生的錯(cuò)誤信息。
幀同步:將讀取位置跳轉(zhuǎn)到下一幀開始位置。該操作的主要算法是每次讀取緩存11個(gè)比特,若這些比特全為1,則把其當(dāng)做下一幀的開始位置。通過研究可知,該種算法并不能準(zhǔn)確判斷下一幀的開始,但這種算法不進(jìn)行幀頭解碼,也不會(huì)漏掉數(shù)據(jù)。從時(shí)間和空間上講,都是一種比較好的選擇。
解碼引擎以幀為解碼單位,每次輸出一幀的解碼輸出結(jié)構(gòu),結(jié)構(gòu)中包括PCM數(shù)據(jù)、長度、采樣率、聲道數(shù),播放時(shí)間等信息。
3.3 幀解碼模塊
該模塊為解碼引擎核心模塊,按照順序完成預(yù)處理、霍夫曼編碼、反量化、重排列、立體聲解碼、混迭消除、反離散余弦變換、頻域轉(zhuǎn)換、子帶合成濾波,最后生成聲卡可以直接讀取的PCM采樣。
從系統(tǒng)設(shè)計(jì)的角度上,該模塊又可以劃分為幾個(gè)小模塊:浮點(diǎn)計(jì)算模塊、幀預(yù)處理模塊、霍夫曼解碼模塊、層解碼模塊、濾波合成模塊。
3.4 注銷解碼器引擎
該模塊負(fù)責(zé)釋放解碼器申請(qǐng)的內(nèi)存,刪除解碼器內(nèi)建的播放索引,復(fù)位緩沖區(qū)。在解碼完成后調(diào)用。
3.5 解碼器外部調(diào)用接口
解碼器提供了簡潔而功能強(qiáng)大的調(diào)用接口,主要包括初始化、注銷、單幀解碼、IO控制、解碼時(shí)間控制幾個(gè)方面,具體如表1所示。
4 結(jié)束語
本文根據(jù)MPEG官方文檔,詳細(xì)剖析了MP3幀解碼的算法及其優(yōu)化,并在上述基礎(chǔ)上設(shè)計(jì)軟件解碼器接口,在ARM平臺(tái)上實(shí)現(xiàn)了軟件解碼器。本解碼器具有無浮點(diǎn)計(jì)算、引入文件緩存機(jī)制、內(nèi)建解碼位置索引等優(yōu)點(diǎn)。但是也存在一定的局限性:如時(shí)間精度低,解碼器沒有實(shí)現(xiàn)網(wǎng)絡(luò)功能,但是提供了流解碼接口,如果需要播放網(wǎng)絡(luò)上的MP3文件,需要在解碼器的上層設(shè)計(jì)網(wǎng)絡(luò)引擎。