當前位置:首頁 > 嵌入式 > 嵌入式軟件
[導讀]Linux下Cold Fire 片內SRAM的應用程序優(yōu)化設計


    本文以MP3解碼器為例,介紹了一種在嵌入式Linux系統(tǒng)下配置使用處理器片內SRAM的應用方案,有效提高了代碼的解碼效率,降低了執(zhí)行功耗。該方案不論在性能還是成本上都得到了很大改善。


1 硬件平臺和軟件架構
    硬件平臺采用Freescale公司的MCF5329EVB開發(fā)板。終端硬件包括ColdFire5329處理器、32 KB的片內SRAM、1 800×600矩陣LCD顯示屏、9×3陣列矩陣鍵盤、I2S音頻解碼芯片、64 MB的SDRAM、10/100M以太網接口,以及3個UART接口。軟件構架如圖1所示,主要包括MP3解碼器、音頻驅動、鍵盤驅動和用戶圖形界面(GUI)等模塊。采用μClinux作為操作系統(tǒng)。μClinux針對嵌入式應用的特點作了較大的簡化和修改,支持多種文件系統(tǒng)和多任務處理,而且具有相對完整的網絡體系協(xié)議,因而特別適合嵌入式應用。

2 MP3解碼算法分析
    本文選用MP3解碼程序作為方案驗證代碼。MPEG-1/2 Audio Layer 3是專門針對音樂和語音數(shù)據設計的有損壓縮算法。該算法的解碼過程比較復雜,主要包括反向修正離散余弦變換(IMDCT)、逆量化、Huffman解碼、子帶綜合等功能模塊。讀入一段MP3數(shù)據后,首先要檢測數(shù)據流中的同步字,以確定一幀數(shù)據的開始;然后提取幀頭信息,特別是解碼所需要的一些參數(shù),同時分離出幀邊信息和主數(shù)據;之后對邊信息數(shù)據解碼得到Huffman解碼信息和逆量化信息,再經過重新排序、立體聲處理、反混疊處理、IMDCT變換和子帶綜合濾波器組后,就可以得到PCM輸出。
    MP3解碼流程如圖2所示。大致分為兩個階段,即數(shù)據流控制階段和數(shù)值計算階段。數(shù)據流控制階段包括幀同步、邊帶信息解碼和Huffman解壓縮等過程。其中,Huffman解壓縮是對編碼數(shù)據進行操作,其他過程則是對幀控制部分進行操作。

3 基于片內SRAM的優(yōu)化設計方案
3.1 方案分析
    SRAM指令執(zhí)行速度要比DRAM快得多。Cold-Fire5329處理器內部集成了32 KB的SRAM,本設計方案將充分利用處理器片內SRAM來對解碼程序進行優(yōu)化。首先對源代碼中的主要解碼函數(shù)進行分析,如表1所列??梢钥吹津寗訉懞瘮?shù)(write)、子帶綜合(MPEGSUB_synthesis)、反向修正離散余弦變換(imdct_I)和快速離散余弦變換(fast_dct)對處理器資源消耗較大,幾乎占用80%的解碼時間。根據分析結果,分別把音頻驅動程序和上述解碼函數(shù)放進SRAM中執(zhí)行,以提高流媒體解碼器的執(zhí)行速度,降低其對處理器資源的消耗。

3.2 配置音頻驅動程序到片內SRAM中執(zhí)行
    Linux操作系統(tǒng)把內核和運行在其上的應用程序分成兩個管理層次,也就是常說的“內核態(tài)”和“用戶態(tài)”。內核態(tài)具有較高的應用權限,可以控制處理器內存的映射和分配方式。音頻驅動程序是系統(tǒng)內核的重要組成部分,工作在內核態(tài),實現(xiàn)不斷從用戶空間解碼文件中讀取音頻信息,以及驅動音頻芯片播放聲音等相關功能。通過修改μClinux-2.6內核代碼,可以將音頻驅動程序配置到片內SRAM中執(zhí)行,主要通過修改系統(tǒng)鏈接文件來實現(xiàn)。系統(tǒng)鏈接文件用于將輸入文件根據一定的規(guī)則合并成一個輸出文件,并對符號與地址進行綁定。[!--empirenews.page--]
    為了在修改內核代碼的同時不影響系統(tǒng)其他文件的正常運行,要在內核鏈接腳本中添加新的段區(qū)定義(.sramcode),指定該段區(qū)鏈接加載地址為處理器片內SRAM,并在.sramcode段區(qū)內定義代碼段(.sramtext)和數(shù)據段(.sramdata),分別用于存儲驅動中的代碼和數(shù)據。對齊方式采用ALIGN(4),因為對32位微處理器來說,該對齊方式將有效減少處理器執(zhí)行周期,提高執(zhí)行效率。然后,使用2個指針_lsramcode和_lsramcodeend分別指向,sramcode段區(qū)的段首和段尾,具體實現(xiàn)如下:


    完成對操作系統(tǒng)鏈接文件的修改之后,使用宏定義在音頻驅動程序中把相關函數(shù)和數(shù)據分別指定鏈接到,sramcode代碼段和數(shù)據段,并由copy函數(shù)把相關函數(shù)復制到SRAM中執(zhí)行。編譯、鏈接完成后,可以在系統(tǒng)內核存儲映射文件Sys-tem.map中查看驅動函數(shù)和數(shù)據在內存中的地址。圖3顯示了音頻驅動函數(shù)在處理器片內SRAM中的映射地址。

[!--empirenews.page--]

3.3 配置實時數(shù)據和函數(shù)到片內SRAM中執(zhí)行
    把用戶空間的實時數(shù)據和函數(shù)放置到片內SRAM中執(zhí)行,由于處理器可以直接從片內SRAM中存取數(shù)據和指令,減少了處理器存取數(shù)據和指令的周期,提高了程序的執(zhí)行效率。首先,放置實時數(shù)據到處理器片內SRAM中。通過S_malloc和S_free函數(shù)來實現(xiàn):S_malloc用來申請?zhí)幚砥鲀却婵臻g,S_free用來對這一申請的空間進行釋放。為了靈活使用定義的S_malloc和S_free函數(shù),需要定義一個結構體和地址指針:


    然后,通過動態(tài)內存分配方式可以把MP3解碼程序中的實時數(shù)據放入處理器內存中執(zhí)行。加載函數(shù)到SRAM中與加載實時數(shù)據不同,需要通過指針和枚舉變量來實現(xiàn)。首先通過一個宏定義設置每個函數(shù)大小為4 KB,并使用枚舉變量為函數(shù)分配處理器片內SRAM執(zhí)行的起始地址。

    SRAMFUNC2=SRAM_BIG_FUNC1+BIG_FUNC_SIZE,…};
    在定義完函數(shù)運行時加載的存儲地址之后,把MP3解碼程序中的MPEGSUB_synthesis和imdct_1等函數(shù)通過字符串拷貝的方式復制到處理器片內SRAM中執(zhí)行,經過編譯、鏈接這些函數(shù)在執(zhí)行時將會加載到相應的SRAM單元塊中。這樣就減少了處理器執(zhí)行解碼函數(shù)所需的時間,提高了程序的執(zhí)行效率。


4 性能測試與分析
    為了驗證基于處理器片內SRAM的優(yōu)化設計方案,我們在MCF5329EVB開發(fā)板上對經該方案優(yōu)化過的MP3解碼器進行了驗證和測試。
    首先,進行功能測試,應用MPEG組織推薦的測試碼流(128 kb/s,44.1 kHz)。選用一段音頻test.mp3,分別用標準浮點解碼器和本文設計的音頻解碼器進行本地解碼測試,并對其解碼波形進行比較分析。從圖4的波形比較可以看到,經過本方案優(yōu)化設計的解碼器解碼波形與標準浮點解碼器基本無差別。經人耳測試,無法辨別出兩者解碼輸出的差別。所以,從功能上講本文設計的基于片內SRAM的應用程序優(yōu)化方案是可行的。

    其次,進行性能測試。在測試平臺上分別對優(yōu)化前后解碼器的MIPS消耗數(shù)和空間消耗量進行比較分析,如表2所列。

    優(yōu)化前,解碼器MIPS消耗數(shù)為68 MIPS@240MHz;優(yōu)化后,解碼器MIPS消耗數(shù)為39.2 MIPS@240 MHz。在硬件條件允許的情況下,消耗的內存雖然有一定的增加,但是經過本文方案優(yōu)化后,解碼效率得到了很大的提高。

結 語
    本文提出了在嵌入式Linux操作系統(tǒng)下基于處理器片內SRAM的應用程序優(yōu)化設計方案。以MP3解碼器為例,通過從配置音頻驅動程序、實時數(shù)據和函數(shù)到處理器片內SRAM中執(zhí)行來對解碼器進行優(yōu)化設計,并在ColdFire5329開發(fā)平臺上成功實現(xiàn)該方案。優(yōu)化后的MP3播放器不僅解碼效率高,而且音質好,完全可以在中低端處理器上實現(xiàn)實時播放,使低性能CPU處理復雜應用程序成為可能。該方案有效地提高了應用程序的執(zhí)行效率,降低了功耗,對嵌入式Linux應用產品開發(fā)有著重要參考價值。

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內容真實性等。需要轉載請聯(lián)系該專欄作者,如若文章內容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或將催生出更大的獨角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉型技術解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據媒體報道,騰訊和網易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據產業(yè)博覽會開幕式在貴陽舉行,華為董事、質量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據產業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經營業(yè)績穩(wěn)中有升 落實提質增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數(shù)字經濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術學會聯(lián)合牽頭組建的NVI技術創(chuàng)新聯(lián)盟在BIRTV2024超高清全產業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術創(chuàng)新聯(lián)...

關鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術
關閉
關閉