ARM處理器的分散加載及特殊應(yīng)用研究
摘要 從ARM ELF目標(biāo)文件主要構(gòu)成出發(fā),詳細(xì)介紹了分散加載的基本原理、分散加載文件的語法、分散加載時連接器生成的預(yù)定義符號及要重新實現(xiàn)的函數(shù)等;以定位目標(biāo)外設(shè)和定義超大型結(jié)構(gòu)體數(shù)組兩項應(yīng)用來加以說明,并給出完整的工程實例和Bootloader代碼。這些都已經(jīng)在實際工程中多次應(yīng)用和驗證,是筆者實際工程項目的萃取。
關(guān)鍵詞 分散加載 嵌入式系統(tǒng) Scatter Loading Bootloader ARM ELF
引 言
在當(dāng)今的嵌入式系統(tǒng)設(shè)計中,ARM處理器以價格便宜、功耗低、集成度高、外設(shè)資源豐富和易于使用的特點而得到廣泛的應(yīng)用;在速度和性能方面已達(dá)到或超過部分PC104嵌入式計算機(jī)的性能,而成本卻比相應(yīng)的PC104計算機(jī)低很多,廣泛應(yīng)用于手機(jī)、GPS接收機(jī)、地圖導(dǎo)航、路由器、以太網(wǎng)交換機(jī)及其他民用和工業(yè)電子設(shè)備。
在一個采用ARM處理器的實時嵌入式系統(tǒng)中,目標(biāo)硬件常常由Flash、SRAM、SDRAM和NVRAM(非易失性RAM)等存儲器組成,并定位于不同的物理地址范圍,那么,怎樣通過軟件更好地訪問和利用這些不同的存儲器并讓系統(tǒng)高效地運行?分散加載(scatter loading)就提供了這樣一種機(jī)制。它可以將內(nèi)存變量定位于不同的物理地址上的存儲器或端口,通過訪問內(nèi)存變量即可達(dá)到訪問外部存儲器或外設(shè)的目的;同時通過分散加載,讓大多數(shù)程序代碼在高速的內(nèi)部RAM中運行,從而使得系統(tǒng)的實時性大大增強(qiáng)。
1 ARM ELF目標(biāo)文件的主要構(gòu)成
ARM ELF(Executable and Linking Format)目標(biāo)文件主要由.Text段、.Data段、.BSS段構(gòu)成,其他段如.debug段、.comment段等與本文關(guān)系不大,不作介紹。
.Text段由可執(zhí)行代碼組成,段類型為Code,屬性為RO;
.Data段由已初始化數(shù)據(jù)組成,段類型為Data,屬性為RO;
.BSS段由未初始化數(shù)據(jù)組成,段類型為Zero,屬性為RW,在應(yīng)用程序啟動時對該段的數(shù)據(jù)初始化為零。如果在分散加載文件中指定了UNINIT屬性,則在應(yīng)用程序啟動時不初始化該段。
2 分散加載的基本原理
假設(shè)一個采用ARM處理器的實時嵌入式系統(tǒng)目標(biāo)硬件的存儲器由ROM存儲器和RAM存儲器組成。當(dāng)一個嵌入式系統(tǒng)在仿真環(huán)境下調(diào)試完畢,需要脫機(jī)運行的時候,就需要將源程序編譯連接成可執(zhí)行目標(biāo)代碼并燒寫到ROM存儲器中。由于ROM存儲器存取數(shù)據(jù)的速率比RAM存儲器慢,因此,讓程序在ROM存儲器中運行。CPU每次取指令和取數(shù)據(jù)操作都要訪問ROM存儲器,這樣需要在CPU的總線周期中插入等待周期,通過降低總線的速率來滿足訪問慢速的ROM存儲器,這樣勢必會降低CPU的運行速率和效率,因此,分散加載就顯得非常必要。
ARM的連接器提供了一種分散加載機(jī)制,在連接時可以根據(jù)分散加載文件(.scf文件)中指定的存儲器分配方案,將可執(zhí)行鏡像文件分成指定的分區(qū)并定位于指定的存儲器物理地址。這樣,當(dāng)嵌入式系統(tǒng)在復(fù)位或重新上電時,在對CPU相應(yīng)寄存器進(jìn)行初始化后,首先執(zhí)行ROM存儲器的Bootloader(自舉)代碼,根據(jù)連接時的存儲器分配方案,將相應(yīng)代碼和數(shù)據(jù)由加載地址拷貝到運行地址,這樣,定位在RAM存儲器的代碼和數(shù)據(jù)就在RAM存儲器中運行,而不再從ROM存儲器中取數(shù)據(jù)或取指令,從而大大提高了CPU的運行速率和效率。分散加載的基本原理如圖1所示。
3 分散加載文件語法[!--empirenews.page--]
在一個實時嵌入式系統(tǒng)中,分散加載文件是對目標(biāo)硬件中的多個存儲器塊的分塊描述,它直接對應(yīng)目標(biāo)硬件存儲器的起始地址和范圍。同時,它在應(yīng)用程序連接時用于告訴連接器用戶程序代碼和數(shù)據(jù)的加載地址和運行地址,在連接時由連接器產(chǎn)生相應(yīng)的加載地址和運行地址符號,包括代碼和數(shù)據(jù)的加載起始地址、運行地址和長度等。這些符號用于上電后執(zhí)行啟動代碼的數(shù)據(jù)拷貝工作,啟動代碼根據(jù)這些符號,將指定代碼和數(shù)據(jù)由ROM中的加載地址拷貝到RAM中的運行地址中,從而實現(xiàn)代碼在高速RAM存儲器中的脫機(jī)運行。其語法格式如下:
注意:
①每一個分散加載文件必須至少包含一個根區(qū),每個根區(qū)的加載地址等于執(zhí)行地址。
②每一個引導(dǎo)區(qū)必須至少包含一個執(zhí)行區(qū),每一個執(zhí)行區(qū)必須至少包含一個代碼段或數(shù)據(jù)段;一個引導(dǎo)區(qū)可以包含幾個執(zhí)行區(qū),每一個執(zhí)行區(qū)只能屬于一個引導(dǎo)區(qū)。
4 分散加載時連接器生成的預(yù)定義符號
在編譯連接時如果指定了分散加載文件(.scf文件),在連接后會自動生成如下變量:
5 重新實現(xiàn)_user_initial_stEickheap()函數(shù)
分散加載機(jī)制提供了一種指定代碼和靜態(tài)數(shù)據(jù)布局的方法。使用分散加載時,必須重新放置堆棧和堆。
應(yīng)用程序的堆棧(stack)和堆(heap)是在C庫函數(shù)初始化過程中建立起來的,在ADSl.2或更新版本中,在缺省狀態(tài)下C庫函數(shù)初始化代碼會將連接器生成的符號Image$$ZI$$Limit地址作為堆的基地址。在分散加載時,連接器會將用戶的__user_initidl_stackheap()函數(shù)代替C庫函數(shù)默認(rèn)的堆棧和堆初始化函數(shù),并將其連接到用戶的鏡像文件中,用戶可通過重新實現(xiàn)__user_initial_stackheap()函數(shù)來改變堆棧和堆的位置,從而適合自己的目標(biāo)硬件。
__user_initial_stackheap()可以用C或匯編語言來實現(xiàn)。它必須返回如下參數(shù):
r0—堆基地址;
r1—堆棧基地址;
r2—堆長度限制值(需要的話);
r3—堆棧長度限制值(需要的話)。
當(dāng)用戶使用分散加載功能的時候,必須重新實現(xiàn)一user_initial_staacklaeap(),否則連接器會報錯:
Error:L6218E:Undefined symbol Imager$$ZI$$一Limit(referred from sys_stackheap.o)。
注:Image$$ZI$$Limit變量為零初始化段(ZI段)的末地址。未使用分散加載時,堆默認(rèn)就定位在ZI段的末地址,如圖2所示。
[!--empirenews.page--]
__user_initial_stackheap()函數(shù)的實現(xiàn)有兩種方法。
(1)共用一個存儲區(qū)
匯編語言如下:
這種方式定義的堆棧和堆共用一個存儲區(qū),采用相向的增長方向,如圖3所示。
(2)使用兩個存儲區(qū)
匯編語言如下:
這種方式定義的堆棧和堆分別采用兩個不同存儲區(qū)。堆棧采用向下增長,從地址Ox40000到地址Ox20000;堆采用向上增長,從地址0x28000000到地址0x28080000,如圖4所示。
6 特殊應(yīng)用[!--empirenews.page--]
6. 1 定位目標(biāo)外設(shè)
使用分散加載,可以將用戶定義的結(jié)構(gòu)體或代碼定位到指定物理地址上的外設(shè),這種外設(shè)可以是定時器、實時時鐘、靜態(tài)SRAM或者是兩個處理器間用于數(shù)據(jù)和指令通信的雙端口存儲器等。在程序中不必直接訪問相應(yīng)外設(shè),只需訪問相應(yīng)的內(nèi)存變量即可實現(xiàn)對指定外設(shè)的操作,因為相應(yīng)的內(nèi)存變量定位在指定的外設(shè)上。這樣,對外設(shè)的訪問看不到相應(yīng)的指針操作,對結(jié)構(gòu)體成員的訪問即可實現(xiàn)對外設(shè)相應(yīng)存儲單元的訪問,讓程序員感覺到仿佛沒有外設(shè),只有內(nèi)存。
例如,一個帶有兩個32位寄存器的定時器外設(shè),在系統(tǒng)中的物理地址為Ox04000000,其C語言結(jié)構(gòu)描述如下:
要使用分散加載將上述結(jié)構(gòu)體定位到Ox04000000的物理地址,可以將上述結(jié)構(gòu)體放在一個文件名為timer_regs.c中,并在分散加載文件中指定即可,如下:
屬性UNINIT是避免在應(yīng)用程序啟動時對該執(zhí)行段的ZI數(shù)據(jù)段初始化為零。
在程序連接后,通過Image map文件可查看該ZI數(shù)據(jù)段的存儲器分配情況:
Execution Region TIMER(Base:Ox04000000,Size:0x00000008,Max:0xffffffff,ABSOLUTE,UNINIT)Base Addr Size Type Attr Idx E Section Name 0bi ectOx04000000 0x00000008 Zero RW 32.bss tlmer_regs.o從Image map文件可以看出,該TIMER執(zhí)行區(qū)定位在物理地址0x04000000,即結(jié)構(gòu)體timer_regs定位在Ox04000000,因此,在程序中對結(jié)構(gòu)體的操作即是對定時器的操作。
6.2 定義超大型結(jié)構(gòu)體數(shù)組
分散加載機(jī)制在提供將指定代碼和數(shù)據(jù)定位在指定物理地址的能力的同時,也提供了一種代碼分割機(jī)制——可以將指定的零初始化段(ZI段)從可執(zhí)行代碼中分離出來。這樣最終生成的燒入ROM或Flash中的鏡像文件就不包括那部分分割了的零初始化段,即使該零初始化段再大,也不影響最終生成的鏡像文件的大小。但不采用分散加載機(jī)制,零初始化段在編譯連接后是直接生成到鏡像文件中的。它的大小直接影響最終要燒寫的文件的大小,且零初始化段的大小還取決于內(nèi)存的大小,它不能大到超過內(nèi)存的大??;而采用分散加載機(jī)制,可以將某個零初始化段定位到非內(nèi)存地址的一個存儲器外設(shè)上,如NVRAM(非易失性隨機(jī)存儲器)。
筆者曾在一個實際工程中采用這種分散加載機(jī)制,將一個2MB的結(jié)構(gòu)體數(shù)組定位到外部NVRAM中,用于記錄設(shè)備在工作過程中采集到的數(shù)據(jù);而在本系統(tǒng)中,ARM處理器的內(nèi)存只有256 KB,F(xiàn)lash存儲器也只有2 MB。如果不采用分散加載,程序根本無法運行,也不能燒寫到Flash中。
采用分散加載,把對復(fù)雜外設(shè)的訪問變成對結(jié)構(gòu)體數(shù)組的訪問,使程序代碼精簡易懂。對程序員來說,對結(jié)構(gòu)體數(shù)組的操作還是和內(nèi)存變量的操作一樣的。
編者注:本文為期刊縮略版,全文見本刊網(wǎng)站www.mesnet.com.cn。
結(jié) 語
分散加載是嵌入式系統(tǒng)應(yīng)用中不可或缺的一種加載方式,ARM、DSP、PowerPC和MIPS等嵌入式處理器,都離不開分散加載。這種分散加載的思想是通用的,只是不同處理器的實現(xiàn)方式不同。
本文詳細(xì)闡述了基于ARM處理器的分散加載方法及其特殊應(yīng)用,并以實際工程為例來說明怎樣實現(xiàn)分散加載及使用分散加載的好處。它是筆者在實際工程應(yīng)用中的心得體會,同時也是筆者工作經(jīng)驗的總結(jié),希望本文對從事嵌入式系統(tǒng)設(shè)計和應(yīng)用的工程技術(shù)人員能有所幫助。