一、映像文件基本組成
映像文件加載時(shí)域包括RO和RW段,運(yùn)行時(shí)域則包括RO、RW和ZI三個(gè)段。其中RO和RW段的內(nèi)容在加載時(shí)和運(yùn)行時(shí)是一樣的,只是存儲(chǔ)空間可能不同,而ZI段則是運(yùn)行時(shí)由初始化函數(shù)創(chuàng)建的。
RO段:Read-Only段,包括源程序中的CODE段,只讀數(shù)據(jù)段(包括變量的初始化值——可以是任意變量,全局/局部、靜態(tài)/動(dòng)態(tài)變量的初值;還包括數(shù)據(jù)常量——這個(gè)常量也可以是全局的或局部的。也就是說(shuō),編譯器既要為變量分配存儲(chǔ)空間——變量是可讀寫的,并不放在RO段,又要為變量的初值分配存儲(chǔ)空間,兩者是兩回事)。
RW段:可讀寫段,主要指RW-DATA,也可能有RW-CODE。RW-DATA是指已經(jīng)初始化的全局變量。
ZI段:Zero-Initialized段,主要包括未初始化的全局變量,編譯器用0值對(duì)其進(jìn)行初始化。該段中的數(shù)據(jù)由于是變量,因而也是可讀寫的,但在映像文件加載時(shí),并不為ZI段分配存儲(chǔ)空間,雖然在ADS編譯器的Memory map文件中認(rèn)為Total RW Size = (RW Data + ZI Data)。
二、代碼,數(shù)據(jù)和變量在映像文件中的位置
上面簡(jiǎn)單總結(jié)了映像文件各段的組成。從程序的組成看,可以分為變量、數(shù)據(jù)和代碼,其中變量又分為全局/局部的或靜態(tài)/動(dòng)態(tài)的,它們的存儲(chǔ)空間又是如何分配的呢?
代碼:一般是只讀的,由編譯器分配存儲(chǔ)空間并放到映像文件的RO段。
數(shù)據(jù):這里所指的數(shù)據(jù)都是常量(若可變則為變量),也包括指針常量,那么也屬于只讀的數(shù)據(jù),也由編譯器分配存儲(chǔ)空間放到映像文件的RO段。
變量:主要根據(jù)生存期來(lái)分,因?yàn)樯嫫谑前丛趦?nèi)存中的生存時(shí)間來(lái)定義的,而作用域與存儲(chǔ)空間分配無(wú)關(guān)。
1.全局變量和靜態(tài)變量:包括靜態(tài)局部變量和全局/靜態(tài)指針變量在內(nèi),由編譯器分配存儲(chǔ)空間,已初始化的放到RW段,否則放到ZI段;
2.動(dòng)態(tài)變量:主要是指局部變量,包括局部指針變量在內(nèi),占用??臻g。
三、啟動(dòng)過(guò)程中的堆棧初始化釋疑
堆與棧:對(duì)于ARM,堆是向上生長(zhǎng)的,棧是向下生長(zhǎng)的。
局部變量占用棧(stack)空間(但其初始化值為數(shù)據(jù),占用RO空間);
程序中動(dòng)態(tài)申請(qǐng)的如malloc()和new函數(shù)申請(qǐng)的內(nèi)存空間占用堆(heap)空間。
————×以下討論不使用semihosting機(jī)制×————
因此,在轉(zhuǎn)入C應(yīng)用程序前,必須要為C程序準(zhǔn)備堆??臻g。根據(jù)具體的目標(biāo)平臺(tái)的存儲(chǔ)器資源,要對(duì)堆棧的初始化函數(shù)__user_initial_stackheap( )進(jìn)行移植,主要是正確設(shè)置堆(heap)和棧(stack)的地址。它可以使用C或ARM匯編語(yǔ)言來(lái)編寫,并至少返回堆基址(保存在R0中),?;罚ū4嬖赗1)可選。因而一個(gè)簡(jiǎn)單的匯編語(yǔ)言編寫的__user_initial_stackheap( )函數(shù)如下:
EXPORT __user_initial_stackheap
__user_initial_stackheap
LDR R0, =0x20000 ;heap base
LDR R1, =0x40000 ;stack base, optional
MOV PC, R14
該函數(shù)的C語(yǔ)言實(shí)現(xiàn)可見(jiàn)參考資料[6]P158頁(yè)。
注意,如果在工程中沒(méi)有自定義這個(gè)函數(shù),那么缺省情況下,編譯器/鏈接器會(huì)把|ImageZI
Limit|作為堆(heap)的基址(即把heap和stack區(qū)放置在ZI區(qū)域的上方,這也被認(rèn)為是標(biāo)準(zhǔn)的實(shí)現(xiàn)[7])。但是,如果使用scatter文件實(shí)現(xiàn)分散加載機(jī)制,鏈接器并不生成符號(hào)|ImageZI
Limit|,這時(shí)就必須自己重新實(shí)現(xiàn)__user_initial_stackheap( )函數(shù)并且設(shè)置好堆基址和棧頂,否則鏈接時(shí)會(huì)報(bào)錯(cuò)。
堆棧區(qū)還分為單區(qū)模型和雙區(qū)模型,在雙區(qū)模型中,還必須設(shè)置堆棧限制[4,6,7]。
關(guān)于重定義__user_initial_stackheap( )函數(shù)時(shí)幾點(diǎn)要注意的地方:一是不要使用超過(guò)96字節(jié)的stack,二是不要影響到R12(IP,用作進(jìn)程間調(diào)用的暫存寄存器),三是按規(guī)則返回參數(shù)值(R0:heap base;R1:stack base;R2:heap limit;R3:stack limit),四是讓堆區(qū)保持8字節(jié)對(duì)齊[6]。
在啟動(dòng)代碼中,還要對(duì)各個(gè)處理器模式的棧指針進(jìn)行初始化。這個(gè)問(wèn)題很容易與上面談到的__user_initial_stackheap()函數(shù)的作用相混淆??蓮囊韵聨c(diǎn)來(lái)加以說(shuō)明:
(1)在嵌入式應(yīng)用中,啟動(dòng)代碼分為兩個(gè)部分:一是系統(tǒng)的初始化,包括中斷向量表的建立、時(shí)鐘、存儲(chǔ)系統(tǒng)初始化、關(guān)鍵I/O口初始化、各處理器模式下的棧指針初始化等;二是應(yīng)用程序初始化(或說(shuō)C庫(kù)函數(shù)初始化),包括RW段的搬移和ZI段的清零、C應(yīng)用程序堆棧區(qū)的建立(__user_initial_stackheap()函數(shù)初始化堆棧指針)等。
從這個(gè)意義上說(shuō),兩者并沒(méi)有直接關(guān)系。
(2)但兩者并不是沒(méi)有聯(lián)系的。以單區(qū)模型的堆棧區(qū)為例,由于棧是向下生長(zhǎng)的,堆是向上生長(zhǎng)的,系統(tǒng)模式的棧指針(與用戶模式相同,共用一個(gè)R13寄存器來(lái)描述)實(shí)際上定義了用戶模式下單區(qū)模型堆棧區(qū)的上限,而__user_initial_stackheap()函數(shù)中指定的heap基址則成為該堆棧區(qū)的下限。
因此,如果之前已經(jīng)對(duì)系統(tǒng)模式(用戶模式)的棧指針進(jìn)行了初始化,則在重定義__user_initial_stackheap()函數(shù)時(shí),就不需要重新定義stack base了。
四、啟動(dòng)代碼的內(nèi)容和初始化順序探討
前面已經(jīng)指出,啟動(dòng)代碼包括系統(tǒng)初始化以及應(yīng)用程序運(yùn)行環(huán)境的初始化兩個(gè)部分,完成初始化后,就可以呼叫用戶主程序了。參考資料[1]、[3]和[5]等都對(duì)兩個(gè)部分的內(nèi)容以及過(guò)程列出了非常清晰但又簡(jiǎn)單明了的步驟,這對(duì)于初學(xué)者來(lái)說(shuō)稍微有點(diǎn)抽象。
如果不需要使用MMU進(jìn)行地址重映射,那么,結(jié)合網(wǎng)上可以搜集的示例boot代碼以及分析文檔,加上自己動(dòng)手移植和調(diào)試,也是比較容易理解的。如果是使用處理器自帶的Remap控制寄存器來(lái)進(jìn)行地址重映射,網(wǎng)上也有相關(guān)的代碼,例如網(wǎng)友twentyone的boot代碼【4510 bootloader的實(shí)現(xiàn)與分析(附源代碼)】就非常清楚,另外,在《ARM學(xué)習(xí)報(bào)告》系列文章中也對(duì)其有詳細(xì)的分析。
對(duì)于在啟動(dòng)過(guò)程中要使用MMU進(jìn)行地址重映射的系統(tǒng)初始化順序,在《使用AXD調(diào)試MMU地址映射程序手記(二)》一文中給出了一個(gè)參考步驟,并做了一定的說(shuō)明。通過(guò)進(jìn)一步參考權(quán)威資料,這里,對(duì)系統(tǒng)初始化順序作了小的改進(jìn)與修正如下:
①禁止所有中斷→②初始化時(shí)鐘→③初始化存儲(chǔ)器→④初始化各模式下的棧指針→⑤初始化GPIO→⑥拷貝映像文件到SDRAM→⑦建立地址重映射表→⑧使能MMU→⑨應(yīng)用程序初始化(RW&ZI區(qū))→⑩使能異常中斷→⑾呼叫主程序(dummyOS)。
主要對(duì)使能異常中斷和應(yīng)用程序初始化的順序做了調(diào)整,即先進(jìn)行應(yīng)用程序的初始化,再使能異常中斷,可參考[3]和[10]。
......
———————————————————————————————————————
【參考資料】
[1]《ARM體系結(jié)構(gòu)與編程》,杜春雷,清華大學(xué)出版社,2003年2月
[2]《ARM嵌入式系統(tǒng)開(kāi)發(fā)——軟件設(shè)計(jì)與優(yōu)化》,沈建華譯,2005年5月
[3]《基于ARM的嵌入式系統(tǒng)程序開(kāi)發(fā)要點(diǎn)》,費(fèi)浙平,2003年8月
[4]《RealView編譯工具開(kāi)發(fā)者指南》,ARM Limited,2003年1月
[5]《ADS Developer Guide》,ARM Limited,2001年11月
[6]《ADS Compilers and Libraries Guide》,ARM Limited,2001年11月
[7]《ADS Linker and Utilities Guide》,ARM Limited,2001年11月
[8]《MAP文件認(rèn)識(shí)初步》,JOHNNY LEE
[9]《堆與棧的區(qū)別》,未知網(wǎng)友
[10]《使用ADS1.2進(jìn)行嵌入式軟件開(kāi)發(fā)》,ARM Limited