cortex-m3 棧的8字節(jié)對齊
一、什么是棧對齊?
棧的字節(jié)對齊,實(shí)際是指棧頂指針須是某字節(jié)的整數(shù)倍。因此下邊對系統(tǒng)棧與MSP,任務(wù)棧與PSP,棧對齊與SP對齊 這三對概念不做區(qū)分。另外下文提到編譯器的時(shí)候,實(shí)際上是對編譯器匯編器連接器的統(tǒng)稱。
之前對棧的8字節(jié)對齊理解的不透,就在網(wǎng)上查了好多有關(guān)棧字節(jié)對齊、還有一些ARM對齊偽指令的資料信息,又做了一些實(shí)驗(yàn),把這些零碎的信息拼接在一起,總覺得理解透這個(gè)問題的話得長篇大論了。結(jié)果昨天看了AAPCS手冊、然后查到了沒有使用PRESERVE8偽指令出現(xiàn)錯(cuò)誤的實(shí)例,突然覺得長篇大論不存在了,半篇小論這問題就能理順了。
二、AAPCS棧使用規(guī)約在ARM上編程,但凡涉及到調(diào)用,就需要遵循一套規(guī)約AAPCS:《Procedure Call Standard for the ARM Architecture》。這套規(guī)約里面對棧使用的約定如下:
5.2.1.1
Universal stack constraints
At all times the following basic constraints must hold:
Stack-limit < SP <= stack-base. The stack pointer must lie within the extent of the stack.
SP mod 4 = 0. The stack must at all times be aligned to a word boundary.
A process may only access (for reading or writing) the closed interval of the entire stack delimited by [SP, stack-base – 1] (where SP is the value of register r13).
Note
This implies that instructions of the following form can fail to satisfy the stack discipline constraints, even when reg points within the extent of the stack.
ldmxx reg, {..., sp, ...} // reg != sp
If execution of the instruction is interrupted after sp has been loaded, the stack extent will not be restored, so restarting the instruction might violate the third constraint.
5.2.1.2
Stack constraints at a public interface
The stack must also conform to the following constraint at a public interface:
SP mod 8 = 0. The stack must be double-word aligned.
可以看到,規(guī)約規(guī)定,棧任何時(shí)候都得4字節(jié)對齊,在調(diào)用入口得8字節(jié)對齊。
在這個(gè)約定里,棧的4字節(jié)對齊確實(shí)得任何時(shí)候都遵守,而且你想不遵守都難,因?yàn)镾P的最后兩位是硬件上保持0的。而對于8字節(jié)對齊,這就需要碼農(nóng)和編譯器配合著來。需要說明的一點(diǎn)是,8字節(jié)對齊即使不遵守,一些情況下也沒問題,只要主調(diào)和被調(diào)用例程兩邊把堆棧使用,傳參,返回等處理好就行,也就是說兩邊有自己的一套約定就行。但是有時(shí)候,主調(diào)這邊在調(diào)用嚴(yán)格遵守AAPCS的函數(shù)時(shí),沒有將棧保持在8字節(jié)對齊上,那就會(huì)出問題。
三、如何編程?在cortex m3上編程時(shí),對于AAPCS棧使用約定的遵守,總的來說就兩條:
1. 匯編文件中需要我們親自動(dòng)手來保證遵守AAPCS棧使用約定。
(特別注意每次從匯編進(jìn)入C的世界時(shí),要保證匯編部分的編碼在調(diào)用c接口時(shí)棧是8字節(jié)對齊的,不要疏忽了,因?yàn)閏編譯器可不負(fù)責(zé)調(diào)整。c編譯器說你得送給我的SP就是8字節(jié)對齊的,我才能保證接下來的C部分沒有結(jié)束之前,遵守AAPCS棧使用約定)
2. 在C文件中,由編譯器來處理。
四、補(bǔ)充:1. 由于程序的入口點(diǎn)為復(fù)位中斷響應(yīng)函數(shù),一般我們都寫在啟動(dòng)代碼里,通常是一個(gè)匯編文件,然后經(jīng)由匯編進(jìn)入到C程序的main入口處,在調(diào)用main的時(shí)刻,為遵循AAPCS,就得在此時(shí)保持8字節(jié)對齊。
2. 對于MSP,Keil MDK為我們提供了一個(gè)用來初始化C運(yùn)行庫環(huán)境的函數(shù)_main,這個(gè)函數(shù)會(huì)調(diào)用_user_setup_stackheap函數(shù),該函數(shù)將MSP的低三位清零,然后在進(jìn)入main之前不對其進(jìn)行更改,這樣在進(jìn)入main的時(shí)刻,MSP保證為8字節(jié)對齊的。
3. 對于PSP,一般在上多任務(wù)OS時(shí)會(huì)用它,對于PSP我們要比MSP更為操心點(diǎn),因?yàn)镸SP起碼還可以通過調(diào)用_main來跳進(jìn)main的方式保證進(jìn)入C世界的時(shí)候是遵守約定的。而PSP全靠自己來保證每次進(jìn)入C世界時(shí)是8字節(jié)對齊。
4. 另外只要是匯編文件,可配合使用匯編命令armasm --diag_warning 1546,這樣匯編器就會(huì)對一些SP沒有8字節(jié)對齊的地方給出警告,但是我發(fā)現(xiàn)匯編器并不能保證檢測到所有對SP造成8字節(jié)不對齊的操作,例如直接給SP載入一個(gè)立即數(shù)這種,匯編器就發(fā)現(xiàn)不了。我并沒有對所有會(huì)影響SP的指令進(jìn)行測試(原因是不熟悉。。。),不知道1546這個(gè)警告能覆蓋多少指令,所以總的來講,對匯編文件就是睜大自己的鈦合金眼,爭取大部分工作都放到C中去。
五. CORTEX-M3 中斷控制器的棧對齊調(diào)整功能(該功能在r2p0版本以后的內(nèi)核中均默認(rèn)開啟,STKALIGN位默認(rèn)為1)Cortex M3 NVIC CCR寄存器(控制與配置寄存器)的STKALIGN位置1,那么在發(fā)生中斷時(shí),進(jìn)入中斷響應(yīng)函數(shù)前,內(nèi)核會(huì)首先檢查當(dāng)前正在使用的棧指針是否8字節(jié)對齊,如果是,則正常將xPSR,PC,LR,SP,R0-R3入棧,如果不是,則先把SP-4,調(diào)整為8字節(jié)對齊,然后將xPSR第九位置1,接著把xPSR,PC,LR,SP,R0-R3入棧,再然后才進(jìn)入中斷響應(yīng)函數(shù)。這樣可以保證程序在運(yùn)行過程中,如果在棧沒有發(fā)生4字節(jié)對齊的地方發(fā)生中斷了,進(jìn)入到中斷響應(yīng)函數(shù)的時(shí)候也是遵守AAPCS棧使用約定的。如果中斷服務(wù)程序是做任務(wù)切換的,那么前面的情況就是將任務(wù)棧調(diào)整為對齊,然后進(jìn)入異常服務(wù)程序后使用系統(tǒng)棧,那如果系統(tǒng)棧本來就是不對齊的呢?通過中斷來做任務(wù)切換的情況下,中斷控制器并不會(huì)對系統(tǒng)棧進(jìn)行調(diào)整,怎么辦?其實(shí)這也不用擔(dān)心,以μC/OS-II為例,在cortex-m3上通常使用PendSV異常來做任務(wù)切換,即將OSCtxSw以及OSIntCtxSw都設(shè)為僅完成PendSV異常觸發(fā)功能,然后在PendSV異常服務(wù)程序中進(jìn)行任務(wù)切換。由于上電時(shí)刻系統(tǒng)處于特權(quán)級模式,只要我們保證從上電開始到第一次系統(tǒng)調(diào)用,使用的棧都是系統(tǒng)棧MSP就可以了,這樣即使第一次要進(jìn)入任務(wù)切換時(shí)MSP不對齊,中斷向量控制器也會(huì)給調(diào)整為8字節(jié)對齊狀態(tài),雖然這個(gè)第一次任務(wù)切換后除了中斷再也不會(huì)使用MSP,但只要我們同時(shí)保證所有匯編部分都不會(huì)破壞8字節(jié)對齊規(guī)約,那么從此以后MSP都會(huì)是8字節(jié)對齊的。
六、關(guān)于ALIGN屬性 與 PRESERVE8偽指令在CORTEX M3芯片的啟動(dòng)代碼中,這兩個(gè)偽指令并非必不可少,可以不要這兩個(gè)偽指令。但是有了這兩個(gè)偽指令,可以在確保遵守AAPCS的道路上加一道保險(xiǎn),使得AAPCS棧使用約定的遵守在實(shí)際編程時(shí)變得稍微容易點(diǎn)。
當(dāng)在段定義頭(即AREA偽指令的相關(guān)代碼)當(dāng)中使用ALIGN=?時(shí),ALIGN屬性的作用為設(shè)定該代碼段或數(shù)據(jù)段的首址的對齊位置,例如ALIGN=3就表示,該段首址將被安排在2^3=8字節(jié)對齊處。需要注意的是,除了AREA的ALIGN屬性,還有一個(gè)同名的ALIGN指令,ALIGN指令使用在段內(nèi)部的,用來調(diào)整ALIGN指令下一條命令或數(shù)據(jù)的對齊位置。
而PRESERVE8偽指令并不會(huì)對棧進(jìn)行任何修改。PRESERVE8偽指令的使用有四種方法,分別如下,其中1、2的用法是等價(jià)的:
1. PRESERVE8
2. PRESERVE8 {TRUE}
3. PRESERVE8 {FALSE}
如果不寫,那么由編譯器來決定在編譯過程中將匯編文件標(biāo)識(shí)為PRES8屬性還是~PRES8屬性(也即加還是不加該偽指令),但經(jīng)過實(shí)驗(yàn),發(fā)現(xiàn)編譯器在加不加這條偽指令上表現(xiàn)的并不完全可靠。。。所以最好明確的加上是 PRESERVE8 {TRUE}還是PRESERVE8 {FALSE}。那么這條偽指令起什么作用呢?
如果你想要告訴匯編器說:“在我這個(gè)匯編文件中保證棧的8字節(jié)對齊,我這個(gè)文件對棧的任何時(shí)刻的任何操作都是8字節(jié)對齊的”,那么你就把PRESERVE8偽指令用在匯編文件中,用以向匯編器通知前面你的保證內(nèi)容。匯編器就知道你這個(gè)匯編文件是8字節(jié)對齊靠譜選手,將該文件標(biāo)識(shí)為PRES8屬性,然后如果在你這個(gè)匯編中調(diào)用了標(biāo)示了需要8字節(jié)對齊屬性的文件中的函數(shù),連接的時(shí)候就不會(huì)報(bào)錯(cuò)。但是假如你把這個(gè)匯編文件標(biāo)示為PRESERVE8 {FALSE},然后你又在這個(gè)文件中調(diào)用了標(biāo)示了需要8字節(jié)對齊屬性的文件中的函數(shù),連接時(shí)就會(huì)給出錯(cuò)誤信息。
那么什么是標(biāo)示了需要8字節(jié)對齊屬性的文件呢?如果你的某個(gè)匯編文件,某些操作一定要棧8字節(jié)對齊才行,那么你就需要使用REQUIRE8偽指令來通知匯編器將該文件標(biāo)識(shí)為REQ8屬性,然后這個(gè)文件就是所謂的“標(biāo)示了需要8字節(jié)對齊屬性的文件”。
在文件較多,文件之間調(diào)用由繁多的情況下,通過PRESERVE8和REQUIRE8的配合,就能夠在連接期間由編譯器檢查出我們寫代碼時(shí)不小心造成的破壞8字節(jié)對齊模塊對需要8字節(jié)對齊模塊的調(diào)用(經(jīng)過實(shí)驗(yàn)發(fā)現(xiàn),匯編之間是給出警告,匯編調(diào)用C則是給出錯(cuò)誤,由于C文件中并不能直接用REQUIRE8,所以我猜編譯器將C文件都通通標(biāo)識(shí)為REQ8屬性了,所以才會(huì)出錯(cuò))。
REQUIRE8的用法同PRESERVE8。