對(duì)堆棧8字節(jié)對(duì)齊問題的討論
一.為什么要保證堆棧8字節(jié)對(duì)齊
AAPCS規(guī)則要求堆棧保持8字節(jié)對(duì)齊。如果不對(duì)齊,調(diào)用一般的函數(shù)也是沒問題的。但是當(dāng)調(diào)用需要嚴(yán)格遵守AAPCS規(guī)則的函數(shù)時(shí)可能會(huì)出錯(cuò)。
例如調(diào)用sprintf輸出一個(gè)浮點(diǎn)數(shù)時(shí),棧必須是8字節(jié)對(duì)齊的,否則結(jié)果可能會(huì)出錯(cuò)。
實(shí)驗(yàn)驗(yàn)證:
#include "stdio.h"
#include "string.h"
float fff=1.234;
char buf[128];
int main(void)
{
sprintf(buf,"%.3fnr",fff);//A
while(1);
}
1.在A處設(shè)置斷點(diǎn),讓程序全速運(yùn)行至A
2.在MDK中修改MSP的值使MSP滿足8字節(jié)對(duì)齊
3.全速運(yùn)行程序,觀察buf中的字符為 1.234 結(jié)果正確
4.回到第2步,修改MSP使之只滿足4字節(jié)對(duì)齊而不滿足8字節(jié)對(duì)齊
5.全速運(yùn)行程序,觀察buf中的字符為 -2.000 結(jié)果錯(cuò)誤
該實(shí)驗(yàn)證明了調(diào)用sprintf輸出一個(gè)浮點(diǎn)數(shù)必須要保證棧8字節(jié)對(duì)齊。
二.編譯器為我們做了什么
先看一個(gè)實(shí)驗(yàn)
#include "stdio.h"
#include "string.h"
float fff=1.234;
char buf[128];
void fun(int a,int b,int c,int d)
{
int v;
v=v;
}
void test(void)
{}
int main(void)
{
fun(1,2,3,4);
test();//A
//sprintf(buf,"%.3fnr",fff);
while(1);
}
0.保證初始的時(shí)候堆棧是8字節(jié)對(duì)齊的
1.在A處設(shè)置斷點(diǎn)
2.全速運(yùn)行至A,觀察MSP=0x2000025c,沒有8字節(jié)對(duì)齊
3.略微修改一下main函數(shù)代碼如下,其他部分代碼不變
int main(void)
{
fun(1,2,3,4);
//test();
sprintf(buf,"%.3fnr",fff);//A
while(1);
}
4.同樣在A處設(shè)置斷點(diǎn)
5.全速運(yùn)行至A,觀察MSP=0x200002d8,這次8字節(jié)對(duì)齊了
這個(gè)實(shí)驗(yàn)說明了如果編譯器發(fā)現(xiàn)了某個(gè)函數(shù)需要調(diào)用浮點(diǎn)庫時(shí)會(huì)自動(dòng)調(diào)整編譯生成的匯編
代碼,從而保證調(diào)用這些浮點(diǎn)庫函數(shù)時(shí)堆棧是8字節(jié)對(duì)齊的。換句話說如果我們保證了棧
初始的時(shí)候是8字節(jié)對(duì)齊的,那么編譯器可以保證以后調(diào)用浮點(diǎn)庫時(shí)堆棧仍是8字節(jié)對(duì)齊的。
三.os下應(yīng)該怎樣設(shè)置任務(wù)堆棧
由上面的討論可知給任務(wù)分配棧時(shí)需要保證棧是8字節(jié)對(duì)齊的,不然在該任務(wù)中凡是調(diào)用sprintf的函數(shù)
均會(huì)出錯(cuò),因?yàn)闂R婚_始就是不對(duì)齊的。
四.中斷中的棧對(duì)齊問題
是否保證了棧初始是8字節(jié)對(duì)齊了就萬事大吉了呢。no!大家請(qǐng)看一種特殊的情況:
#include "stdio.h"
#include "string.h"
float fff=1.234;
char buf[128];
void fun(int a,int b,int c,int d)
{
int v;
v=v;
}
int main(void)
{
fun(1,2,3,4);
while(1);
}
void SVC_Handler(void)
{
sprintf(buf,"%.3fnr",fff);//B
}
mian函數(shù)的反匯編如下:
0x080001DC B500 PUSH {lr}
0x080001DE 2304 MOVS r3,#0x04 ;A
0x080001E0 2203 MOVS r2,#0x03
0x080001E2 2102 MOVS r1,#0x02
0x080001E4 2001 MOVS r0,#0x01
0x080001E6 F7FFFFF5 BL.W fun (0x080001D4)
0x080001EA BF00 NOP
0x080001EC E7FE B 0x080001EC
0.保證初始的時(shí)候堆棧是8字節(jié)對(duì)齊的
1.在A處設(shè)置斷點(diǎn)
2.全速運(yùn)行至A,觀察此時(shí)MSP=0x200002e4 未對(duì)齊
3.在MDK中將SVC的掛起位置1
4.在B處設(shè)置斷點(diǎn)
5.全速運(yùn)行至B,觀察此時(shí)MSP=0x200002b4 未對(duì)齊
6.繼續(xù)全速執(zhí)行,觀察buf中的字符為:-2.000 出錯(cuò)了
這個(gè)實(shí)驗(yàn)說明了即使保證棧初始是8字節(jié)對(duì)齊的,編譯器也只能保證在調(diào)用sprintf那個(gè)時(shí)刻棧是8字節(jié)對(duì)齊的
但不能保證任意時(shí)刻棧都是8字節(jié)對(duì)齊的,如果恰巧在MSP沒有8字節(jié)對(duì)齊的時(shí)刻發(fā)生了中斷,而中斷中又調(diào)用
了sprintf,這種情況下仍會(huì)出錯(cuò)
五.Cortex-M3內(nèi)核為我們做了什么
Cortex-M3內(nèi)核提供了一種硬件機(jī)制來解決上述這種中斷中棧不對(duì)齊問題。
CM3中可以把NVIC配置控制寄存器的STKALIGN置位,來保證中斷中的棧8字節(jié)對(duì)齊,
具體實(shí)現(xiàn)過程如下:
當(dāng)發(fā)生中斷時(shí)由硬件自動(dòng)檢測(cè)MSP是否8字節(jié)對(duì)齊,如果對(duì)齊了,則不進(jìn)行任何操作,
如果沒有對(duì)齊,則自動(dòng)將MSP減4這樣便對(duì)齊了,同時(shí)將xPSR的第9位置位來記錄這個(gè)
MSP的非正常的變化,在中斷返回若發(fā)現(xiàn)xPSR的第9位是置位的則自動(dòng)將MSP加4調(diào)整
回原來的值。
實(shí)驗(yàn)驗(yàn)證:
#include "stdio.h"
#include "string.h"
float fff=1.234;
char buf[128];
void fun(int a,int b,int c,int d)
{
int v;
v=v;
}
int main(void)
{
fun(1,2,3,4);
while(1);
}
void SVC_Handler(void)
{
sprintf(buf,"%.3fnr",fff);//B
}
mian函數(shù)的反匯編如下:
0x080001DC B500 PUSH {lr}
0x080001DE 2304 MOVS r3,#0x04 ;A
0x080001E0 2203 MOVS r2,#0x03
0x080001E2 2102 MOVS r1,#0x02
0x080001E4 2001 MOVS r0,#0x01
0x080001E6 F7FFFFF5 BL.W fun (0x080001D4)
0x080001EA BF00 NOP
0x080001EC E7FE B 0x080001EC
1.在A處設(shè)置斷點(diǎn)
2.全速運(yùn)行至A,觀察此時(shí)MSP=0x200002e4 未對(duì)齊
3.在MDK中將SVC的掛起位置1,同時(shí)將0xE000ED14處的值由0x00000000改為0x00000200
(即將NVIC配置控制寄存器的STKALIGN置位)
4.在B處設(shè)置斷點(diǎn)
5.全速運(yùn)行至B,觀察此時(shí)MSP=0x200002b0 對(duì)齊了
6.觀察中斷返回時(shí)的MSP=0x200002e4 調(diào)整回來了
7.繼續(xù)全速執(zhí)行,觀察buf中的字符為:1.234 正確
這個(gè)實(shí)驗(yàn)說明了將NVIC配置控制寄存器的STKALIGN置位可以保護(hù)中斷時(shí)棧仍是8字節(jié)對(duì)齊
六.總結(jié)
綜上所述,為了能夠安全的使用嚴(yán)格遵守AAPCS規(guī)則的函數(shù)(比如sprintf)需要做到以下幾點(diǎn):
1.保證MSP在初始的時(shí)候是8字節(jié)對(duì)齊的
2.如果用到OS的話需要保證給每個(gè)任務(wù)分配的棧是保持8字節(jié)對(duì)齊的
3.如果用的是基于CM3內(nèi)核的處理器需將NVIC配置控制寄存器的STKALIGN置位