當(dāng)前位置:首頁 > 嵌入式 > 嵌入式教程
[導(dǎo)讀]本章主要介紹嵌入式應(yīng)用程序的設(shè)計方法。本章中的一些實例程序是以ARM公司的Realview2.2為開發(fā)平臺。由于目前嵌入式應(yīng)用環(huán)境相差非常大,這里主要是通過這些實例程序來更直接地介紹嵌入式應(yīng)用系統(tǒng)的開發(fā)方法,具體的代碼因具體的嵌入式環(huán)境不同而有所差異。

本章主要介紹嵌入式應(yīng)用程序的設(shè)計方法。本章中的一些實例程序是以ARM公司的Realview2.2為開發(fā)平臺。由于目前嵌入式應(yīng)用環(huán)境相差非常大,這里主要是通過這些實例程序來更直接地介紹嵌入式應(yīng)用系統(tǒng)的開發(fā)方法,具體的代碼因具體的嵌入式環(huán)境不同而有所差異。

13.1 基于ARM處理器的嵌入式系統(tǒng)設(shè)計

ARM系列處理器是RISC(Reducded Instruction Set Computing)處理器。很多基于ARM的高效代碼的程序設(shè)計策略都源于RISC處理器。和很多RISC處理器一樣,ARM系列處理器的內(nèi)存訪問也要求數(shù)據(jù)對齊,即存取“字(Word)”數(shù)據(jù)時要求四字節(jié)對齊,地址的bits[1:0]=0b00;存取“半字(Halfwords)”時要求兩字節(jié)對齊,地址的bit[0]=0b0;存取“字節(jié)(Byte)”數(shù)據(jù)時要求該數(shù)據(jù)按其自然尺寸邊界(Natural Size Boundary)定位。

ARM編譯程序通常將全局變量對齊到自然尺寸邊界上,以便通過使用 LDR和STR指令有效地存取這些變量。

這種內(nèi)存訪問方式與多數(shù)CISC(Complex Instruction Set Computing)體系結(jié)構(gòu)不同,在CISC體系結(jié)構(gòu)下,指令直接存取未對齊的數(shù)據(jù)。因而,當(dāng)需要將代碼從CISC體系結(jié)構(gòu)向 ARM處理器移植時,內(nèi)存訪問的地址對齊問題必須予以注意。在RISC體系結(jié)構(gòu)下,存取未對齊數(shù)據(jù)無論在代碼尺寸或是程序執(zhí)行效率上,都將付出非常大的代價。

注意

在ARM11處理器上,新增加了支持非內(nèi)存對齊數(shù)據(jù)訪問的硬件,此結(jié)構(gòu)在本章中不作討論。

下面將從4個方面詳細(xì)討論在ARM體系結(jié)構(gòu)下的程序設(shè)計:

· 未對齊指針;

· 結(jié)構(gòu)體中的未對齊字段;

· 用于半字存取的Load指令;

· 移植代碼并檢測非對齊存取。

13.1.1 未對齊的數(shù)據(jù)指針

C和C++編程標(biāo)準(zhǔn)規(guī)定,指向某一數(shù)據(jù)類型的指針,必須和該類型的數(shù)據(jù)地址對齊方式一致,所以ARM編譯器期望程序中的C指針指向存儲器中字對齊地址,因為這可使編譯器生成更高效的代碼。

比如,如果定義一個指向int數(shù)據(jù)類型的指針,用該指針讀取一個字,ARM 編譯器將使用LDR指令來完成此操作。如果讀取的地址為4的倍數(shù)(即在一個字的邊界)即能正確讀取。但是,如果該地址不是4的倍數(shù),那么,一條LDR指令返回一個循環(huán)移位結(jié)果,而不是執(zhí)行真正的未對齊字載入。循環(huán)移位結(jié)果取決于該地址相對于字的邊界的偏移量和系統(tǒng)所使用的端序(Endianness)。例如,如果代碼要求從指針指向的地址0x8006載入數(shù)據(jù),即要載入0x8006、0x8007、0x8008和0x8009 4個字節(jié)的內(nèi)容。但是,在ARM處理器上,這個存取操作載入了0x8004、0x8005、0x8006和0x8007字節(jié)的內(nèi)容。這就是在未對齊的地址上使用指針存取所得到的循環(huán)移位結(jié)果。

因而,如果想將指針定義到一個指定地址(該地址為非自然邊界對齊),那么在定義該指針時,必須使用__packed限定符來定義指針:

例如:

__packed int *pi; // 指針指向一個非字對其內(nèi)存地址

使用了__packed限定符限定之后,ARM編譯器將產(chǎn)生字節(jié)存取命令(LDRB或STRB指令)來存取內(nèi)存,這樣就不必考慮指針對齊問題。所生成的代碼是字節(jié)存取的一個序列,或者取決于編譯選項、跟變量對齊相關(guān)的移位和屏蔽。但這會導(dǎo)致系統(tǒng)性能和代碼密度的損失。

值得注意的是,不能使用__packed限定的指針來存取存儲器映射的外圍寄存器,因為ARM編譯程序可使用多個存儲器存取來獲取數(shù)據(jù)。因而,可以對實際存取地址附近的位置進(jìn)行存取,而這些附近的位置可能對應(yīng)于其他外部寄存器。當(dāng)使用了位字段(Bitfield)時,ARM程序?qū)⒃L問整個結(jié)構(gòu)體,而非指定字段。

13.1.2 結(jié)構(gòu)體中未對齊字段

與全局變量位于其自然尺寸邊界相同,結(jié)構(gòu)體(Structure)中的域字段(Filed)也如此。也就是說編譯程序經(jīng)常要在字段間插入填充字節(jié)(Padding)來確保域字段對齊。當(dāng)編譯程序插入填充字節(jié)時,編譯器將產(chǎn)生以下警告信息。

#1301-D: padding inserted in struct mystruct

可以使用-remark編譯選項使編譯器產(chǎn)生備份信息,或使用-diag_warning選項選擇編譯器產(chǎn)生的備份信息。

如果不希望編譯器產(chǎn)生填充字節(jié),可以使用__packed限定符來創(chuàng)建字段之間沒有填充字節(jié)的結(jié)構(gòu),且這些結(jié)構(gòu)需要非對齊存取。

如果ARM編譯器能夠確定所訪問結(jié)構(gòu)體的對齊方式,那么它就可以自動識別所存取結(jié)構(gòu)體中的字段的對齊方式。在這些情況下,編譯程序盡可能地采用更有效的對齊字或半字存取方式。否則,編譯器將使用多個對齊存儲器存取(LDR、STR、LDM和STM)與固定移位和屏蔽相結(jié)合來存取存儲器中的字節(jié)。

對非對齊元素的存取是通過內(nèi)聯(lián)還是通過調(diào)用一個函數(shù)來完成,由編譯程序-Ospace(默認(rèn),調(diào)用一個函數(shù))和-Otime(執(zhí)行非對齊存取內(nèi)聯(lián))選項來控制。

例如:

創(chuàng)建一個名為foo.c源文件。

__packed struct mystruct {

int aligned_i;

short aligned_s;

int unaligned_i;

};

struct mystruct S1;

int foo (int a, short b)

{

S1.aligned_i=a;

S1.aligned_s=b;

return S1.unaligned_i;

}

使用armcc -c -Otime foo.c編譯。所生成的代碼為:

MOV r2,r0

LDR r0,|L1.84|

MOV r12,r2,LSR #8

STRB r2,[r0,#0]

STRB r12,[r0,#1]

MOV r12,r2,LSR #16

STRB r12,[r0,#2]

MOV r12,r2,LSR #24

STRB r12,[r0,#3]

MOV r12,r1,LSR #8

STRB r1,[r0,#4]

STRB r12,[r0,#5]

ADD r0,r0,#6

BIC r3,r0,#3

AND r0,r0,#3

LDMIA r3,{r3,r12}

MOV r0,r0,LSL #3

MOV r3,r3,LSR r0

RSB r0,r0,#0x20

ORR r0,r3,r12,LSL r0

BX lr

其中,“|L1.84|”為結(jié)構(gòu)體mystruct在內(nèi)存中的地址。

從上例可以看出,所有對結(jié)構(gòu)體域成員的訪問都是通過字節(jié)訪問實現(xiàn)的,所以這種不對齊內(nèi)存訪問無論從代碼占用的存儲器空間,還是代碼的執(zhí)行時間上都要付出一定的代價。

然而,開發(fā)者可以給編譯器提供更多的信息,使其知道結(jié)構(gòu)體內(nèi)哪個字段是對齊的,哪個字段不是。為此,必須將未對齊字段聲明為__packed,并從struct本身除去__packed屬性。通過這種方法可以保證對struct中自然對齊成員的快速訪問。而且,哪個字段是未對齊的也更清楚,但這樣就增加了訪問struct結(jié)構(gòu)的難度,當(dāng)用戶從結(jié)構(gòu)中增加或刪除字段時需要特別小心。

修改上例中結(jié)構(gòu)體的定義,來減少訪問結(jié)構(gòu)體的開銷。具體代碼如下所示。

struct mystruct {

int aligned_i;

short aligned_s;

__packed int unaligned_i;

};

struct mystruct S1;

對修改后的程序進(jìn)行編譯,產(chǎn)生的匯編代碼如下所示。

MOV r2,r0

LDR r0,|L1.32|

STR r2,[r0,#0]

STRH r1,[r0,#4]

LDMIB r0,{r3,r12}

MOV r0,r3,LSR #16

ORR r0,r0,r12,LSL #16

BX lr

從編譯后的匯編代碼不難看出,對結(jié)構(gòu)體內(nèi)符號自然邊界對齊的域,編譯器直接使用相應(yīng)的Load/Store指令進(jìn)行訪問,而只有那些非自然邊界對齊的域,編譯器才進(jìn)行附加處理。這樣,從時間和空間兩方面減小了程序的開銷。

同一原理也適應(yīng)于聯(lián)合體結(jié)構(gòu)(unions)。使用在存儲器中未對齊的聯(lián)合組件的__packed屬性。

13.1.3 用于半字存取的非對齊 LDR指令

一些特殊情況下,ARM編譯程序可以生成非對齊LDR指令。特別是編譯程序從存儲器中載入半字時將使用該方法。這是因為,通過使用相應(yīng)地址,所需的半字可以載入到寄存器的高半段(bits[31:16]),然后通過移位,將有效數(shù)據(jù)移到寄存器的低半段(bits[15:0])。這樣做的目的是通過減少內(nèi)存訪問次數(shù)來減少程序的執(zhí)行時間。通過上面的方法,程序只需要一次存儲器的訪問,而使用LDRB指令做同樣的操作需要兩次存儲器的存取,而且還要為將這兩個字節(jié)合并在一起添加特殊的代碼。在ARM體系結(jié)構(gòu)v3和其早期版本中,通常使用該方法進(jìn)行所有的半字載入。但在ARMv4及其以后版本中,出現(xiàn)了專門的半字載入指令,這種方法逐漸被取代。但是,非對齊LDR指令仍可能會出現(xiàn),比如在一個充填結(jié)構(gòu)中存取一個非對齊short域類型。

注意

在RVCT中已經(jīng)不再支持ARMv3架構(gòu)。

13.1.4 移植代碼并檢測非對齊內(nèi)存訪問

在非RISC體系結(jié)構(gòu)的處理器上執(zhí)行的代碼中,可能會存在使用指針訪問非自然邊界對齊的數(shù)據(jù)類型。這種操作,在ARM體系結(jié)構(gòu)中是不允許的。這就給代碼的移植帶來很大困難。用戶必須識別并更改此類內(nèi)存訪問代碼才能使其在RISC體系結(jié)構(gòu)的處理器上正確執(zhí)行。

識別非對齊存取可能會很困難,因為使用非對齊地址進(jìn)行的載入或存儲操作會產(chǎn)生不正確的動作。追蹤到底是哪部分的C源程序造成了這個問題是很困難的。

具有完整存儲器管理單元(MMUs)的ARM處理器,例如ARM920TTM,支持內(nèi)存對齊檢測功能,用戶可以通過設(shè)置MMU使處理器檢測每一次的內(nèi)存訪問以確保其被正確地對齊。如果出現(xiàn)非對齊內(nèi)存訪問,MMU將產(chǎn)生數(shù)據(jù)中斷。這樣就給追蹤出錯代碼帶來了很大的方便。

對于一些簡單的沒有MMU的內(nèi)核,如ARM7TDMI,最好的方法是在ASIC(Application Specific Integrated Circuit)/ASSP(Application Specific Standard Product)內(nèi)部實現(xiàn)對齊檢測??梢栽黾訉iT的ARM內(nèi)核擴(kuò)展硬件,由其監(jiān)控每次數(shù)據(jù)的訪問的內(nèi)存大小和存取地址總線的最低有效位。在非對齊存取的情況下,可以通過配置ASIC/ASSP產(chǎn)生中斷信號(ABORT)。ARM公司建議在需要運(yùn)行移植代碼設(shè)備中包含這樣的ASIC/ASSP邏輯。

如果在設(shè)計系統(tǒng)時,將系統(tǒng)設(shè)計成為當(dāng)出現(xiàn)非對齊的內(nèi)存訪問時產(chǎn)生異常,則必須安裝數(shù)據(jù)中斷異常處理程序(Data Abort Handler)。出現(xiàn)非對齊存取時,程序進(jìn)入數(shù)據(jù)中斷處理程序,并由此識別位于返回地址(在LR中保存的地址)減8(r14-8)的出錯數(shù)據(jù)存取指令。

一旦出現(xiàn)數(shù)據(jù)中斷異常,必須通過改變C源程序來修復(fù)非對齊的數(shù)據(jù)訪問。使用下列指令可有條件地完成修復(fù):

#ifdef __arm

#define PACKED __packed

#else

#define PACKED

#endif

:

PACKED int *pi;

:

由于代碼大小和性能上的開銷,最好盡可能少采用存取非對齊數(shù)據(jù)。

ARM編譯器支持--pointer_alignment和--min_array_alignment與內(nèi)存對齊相關(guān)的編譯選項,詳見ARM相關(guān)文檔。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉