c編譯器高級篇!!搞定c編譯器優(yōu)化

時間：2019-08-30 14:14:12

關(guān)鍵字： c編譯器優(yōu)化處理器

手機(jī)看文章

掃描二維碼
隨時隨地手機(jī)看文章

[導(dǎo)讀]對于c編譯器，想必大家也有所了解，3款主流c編譯器也是活躍在不同人群的PC上。網(wǎng)絡(luò)上很多文章都止步于對c編譯器的介紹，并未探索c編譯器更加深層次的內(nèi)容。而在本文中，將涉及c編譯器的高級部分——c編譯器及其優(yōu)化。所以，本文的講解需要大家具備一定的c編譯器基礎(chǔ)，以及一定的c語言代碼編寫能力。

對于c編譯器，想必大家也有所了解，3款主流c編譯器也是活躍在不同人群的PC上。網(wǎng)絡(luò)上很多文章都止步于對c編譯器的介紹，并未探索c編譯器更加深層次的內(nèi)容。而在本文中，將涉及c編譯器的高級部分——c編譯器及其優(yōu)化。所以，本文的講解需要大家具備一定的c編譯器基礎(chǔ)，以及一定的c語言代碼編寫能力。

此外，本文的內(nèi)容的開發(fā)環(huán)境基于ARM處理器，相關(guān)技術(shù)同樣可在RISC處理器上實(shí)現(xiàn)，所以同樣需要讀者具備最基礎(chǔ)的處理器知識。

本文主要講解C編譯器在代碼優(yōu)化時遇到的一些問題。要編寫高效的C語言源代碼，必須了解C編譯器對什么形式的代碼有所改動，編譯器涉及的處理器結(jié)構(gòu)的限制，以及一些特殊的C編譯器的限制。

1.為編譯器選擇處理器結(jié)構(gòu)

在編譯C源文件時，必須為編譯器指定正確的處理器類型。這樣可以使編譯的代碼最大限度地利用處理器的硬件結(jié)構(gòu)，如對半字加載(Halfword Load)、存儲指令(Store InstrucTIons)和指令調(diào)度(InstrucTIon Scheduling)的支持。所以編譯程序時，應(yīng)該盡量準(zhǔn)確地告訴編譯器該代碼是運(yùn)行在什么類型的處理器上。有些處理器類型編譯器是不能直接支持，如SA-1100，這時可以使用與該類型處理器為同一指令集的基本處理器，比如對于SA-100，可以使用StrongARM。

注意指定目標(biāo)處理器可能使代碼與其他ARM處理器不兼容。例如，編譯時指定了ARMv6體系結(jié)構(gòu)的代碼，可能不能運(yùn)行在ARM920T的處理器上(如果代碼中使用了ARMv6體系結(jié)構(gòu)中特有的指令)。

選擇處理器類型可以使用--cpu name編譯選項(xiàng)。該選項(xiàng)生成用于特定ARM處理器或體系結(jié)構(gòu)的代碼。

如果name是處理器名稱。

· 輸入名稱必須和ARM數(shù)據(jù)表中所示嚴(yán)格一致，例如ARM7TDMI。該選項(xiàng)不接受通配符字符。有效值是任何 ARM6 或更高版本的 ARM 處理器。

· 選擇處理器操作會選擇適當(dāng)?shù)捏w系結(jié)構(gòu)、浮點(diǎn)單元 (FPU)以及存儲結(jié)構(gòu)。

· 某些--cpu選擇暗含--fpu選擇。例如，當(dāng)使用--arm選項(xiàng)編譯時，--cpu ARM1136JF-S暗含--fpu vfpv2。隱式FPU只覆蓋命令行上出現(xiàn)在--cpu選項(xiàng)前面的顯式--fpu選項(xiàng)。如果沒有指定--fpu選項(xiàng)和--cpu選項(xiàng)，則使用--fpu softvfp。

2.調(diào)試選項(xiàng)

如果在編譯C源程序時，設(shè)置了調(diào)試選項(xiàng)，這將很大程度地影響最終代碼的大小和執(zhí)行效率。因?yàn)閹д{(diào)試信息的代碼映像，為了能夠在調(diào)試程序時正確地顯示變量或設(shè)置斷點(diǎn)，包含很多冗余的代碼和數(shù)據(jù)。所以如果想最大限度地提供程序執(zhí)行效率、減少代碼尺寸，就要在編譯源文件時，去除編譯器的調(diào)試選項(xiàng)。

以下選項(xiàng)指定調(diào)試表生成方法。

· -g (--debug)：該選項(xiàng)啟用生成當(dāng)前編譯的調(diào)試表。無論是否使用-g選項(xiàng)，編譯器都生成的代碼是相同的。惟一差別是調(diào)試表的存在與否。編譯器是否對代碼進(jìn)行優(yōu)化是由-O選項(xiàng)指定調(diào)的。默認(rèn)情況下，使用-g選項(xiàng)等價(jià)于使用：-g -dwarf2 --debug_macros。

注意編譯程序時，只使用-g選項(xiàng)而沒有使用優(yōu)化選項(xiàng)，編譯器會提示警告信息。

· --no_debug：該選項(xiàng)禁止生成當(dāng)前編譯的調(diào)試表。這是默認(rèn)選項(xiàng)。

· --no_debug_macros：當(dāng)與-g一起使用時，該選項(xiàng)禁止生成預(yù)處理程序宏定義的調(diào)試表?xiàng)l目(Entry)。這會減小調(diào)試映像的大小。-gt-p是-gtp的同義字。

--debug_macros 當(dāng)與 -g 一起使用時，該選項(xiàng)啟用生成預(yù)處理程序宏定義的調(diào)試表?xiàng)l目。這是默認(rèn)選項(xiàng)，會增加調(diào)試映像的大小。一些調(diào)試程序忽略預(yù)處理程序條目。

3.優(yōu)化選項(xiàng)

使用-Onum選擇編譯器的優(yōu)化級別。優(yōu)化級別分別為。

· -O0：除一些簡單的代碼編號之外，關(guān)閉所有優(yōu)化。使用該編譯選項(xiàng)可以提供最直接的優(yōu)化信息。

· -O1：關(guān)閉嚴(yán)重影響調(diào)試效果的優(yōu)化功能。使用該編譯選項(xiàng)，編譯器會移除程序中未使用到的內(nèi)聯(lián)函數(shù)和靜態(tài)函數(shù)。如果與 --debug 一起使用，該選項(xiàng)可以在較好的代碼密度下，給出最佳調(diào)試視圖。

· -O2：生成充分優(yōu)化代碼。如果與 --debug 一起使用，調(diào)試效果可能不令人滿意，因?yàn)槟繕?biāo)代碼到源代碼的映射可能因?yàn)榇a優(yōu)化而發(fā)生變化。

如果不生成調(diào)試表，這是默認(rèn)優(yōu)化級別。

· -O3：最高優(yōu)化級別。使用該優(yōu)化級別，使生成的代碼在時間和空間上尋求平衡。該選項(xiàng)常和-Ospace和-OTIme配合使用。

· -O3 –OTIme：使用該選項(xiàng)編譯的代碼比-O2 –Otime選項(xiàng)編譯的代碼，在執(zhí)行速度上要快，但占用的空間也更大。

· -O3 -Ospace：產(chǎn)生的代碼比使用-O2 -Ospace選項(xiàng)產(chǎn)生的代碼尺寸小，但執(zhí)行效率可能會差。

如果要使編譯的代碼更側(cè)重于代碼的尺寸或執(zhí)行效率(兩者往往不可兼得)，可以使用下面的編譯選項(xiàng)。

· -Ospace：指示編譯程序執(zhí)行優(yōu)化，以延長執(zhí)行時間為代價(jià)減小映像大小。例如，由外部函數(shù)調(diào)用代替內(nèi)聯(lián)函數(shù)。如果代碼大小比性能更重要，則使用該選項(xiàng)。這是編譯器的默認(rèn)設(shè)置。

· -Otime：指示編譯程序執(zhí)行優(yōu)化，以增大映像大小為代價(jià)縮短執(zhí)行時間。如果執(zhí)行時間比代碼大小更重要，則使用該選項(xiàng)。例如，它編譯：

while (expression) body;

為：

if (expression) {

do body;

while (expression);

}

如果既不指定-Otime也不指定-Ospace，則編譯器默認(rèn)使用-Ospace?？墒褂?Otime編譯代碼中對時間要求嚴(yán)格的部分，使用-Ospace編譯其余部分。但不能在同一編譯程序調(diào)用中同時指定-Otime和-Ospace。

4.AAPCS選項(xiàng)

ARM結(jié)構(gòu)過程調(diào)用標(biāo)準(zhǔn)AAPCS(Procedure Call Standard for the ARM Architecture)是ARM體系結(jié)構(gòu)二進(jìn)制接口ABI(Application Binary Interface for the ARM Architecture【BSABI】)標(biāo)準(zhǔn)的一部分。使用該標(biāo)準(zhǔn)可以很方便的執(zhí)行C和匯編語言的相互調(diào)用。

編譯程序時，使用--apcs選項(xiàng)可以指定所使用得AAPCS標(biāo)準(zhǔn)的版本。如果沒有指定--apcs或--cpu選項(xiàng)，則編譯器使用下面默認(rèn)編譯選項(xiàng)。

--apcs /noswst/nointer/noropi/norwpi --cpu ARM7TDMI --fpu softvfp

有關(guān)AAPCS的詳細(xì)信息，請參加ARM相關(guān)文檔。

5.編譯選項(xiàng)對代碼生成影響示例

本節(jié)舉例說明編譯器的優(yōu)化選項(xiàng)如何影響代碼生成。

(1)使用-O0選項(xiàng)

下面的例子顯示了即使使用-O0編譯選項(xiàng)對代碼進(jìn)行編譯時，有些冗余代碼還是會被編譯器自動清除。

int f(int *p)

{

return (*p = = *p);

}

使用armcc -c -O0對源程序進(jìn)行編譯，生成的匯編代碼如下所示。

MOV r1， r0

MOV r0， #1

MOV pc， lr

通過上面的例子可以看到，編譯出的最終代碼中沒有加載(Load)指針P的值，變量*p被編譯器優(yōu)化掉了。如果不想讓編譯器對變量*p做優(yōu)化，可以使用“volatile”對變量進(jìn)行聲明。下面的例子，顯示了將變量聲明為“volatile”類型后，使用armcc編譯(-O2的優(yōu)化級別)后的結(jié)果。

LDR r1，[r0]

LDR r0，[r0]

CMP r1，r0

MOVNE r0，#0

MOVEQ r0，#1

MOV pc，lr

另外，編譯的代碼中的“MOV r1， r0”并沒有實(shí)際意義，只是為了方便調(diào)試程序時設(shè)置斷點(diǎn)使用。

(2)冗余代碼的清除

下面例子顯示了一段急待優(yōu)化的代碼。

int dummy()

{

int a=10， b=20;

int c;

c=a+b;

return 0;

}

當(dāng)使用arm –c –O0進(jìn)行編譯時，產(chǎn)生的匯編碼如下所示。

dummy：

0000807C E3A0100A MOV r1，#0xa

》》》 REDUNDANT\#3 int a=10，b=20;

00008080 E3A02014 MOV r2，#0x14

》》》 REDUNDANT\#5 c=a+b;

00008084 E0813002 ADD r3，r1，r2

》》》 REDUNDANT\#6 return 0;

00008088 E3A00000 MOV r0，#0

》》》 REDUNDANT\#7 }

0000808C E12FFF1E BX r14

從上面的匯編輸出可以看到，編譯器并沒有對程序中的冗余變量做任何工作。但上面這段代碼在編譯時，編譯器會給出警告，警告信息如下所示。

Warning ： #550-D： variable “c” was set but never used

Redundant.c line 4 int c;

但如果將編譯器的優(yōu)化級別提高，如使用arm –c –O1命令，則編譯器輸出的匯編代碼如下所示。

dummy：

0000807C E3A00000 MOV r0，#0

》》》 REDUNDANT\#7 }

00008080 E12FFF1E BX r14

從上面的例子看出，當(dāng)優(yōu)化級別提高到-O1時，程序中的冗余變量就會被清除。

(3)指令重排

當(dāng)指定編譯器對程序代碼進(jìn)行優(yōu)化時，編譯器會對程序中排列不合理的匯編指令序列進(jìn)行重排(只有在-O1及其以上的優(yōu)化級別中才有)，重排的目的是為了減少指令互鎖(interload)。所謂互鎖就是指如果一條指令需要前一條指令的執(zhí)行結(jié)果，而這時結(jié)果還沒有出來，那么處理器就會等待。這被稱為流水線冒險(xiǎn)(pipeline hazard)，也被稱為流水線互鎖。

下面例子顯示了對同一程序使用代碼重排和不使用代碼重排所產(chǎn)生的匯編碼的區(qū)別。÷

程序的源代碼如下所示。

int f(int *p， int x)

{ return *p + x * 3; }

使用-O0選項(xiàng)對代碼進(jìn)行編譯(無代碼重排)，產(chǎn)生的結(jié)果如下所示。

ADD r1，r1，r1，LSL #1

LDR r0，[r0，#0]

ADD r0，r0，r1 ; ARM9上產(chǎn)生互鎖

MOV pc，lr

使用-O1選項(xiàng)對代碼進(jìn)行編譯(存在代碼重排)，產(chǎn)生的結(jié)果如下所示。

ADD r1，r1，r1，LSL #1

ADD r0，r0，r1

MOV pc，lr

指令重排發(fā)生在寄存器定位和代碼產(chǎn)生階段。代碼重排只對ARM9及其以后的處理器版本產(chǎn)生作用。當(dāng)使用代碼重排時，代碼的執(zhí)行速度平均提供4%?？梢允褂?zpno_optimize_

scheduling編譯選項(xiàng)關(guān)閉代碼重排。

(4)內(nèi)嵌函數(shù)

通常情況下，如果不指定編譯選項(xiàng)，編譯器會將一些代碼量小且調(diào)用次數(shù)少的函數(shù)內(nèi)嵌進(jìn)調(diào)用函數(shù)中。如果某段子程序在其他模塊中沒有被調(diào)用，請使用Static關(guān)鍵字將其標(biāo)識。

編譯選項(xiàng)的--autoinline和--no_autoinline可以作為內(nèi)嵌函數(shù)的使能開關(guān)。--no_autoinline選項(xiàng)為-O0和-O1選項(xiàng)的默認(rèn)選項(xiàng)，但如果指定-O2或-O3的優(yōu)化選項(xiàng)，編譯器將默認(rèn)使用--autoinline選項(xiàng)。

有關(guān)內(nèi)嵌函數(shù)的詳細(xì)信息，請參見本書內(nèi)嵌函數(shù)一節(jié)。

下面的例子顯示了同一段程序，使用內(nèi)嵌功能和不使用內(nèi)嵌功能編譯出的不同結(jié)果。

要編譯的源文件如下。

int bar(int a)

{

a=a+5;

return a;

}

int foo(int i)

{

i=bar(i);

i=i-2;

i=bar(i);

i++;

return i;

}

下面的匯編程序?yàn)椴皇褂脙?nèi)嵌功能時編譯出的結(jié)果。

bar

ADD r0，r0，#5

MOV pc，lr

foo

STR lr，[sp，#-4]!

BL bar

SUB r0，r0，#2

BL bar

ADD r0，r0，#1

LDR pc，[sp]，#4

下面的匯編碼是使用內(nèi)嵌功能時編譯出的結(jié)果。

foo

ADD r0，r0，#5

SUB r0，r0，#2

ADD r0，r0，#5

ADD r0，r0，#1

MOV pc，lr

從上面的例子可以看出在使用內(nèi)嵌功能時，函數(shù)間的相互調(diào)用減少了數(shù)據(jù)的壓棧和出棧，節(jié)省了程序的執(zhí)行時間，但如果內(nèi)嵌函數(shù)被調(diào)用多次會造成空間的浪費(fèi)。

以上內(nèi)容便是小編此次帶來的與c編譯器相關(guān)的所有內(nèi)容，如果你對本文比較滿意，不妨在后期持續(xù)關(guān)注本網(wǎng)站的相關(guān)文章哦。

c編譯器高級篇!!搞定c編譯器優(yōu)化

阿維塔、賽力斯已入股！華為引望可能成“中國博世”

Trianz與AWS達(dá)成戰(zhàn)略合作協(xié)議，徹底改變云采用和管理方式

人工智能驅(qū)動工具SODA V將顛覆汽車市場，使汽車開發(fā)時間和成本降低90%

從容應(yīng)對未知風(fēng)險(xiǎn)----解密亞馬遜云科技的韌性之道

中國游戲市場開始復(fù)蘇！騰訊、網(wǎng)易等巨頭縮減在日本投資

獨(dú)立自主！華為董事：致力打造不依賴西方的技術(shù)

華為張平安：數(shù)字世界話語權(quán)最終由生態(tài)繁榮決定！

中國通信服務(wù)公布2024年中期業(yè)績

NVI技術(shù)創(chuàng)新聯(lián)盟成立！自主生態(tài)將帶動產(chǎn)業(yè)鏈高速發(fā)展

軟通動力與長三角投資達(dá)成戰(zhàn)略合作共謀數(shù)字生態(tài)新發(fā)展

海南區(qū)6家凱悅系酒店與嵐圖達(dá)成戰(zhàn)略合作，共同推動新能源出行體驗(yàn)

安嵐攜手妮可?巴菲特開啟療愈之旅在秋日紅葉的浪漫中療愈身心

不懼美國封鎖！華為：我們給大家提供系統(tǒng)、存儲等

尼爾森IQ深耕中國四十載，共繪未來新篇章

第二十二屆跨盈年度B2B營銷高管峰會2025聚焦"營銷競?cè)?，打破市場?nèi)卷實(shí)現(xiàn)認(rèn)知進(jìn)化"

恒久動力馳騁天地美孚1號攜手周冠宇邀您縱擎馳騁，勁享駕趣體驗(yàn)

美通社母公司Cision發(fā)布CisionOne平臺，進(jìn)軍亞太地區(qū)媒體監(jiān)測市場

移遠(yuǎn)通信推出大模型解決方案，重塑千行百業(yè)智能邊界

高途公布2024年第二季度未經(jīng)審計(jì)業(yè)績

華為發(fā)布AI百校計(jì)劃：培養(yǎng)AI人才每年獲最高100萬支持