編寫高效簡潔的C語言代碼,是許多軟件工程師追求的目標(biāo)。本文就工作中的一些體會和經(jīng)驗做相關(guān)的闡述,不對的地方請各位指教。
第1招:以空間換時間
計算機程序中最大的矛盾是空間和時間的矛盾,那么,從這個角度出發(fā)逆向思維來考慮程序的效率問題,我們就有了解決問題的第1招--以空間換時間。
例如:字符串的賦值。
方法A,通常的辦法:
#define LEN 32
char string1 [LEN];
memset (string1,0,LEN);
strcpy (string1,"This is an example!!"
方法B:
const char string2[LEN]="This is an example!"
char*cp;
cp=string2;
(使用的時候可以直接用指針來操作。)
從上面的例子可以看出,A和B的效率是不能比的。在同樣的存儲空間下,B直接使用指針就可以操作了,而A需要調(diào)用兩個字符函數(shù)才能完成。B的缺點在于靈活性沒有A好。在需要頻繁更改一個字符串內(nèi)容的時候,A具有更好的靈活性;如果采用方法B,則需要預(yù)存許多字符串,雖然占用了 大量的內(nèi)存,但是獲得了程序執(zhí)行的高效率。
如果系統(tǒng)的實時性要求很高,內(nèi)存還有一些,那我推薦你使用該招數(shù)。
該招數(shù)的邊招--使用宏函數(shù)而不是函數(shù)。舉例如下:
方法C:
#define bwMCDR2_ADDRESS 4
#define bsMCDR2_ADDRESS 17
int BIT_MASK (int_bf)
{
return ((IU<<(bw##_bf))-1)<<(bs##_bf);
}
void SET_BITS(int_dst,int_bf,int_val)
{
_dst=((_dst) & ~ (BIT_MASK(_bf)))I (((_val)<<<(bs##_bf))&(BIT_MASK(_bf)))
}
SET_BITS(MCDR2,MCDR2_ADDRESS,RegisterNumber);
方法D:
#define bwMCDR2_ADDRESS 4
#define bsMCDR2_ADDRESS 17
#define bmMCDR2_ADDRESS BIT_MASK (MCDR2_ADDRESS)
#define BIT_MASK(_bf)(((1U<<(bw##_bf))-1)<< (bs##_bf)
#define SET_BITS(_dst,_bf,_val) ((_dst)=((_dst)&~(BIT_MASK(_bf)))I (((_val)<<(bs##_bf))&(BIT_MASK(_bf))))
SET_BITS(MCDR2,MCDR2_ADDRESS,RegisterNumber);
函數(shù)和宏函數(shù)的區(qū)別就在于,宏函數(shù)占用了大量的空間,而函數(shù)占用了時間。大家要知道的是,函數(shù)調(diào)用是要使用系統(tǒng)的棧來保存數(shù)據(jù)的,如果編譯器里有棧檢查選項,一般在函數(shù)的頭會嵌入一些匯編語句對當(dāng)前棧進行檢查;同時,CPU也要在函數(shù)調(diào)用時保存和恢復(fù)當(dāng)前的現(xiàn)場,進行壓棧和彈棧操作,所以,函數(shù)調(diào)用需要一些CPU時間。而宏函數(shù)不存在這個問題。宏函數(shù)僅僅作為預(yù)先寫好的代碼嵌入到當(dāng)前程序,不會產(chǎn)生函數(shù)調(diào)用,所以僅僅是占用了空間,在頻繁調(diào)用同一個宏函數(shù)的時候,該現(xiàn)象尤其突出。
D方法是我看到的最好的置位操作函數(shù),是ARM公司源碼的一部分,在短短的三行內(nèi)實現(xiàn)了很多功能,幾乎涵蓋了所有的位操作功能。C方法是其變體,其中滋味還需大家仔細體會。
第2招:數(shù)學(xué)方法解決問題
現(xiàn)在我們演繹高效C語言編寫的第二招--采用數(shù)學(xué)方法來解決問題。
數(shù)學(xué)是計算機之母,沒有數(shù)學(xué)的依據(jù)和基礎(chǔ),就沒有計算機的發(fā)展,所以在編寫程序的時候,采用一些數(shù)學(xué)方法會對程序的執(zhí)行效率有數(shù)量級的提高。
舉例如下,求1~100的和。
方法E
int I,j;
for (I=1; I<=100; I++){
j+=I;
}
方法F
int I;
I=(100*(1+100))/2
這個例子是我印象最深的一個數(shù)學(xué)用例,是我的餓計算機啟蒙老師考我的。當(dāng)時我只有小學(xué)三年級,可惜我當(dāng)時不知道用公式Nx(N+1)/2來解決這個問題。方法E循環(huán)了100次才解決問題,也就是說最少用了100個賦值、100個判斷、200個加法(I和j);而方法F僅僅用了1個加法、1個乘法、1次除法。效果自然不言而喻。所以,現(xiàn)在我在編程序的時候,更多的是動腦筋找規(guī)律,最大限度地發(fā)揮數(shù)學(xué)的威力來提高程序運行的效率。
第3招:使用位操作
實現(xiàn)高效的C語言編寫的第三招--使用位操作,減少除法和取模的運算。
在計算機程序中,數(shù)據(jù)的位是可以操作的最小數(shù)據(jù)單位,理論上可以用“位運算”來完成所有的運算和操作。一般的位操作是用來控制硬件的,或者做數(shù)據(jù)變換使用,但是,靈活的位操作可以有效地提高程序運行的效率。舉例如下:
方法G
int I,J;
I=257/8;
J=456%32;
方法H
int I,J;
I=257>>3;
J=456-(456>>4<<4);
在字面上好象H比G麻煩了好多,但是,仔細查看產(chǎn)生的匯編代碼就會明白,方法 G調(diào)用了基本的取模函數(shù)和除法函數(shù),既有函數(shù)調(diào)用,還有很多匯編代碼和寄存器參與運算;而方法H則僅僅是幾句相關(guān)的匯編,代碼更簡潔、效率更高。當(dāng)然,由于編譯器的不同,可能效率的差距不大,但是,以我目前遇到的MS C,ARM C來看,效率的差距還是不小。相關(guān)匯編代碼就不在這里列舉了。
運用這招需要注意的是,因為CPU的不同而產(chǎn)生的問題。比如說,在PC上用這招編寫的程序,并在PC上調(diào)試通過,在移植到一個16位機平臺上的時候,可能會產(chǎn)生代碼隱患。所以只有在一定技術(shù)進階的基礎(chǔ)下才可以使用這招。
第4招:匯編嵌入
高效C語言編程的必殺技,第四招--嵌入?yún)R編。
“在熟悉匯編語言的人眼里,C語言編寫的程序都是垃圾”。這種說法雖然偏激了一些,但是卻有它的道理。匯編語言是效率最高的計算機語言,但是,不可能靠著它來寫一個操作系統(tǒng)吧?所以,為了獲得程序的高效率,我們只好采用變通的方法--嵌入?yún)R編、混合編程。
舉例如下,將數(shù)組一賦值給數(shù)組二,要求每一個字節(jié)都相符。char string1[1024], string2[1024];方法I
int I;
for (I=0; I<1024; I++)
*(string2+I)=*(string1+I)
方法J
#int I;
for(I=0; I<1024; I++)
*(string2+I)=*(string1+I);
#else
#ifdef_ARM_
_asm
{
MOV R0,string1
MOV R1,string2
MOV R2,#0
loop:
LDMIA R0!,[R3-R11]
STMIA R1!,[R3-R11]
ADD R2,R2,#8
CMP R2, #400
BNE loop
}
#endif
方法I是最常見的方法,使用了1024次循環(huán);方法J則根據(jù)平臺不同做了區(qū)分,在ARM平臺下,用嵌入?yún)R編僅用128次循環(huán)就完成了同樣的操作。這里有朋友會說,為什么不用標(biāo)準(zhǔn)的內(nèi)存拷貝函數(shù)呢?這是因為在源數(shù)據(jù)里可能含有數(shù)據(jù)為0的字節(jié),這樣的話,標(biāo)準(zhǔn)庫函數(shù)會提前結(jié)束而不會完成我們要求的操作。這個例程典型應(yīng)用于LCD數(shù)據(jù)的拷貝過程。根據(jù)不同的CPU,熟練使用相應(yīng)的嵌入?yún)R編,可以大大提高程序執(zhí)行的效率。
雖然是必殺技,但是如果輕易使用會付出慘重的代價。這是因為,使用了嵌入?yún)R編,便限制了程序的可移植性,使程序在不同平臺移植的過程中,臥虎藏龍、險象環(huán)生!同時該招數(shù)也與現(xiàn)代軟件工程的思想相違背,只有在迫不得已的情況下才可以采用。切記。
使用C語言進行高效率編程,我的體會僅此而已。在此已本文拋磚引玉,還請各位高手共同切磋。希望各位能給出更好的方法,大家一起提高我們的編程技巧。
擴展閱讀:如何提高C語言代碼效率?