如何分析和提高(C/C++)程序的編譯速度?
一個(gè)別人的vs 2018 的程序, 編譯, 加載數(shù)據(jù), 運(yùn)行, 需要個(gè)把小時(shí)。當(dāng)改代碼然后再運(yùn)行的時(shí)候,又要個(gè)把小時(shí)才能編譯看結(jié)果.這樣豈不是很浪費(fèi)時(shí)間, 怎么辦?這樣如何修改程序,怎么提高效率啊?
當(dāng)我們遇到這樣情況的時(shí)候,是不是不知所措呢?怎么防止遇到這樣的情況呢,我們來(lái)分析一下程序加速的一些方法。
硬件、編譯器造成的
使用好點(diǎn)的電腦無(wú)疑是一個(gè)操作上的最佳選擇,其次,對(duì)于編譯器也是可以編譯選項(xiàng)優(yōu)化的,例如在VS環(huán)境中,可以通過(guò)配置屬性來(lái)實(shí)現(xiàn),具體步驟如下,大家可以參考:https://blog.csdn.net/yizhou2010/article/details/52635288
代碼編寫風(fēng)格
多使用自加、自減指令和復(fù)合賦值表達(dá)式
你覺(jué)得使用i++
,i = i + 1
,i += 1
有區(qū)別嗎?我們來(lái)測(cè)試一下C代碼:
void asd() {}
int main() {
int i=0;
i++;
asd(); //方便區(qū)分上下文
i=i+1;
asd();
i+=1;
return 0;
}
反匯編:
mov [rbp+i], 0 //i的初始化
add [rbp+i], 1 //i++;
call _Z3asdv ; asd(void)
add [rbp+i], 1 //i=i+1;
call _Z3asdv ; asd(void)
add [rbp+i], 1 //i+=1;
我們看到這個(gè)結(jié)果是一樣的,但是在更加復(fù)雜的表達(dá)式中就會(huì)多生成幾個(gè)指令了,而且用 i += 1
的,總是比寫 i = i + 1
的要稍微那么好看些。
除法換成乘法或者移位來(lái)表達(dá)
除法就是由乘法的過(guò)程逆推來(lái)的,依次減掉(如果x夠減的)y^(2^31),y^(2^30),...y^8,y^4,y^2,y^1。減掉相應(yīng)數(shù)量的y就在結(jié)果加上相應(yīng)的數(shù)量,一般來(lái)說(shuō),更耗時(shí)間一些,用一個(gè)demo來(lái)測(cè)試一下
auto time_start = std::chrono::system_clock::now();
int iCount = 100000;
double k ;
for (int i = 0; i < 1000000; i++)
{
tmp = iCount / 2;
}
std::chrono::duration<double> time_spend = std::chrono::system_clock::now() - time_start;
double test1 = time_spend.count() * 1000;
cout<<"test1 cost "<<time_cost<<" ms"<<endl;
time_start = std::chrono::system_clock::now() ;
for (int i = 0; i < 1000000; i++)
{
tmp = iCount * 0.5f;
}
time_spend = std::chrono::system_clock::now() - time_start;
test2 = time_spend.count() * 1000;
cout<<"test2 cost "<<time_cost<<" ms"<<endl;
time_start = std::chrono::system_clock::now() ;
for (int i = 0; i < 1000000; i++)
{
tmp = iCount >>1;
}
time_spend = std::chrono::system_clock::now() - time_start;
test3 = time_spend.count() * 1000;
cout<<"test3 cost "<<time_cost<<" ms"<<endl;
我們輸出結(jié)果會(huì)發(fā)現(xiàn),移位和乘法比除法要省3-5倍時(shí)間,移位相對(duì)而言是最省時(shí)間的。
多用直接初始化,少用拷貝初始化
string s1 = "hiya"; // 拷貝初始化
string s2("hello"); // 直接初始化
string s3(10, 'c'); // 直接初始化
當(dāng)我們使用拷貝初始化時(shí),我們要求編譯器將右側(cè)運(yùn)算對(duì)象拷貝到正在創(chuàng)建的對(duì)象中,如果需要的話還要進(jìn)行類型轉(zhuǎn)換,會(huì)浪費(fèi)一定的資源時(shí)間,而直接初始化是要求編譯器使用普通的函數(shù)匹配來(lái)選擇與我們提供的參數(shù)最匹配的構(gòu)造函數(shù)和拷貝構(gòu)造函數(shù)。
我們來(lái)看看Primer中怎么說(shuō)的
當(dāng)用于類類型對(duì)象時(shí),初始化的復(fù)制形式和直接形式有所不同:直接初始化直接調(diào)用與實(shí)參匹配的構(gòu)造函數(shù),復(fù)制初始化總是調(diào)用復(fù)制構(gòu)造函數(shù)。復(fù)制初始化首先使用指定構(gòu)造函數(shù)創(chuàng)建一個(gè)臨時(shí)對(duì)象,然后用復(fù)制構(gòu)造函數(shù)將那個(gè)臨時(shí)對(duì)象復(fù)制到正在創(chuàng)建的對(duì)象”
還有一段說(shuō)到:
通常直接初始化和復(fù)制初始化僅在低級(jí)別優(yōu)化上存在差異,然而,對(duì)于不支持復(fù)制的類型,或者使用非explicit構(gòu)造函數(shù)的時(shí)候,它們有本質(zhì)區(qū)別:
ifstream file1("filename")://ok:direct initialization
ifstream file2 = "filename";//error:copy constructor is private
局部變量、靜態(tài)局部變量、全局變量與靜態(tài)全局變量
-
局部變量是存在于堆棧中的,對(duì)其空間的分配僅僅是修改一次esp寄存器的內(nèi)容即可; -
靜態(tài)局部變量是定義在函數(shù)內(nèi)部的,靜態(tài)局部變量定義時(shí)前面要加static關(guān)鍵字來(lái)標(biāo)識(shí),靜態(tài)局部變量所在的函數(shù)在多調(diào)用多次時(shí),只有第一次才經(jīng)歷變量定義和初始化; -
當(dāng)一個(gè)文件或者數(shù)據(jù)反復(fù)使用時(shí),應(yīng)該存儲(chǔ)在全局變量中,避免重復(fù)加載使用; -
靜態(tài)全局變量是靜態(tài)存儲(chǔ)方式,靜態(tài)全局變量則限制了其作用域,即只在定義該變量的源文件內(nèi)有效,在同一源程序的其它源文件中不能使用它。
靜態(tài)變量是低效的,當(dāng)一塊數(shù)據(jù)被反復(fù)讀寫,其數(shù)據(jù)會(huì)留在CPU的一級(jí)緩存(Cache)中
代碼冗余度
避免大的循環(huán),循環(huán)中避免判斷語(yǔ)句
在寫程序過(guò)程中,最影響代碼運(yùn)行速度的往往都是循環(huán)語(yǔ)句,我記得當(dāng)時(shí)在寫matlab的時(shí)候,處理大數(shù)據(jù),都是禁止用循環(huán)的,特別是多層嵌套的循環(huán)語(yǔ)句。
其次,盡量將循環(huán)嵌套控制在 3 層以內(nèi),有研究數(shù)據(jù)表明,當(dāng)循環(huán)嵌套超過(guò) 3 層,程序員對(duì)循環(huán)的理解能力會(huì)極大地降低。同時(shí),這樣程序的執(zhí)行效率也會(huì)很低。因此,如果代碼循環(huán)嵌套超過(guò) 3 層,建議重新設(shè)計(jì)循環(huán)或?qū)⒀h(huán)內(nèi)的代碼改寫成一個(gè)子函數(shù)。
for (i=0;i<100;i++)
{
for (j=0;j<5;j++)
{
for (j=0;j<5;j++)
{
/*處理代碼*/
}
}
}
多重 for 循環(huán)中,如果有可能,應(yīng)當(dāng)盡量將最長(zhǎng)的循環(huán)放在最內(nèi)層,最短的循環(huán)放在最外層,以減少 CPU 跨切循環(huán)層的次數(shù)
for (i=0;i<100;i++)
{
for (j=0;j<5;j++)
{
/*處理代碼*/
}
}
改為:
for (j=0;j<5;j++)
{
for (i=0;i<100;i++)
{
/*處理代碼*/
}
}
邏輯判斷不要在循環(huán)中使用,當(dāng) for 循環(huán)的次數(shù)很大時(shí),執(zhí)行多余的判斷不僅會(huì)消耗系統(tǒng)的資源,而且會(huì)打斷循環(huán)“流水線”作業(yè),使得編譯器不能對(duì)循環(huán)進(jìn)行優(yōu)化處理,降低程序的執(zhí)行效率
if (condition)
{
for (i = 0;i < n;i++)
{
/*處理代碼*/
}
}
else
{
for (i = 0;i < n;i++)
{
/*處理代碼*/
}
}
盡量避免遞歸,遞歸就是不停的調(diào)用自身,所以非常消耗資源,甚至造成堆棧溢出和程序崩潰等等問(wèn)題!
int Func(int n)
{
if(n < 2)
return 1;
else
return n*Func(n-1);
}
因此,掌握循環(huán)優(yōu)化的各種實(shí)用技術(shù)是提高程序效率的利器,也是一個(gè)高水平程序必須具備的基本功。
盡量不使用繼承和多重繼承
多重繼承增加了類的繼承層次的復(fù)雜性,調(diào)試難度增加當(dāng)然風(fēng)險(xiǎn)也增加了,而且使用父類指針指向子類對(duì)象變成了一件復(fù)雜的事情,得用到C++中提供的dynamic_cast來(lái)執(zhí)行強(qiáng)制轉(zhuǎn)換。但是dynamic_cast是在運(yùn)行期間而非編譯期間進(jìn)行轉(zhuǎn)換的,因此會(huì)會(huì)帶來(lái)一些輕微的性能損失,建議類型轉(zhuǎn)換盡量采用c++內(nèi)置的類型轉(zhuǎn)換函數(shù),而不要強(qiáng)行轉(zhuǎn)換
少用模板,因?yàn)槟0迨蔷幾g期技術(shù),大量采用模板也會(huì)增加編譯時(shí)間
在c++primer3中,有一句話:
在多個(gè)文件之間編譯相同的函數(shù)模板定義增加了不必要的編譯時(shí)間 簡(jiǎn)單點(diǎn)說(shuō),對(duì)于一個(gè)zhidaovector
的函數(shù),比如size(),如果在不同的cpp中出現(xiàn),在這些文件編譯的時(shí)候都要把vector ::size()編譯一遍。然后在鏈接的時(shí)候把重復(fù)的函數(shù)去掉,很顯然增加了編譯時(shí)間。模版函數(shù)需要在編譯的時(shí)候?qū)嵗痾hidao,所以呢,不把模版的實(shí)現(xiàn)代碼放到頭文件中的話(在頭文件中實(shí)例化),那么每個(gè)使用到這個(gè)模版的cpp的都要把這個(gè)模版重新實(shí)例化一遍,所以增加了編內(nèi)譯時(shí)間
編碼依賴性
聲明與實(shí)現(xiàn)分離,刪除不必要的#include
-
使用include時(shí),只需要include這個(gè)接口頭文件就好 -
并不是所有的文件都需要包含頭文件 iostream,定義了輸出函數(shù)引用就好 -
ostream頭文件也不要,替換為 iosfwd, 為什么,參數(shù)和返回類型只要前向聲明(forward declared )就可以編譯通過(guò)
盡量減少參數(shù)傳遞,多用引用來(lái)傳遞參數(shù)。
bool func1(string s1, string s2)
bool func2(string *s1, string *s2)
bool func3(string &s1, string &s2)
指針和引用都不會(huì)創(chuàng)建新的對(duì)象,函數(shù)func2和func3不需要調(diào)用析構(gòu)和構(gòu)造函數(shù),函數(shù)func1使用值傳遞在參數(shù)傳遞和函數(shù)返回時(shí),需要調(diào)用string的構(gòu)造函數(shù)和析構(gòu)函數(shù)兩次。
適當(dāng)?shù)牟捎肞IMPL模式
很實(shí)用的一種基礎(chǔ)模式,通過(guò)一個(gè)私有的成員指針,將指針?biāo)赶虻念惖膬?nèi)部實(shí)現(xiàn)數(shù)據(jù)進(jìn)行隱藏。將實(shí)現(xiàn)放到CPP里,主要作用在于編譯分離,其實(shí)是增加了編碼量以及初次編譯時(shí)長(zhǎng),增量編譯才體現(xiàn)作用。例如:指針的大小為(64位)或32(8位),X發(fā)生變化,指針大小卻不會(huì)改變,文件c.h也不需要重編譯。
未完待續(xù)
方法還有很多,比如使用多線程,多任務(wù)并行編譯,分布式編譯,預(yù)編譯等等,另外,在編譯大型項(xiàng)目時(shí),分布式編譯更優(yōu),往往能夠大幅度提升性能。
推薦閱讀
(點(diǎn)擊標(biāo)題可跳轉(zhuǎn)閱讀)
【編程之美】用C語(yǔ)言實(shí)現(xiàn)狀態(tài)機(jī)(實(shí)用)
免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。文章僅代表作者個(gè)人觀點(diǎn),不代表本平臺(tái)立場(chǎng),如有問(wèn)題,請(qǐng)聯(lián)系我們,謝謝!