如何分析和提高(C/C++)程序的編譯速度？

時(shí)間：2020-05-25 13:27:09

關(guān)鍵字：編譯 C/C++ 函數(shù) STRING

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]關(guān)注、星標(biāo)公眾號(hào) ，直達(dá)精彩內(nèi)容一個(gè)別人的vs 2018 的程序, 編譯, 加載數(shù)據(jù), 運(yùn)行, 需要個(gè)把小時(shí)。當(dāng)改代碼然后再運(yùn)行的時(shí)候,又要個(gè)把小時(shí)才能編譯看結(jié)果.這樣豈不是很浪費(fèi)時(shí)間, 怎么辦？這樣如何修改程序,怎么提高效率啊? 當(dāng)我們遇到這樣情況的時(shí)候，是不

關(guān)注、星標(biāo)公眾號(hào) ，直達(dá)精彩內(nèi)容

一個(gè)別人的vs 2018 的程序, 編譯, 加載數(shù)據(jù), 運(yùn)行, 需要個(gè)把小時(shí)。當(dāng)改代碼然后再運(yùn)行的時(shí)候,又要個(gè)把小時(shí)才能編譯看結(jié)果.這樣豈不是很浪費(fèi)時(shí)間, 怎么辦？這樣如何修改程序,怎么提高效率啊?

當(dāng)我們遇到這樣情況的時(shí)候，是不是不知所措呢？怎么防止遇到這樣的情況呢，我們來(lái)分析一下程序加速的一些方法。

硬件、編譯器造成的

使用好點(diǎn)的電腦無(wú)疑是一個(gè)操作上的最佳選擇，其次，對(duì)于編譯器也是可以編譯選項(xiàng)優(yōu)化的，例如在VS環(huán)境中，可以通過(guò)配置屬性來(lái)實(shí)現(xiàn)，具體步驟如下，大家可以參考：https://blog.csdn.net/yizhou2010/article/details/52635288

代碼編寫風(fēng)格

多使用自加、自減指令和復(fù)合賦值表達(dá)式

你覺(jué)得使用i++ ,i = i + 1,i += 1有區(qū)別嗎？我們來(lái)測(cè)試一下C代碼：

void asd() {}
int main() {
    int i=0;
    i++;
    asd();　　//方便區(qū)分上下文
    i=i+1;
    asd();
    i+=1;
    return 0;
}

反匯編：

mov     [rbp+i], 0　　　　//i的初始化
add     [rbp+i], 1　　　　//i++;
call    _Z3asdv         ; asd(void)
add     [rbp+i], 1　　　　//i=i+1;
call    _Z3asdv         ; asd(void)
add     [rbp+i], 1　　　　//i+=1;

我們看到這個(gè)結(jié)果是一樣的，但是在更加復(fù)雜的表達(dá)式中就會(huì)多生成幾個(gè)指令了，而且用 i += 1 的，總是比寫 i = i + 1的要稍微那么好看些。

除法換成乘法或者移位來(lái)表達(dá)

除法就是由乘法的過(guò)程逆推來(lái)的，依次減掉（如果x夠減的）y^(2^31),y^(2^30),...y^8,y^4,y^2,y^1。減掉相應(yīng)數(shù)量的y就在結(jié)果加上相應(yīng)的數(shù)量，一般來(lái)說(shuō)，更耗時(shí)間一些，用一個(gè)demo來(lái)測(cè)試一下

auto time_start = std::chrono::system_clock::now();
int iCount = 100000;
double k ;
for (int i = 0; i < 1000000; i++)
{
     tmp = iCount / 2;
}
std::chrono::duration<double> time_spend = std::chrono::system_clock::now() - time_start;
double test1 = time_spend.count() * 1000;
cout<<"test1 cost "<<time_cost<<" ms"<<endl;

time_start = std::chrono::system_clock::now() ;
for (int i = 0; i < 1000000; i++)
{
     tmp = iCount * 0.5f;
}
time_spend = std::chrono::system_clock::now() - time_start;
test2 = time_spend.count() * 1000;
cout<<"test2 cost "<<time_cost<<" ms"<<endl;

time_start = std::chrono::system_clock::now() ;
for (int i = 0; i < 1000000; i++)
{
     tmp = iCount >>1;
}
time_spend = std::chrono::system_clock::now() - time_start;
test3 = time_spend.count() * 1000;
cout<<"test3 cost "<<time_cost<<" ms"<<endl;

我們輸出結(jié)果會(huì)發(fā)現(xiàn)，移位和乘法比除法要省3-5倍時(shí)間,移位相對(duì)而言是最省時(shí)間的。

多用直接初始化，少用拷貝初始化

string s1 = "hiya";    // 拷貝初始化
string s2("hello");    // 直接初始化
string s3(10, 'c');    // 直接初始化

當(dāng)我們使用拷貝初始化時(shí)，我們要求編譯器將右側(cè)運(yùn)算對(duì)象拷貝到正在創(chuàng)建的對(duì)象中，如果需要的話還要進(jìn)行類型轉(zhuǎn)換，會(huì)浪費(fèi)一定的資源時(shí)間，而直接初始化是要求編譯器使用普通的函數(shù)匹配來(lái)選擇與我們提供的參數(shù)最匹配的構(gòu)造函數(shù)和拷貝構(gòu)造函數(shù)。

我們來(lái)看看Primer中怎么說(shuō)的

當(dāng)用于類類型對(duì)象時(shí)，初始化的復(fù)制形式和直接形式有所不同：直接初始化直接調(diào)用與實(shí)參匹配的構(gòu)造函數(shù)，復(fù)制初始化總是調(diào)用復(fù)制構(gòu)造函數(shù)。復(fù)制初始化首先使用指定構(gòu)造函數(shù)創(chuàng)建一個(gè)臨時(shí)對(duì)象，然后用復(fù)制構(gòu)造函數(shù)將那個(gè)臨時(shí)對(duì)象復(fù)制到正在創(chuàng)建的對(duì)象”

還有一段說(shuō)到：

通常直接初始化和復(fù)制初始化僅在低級(jí)別優(yōu)化上存在差異，然而，對(duì)于不支持復(fù)制的類型，或者使用非explicit構(gòu)造函數(shù)的時(shí)候，它們有本質(zhì)區(qū)別：
ifstream file1("filename")://ok:direct initialization
ifstream file2 = "filename";//error:copy constructor is private

局部變量、靜態(tài)局部變量、全局變量與靜態(tài)全局變量

局部變量是存在于堆棧中的，對(duì)其空間的分配僅僅是修改一次esp寄存器的內(nèi)容即可；
靜態(tài)局部變量是定義在函數(shù)內(nèi)部的，靜態(tài)局部變量定義時(shí)前面要加static關(guān)鍵字來(lái)標(biāo)識(shí)，靜態(tài)局部變量所在的函數(shù)在多調(diào)用多次時(shí)，只有第一次才經(jīng)歷變量定義和初始化；
當(dāng)一個(gè)文件或者數(shù)據(jù)反復(fù)使用時(shí)，應(yīng)該存儲(chǔ)在全局變量中，避免重復(fù)加載使用；
靜態(tài)全局變量是靜態(tài)存儲(chǔ)方式，靜態(tài)全局變量則限制了其作用域，即只在定義該變量的源文件內(nèi)有效，在同一源程序的其它源文件中不能使用它。

靜態(tài)變量是低效的，當(dāng)一塊數(shù)據(jù)被反復(fù)讀寫，其數(shù)據(jù)會(huì)留在CPU的一級(jí)緩存（Cache）中

代碼冗余度

避免大的循環(huán)，循環(huán)中避免判斷語(yǔ)句

在寫程序過(guò)程中，最影響代碼運(yùn)行速度的往往都是循環(huán)語(yǔ)句，我記得當(dāng)時(shí)在寫matlab的時(shí)候，處理大數(shù)據(jù)，都是禁止用循環(huán)的，特別是多層嵌套的循環(huán)語(yǔ)句。

其次，盡量將循環(huán)嵌套控制在 3 層以內(nèi)，有研究數(shù)據(jù)表明，當(dāng)循環(huán)嵌套超過(guò) 3 層，程序員對(duì)循環(huán)的理解能力會(huì)極大地降低。同時(shí)，這樣程序的執(zhí)行效率也會(huì)很低。因此，如果代碼循環(huán)嵌套超過(guò) 3 層，建議重新設(shè)計(jì)循環(huán)或?qū)⒀h(huán)內(nèi)的代碼改寫成一個(gè)子函數(shù)。

for (i=0;i<100;i++)
{
    for (j=0;j<5;j++)
    {
       for (j=0;j<5;j++)
        {
            /*處理代碼*/
        }
    }
}

多重 for 循環(huán)中，如果有可能，應(yīng)當(dāng)盡量將最長(zhǎng)的循環(huán)放在最內(nèi)層，最短的循環(huán)放在最外層，以減少 CPU 跨切循環(huán)層的次數(shù)

for (i=0;i<100;i++)
{
    for (j=0;j<5;j++)
    {
            /*處理代碼*/
    }
}

改為：

for (j=0;j<5;j++)
{
    for (i=0;i<100;i++)
    {
            /*處理代碼*/
    }
}

邏輯判斷不要在循環(huán)中使用，當(dāng) for 循環(huán)的次數(shù)很大時(shí)，執(zhí)行多余的判斷不僅會(huì)消耗系統(tǒng)的資源，而且會(huì)打斷循環(huán)“流水線”作業(yè)，使得編譯器不能對(duì)循環(huán)進(jìn)行優(yōu)化處理，降低程序的執(zhí)行效率

if (condition)
{
    for (i = 0;i < n;i++)
    {
        /*處理代碼*/
    }
}
else
{
    for (i = 0;i < n;i++)
    {
        /*處理代碼*/
    }
}

盡量避免遞歸，遞歸就是不停的調(diào)用自身，所以非常消耗資源，甚至造成堆棧溢出和程序崩潰等等問(wèn)題！

int Func(int n)
{
if(n < 2)
return 1;
else
return n*Func(n-1);
}

因此，掌握循環(huán)優(yōu)化的各種實(shí)用技術(shù)是提高程序效率的利器，也是一個(gè)高水平程序必須具備的基本功。

盡量不使用繼承和多重繼承

多重繼承增加了類的繼承層次的復(fù)雜性，調(diào)試難度增加當(dāng)然風(fēng)險(xiǎn)也增加了，而且使用父類指針指向子類對(duì)象變成了一件復(fù)雜的事情，得用到C++中提供的dynamic_cast來(lái)執(zhí)行強(qiáng)制轉(zhuǎn)換。但是dynamic_cast是在運(yùn)行期間而非編譯期間進(jìn)行轉(zhuǎn)換的，因此會(huì)會(huì)帶來(lái)一些輕微的性能損失，建議類型轉(zhuǎn)換盡量采用c++內(nèi)置的類型轉(zhuǎn)換函數(shù)，而不要強(qiáng)行轉(zhuǎn)換

少用模板，因?yàn)槟０迨蔷幾g期技術(shù)，大量采用模板也會(huì)增加編譯時(shí)間

在c++primer3中，有一句話：

在多個(gè)文件之間編譯相同的函數(shù)模板定義增加了不必要的編譯時(shí)間簡(jiǎn)單點(diǎn)說(shuō)，對(duì)于一個(gè)zhidaovector 的函數(shù)，比如size()，如果在不同的cpp中出現(xiàn)，在這些文件編譯的時(shí)候都要把vector ::size()編譯一遍。然后在鏈接的時(shí)候把重復(fù)的函數(shù)去掉,很顯然增加了編譯時(shí)間。模版函數(shù)需要在編譯的時(shí)候?qū)嵗痾hidao,所以呢,不把模版的實(shí)現(xiàn)代碼放到頭文件中的話(在頭文件中實(shí)例化),那么每個(gè)使用到這個(gè)模版的cpp的都要把這個(gè)模版重新實(shí)例化一遍,所以增加了編內(nèi)譯時(shí)間

編碼依賴性

聲明與實(shí)現(xiàn)分離，刪除不必要的#include

使用include時(shí)，只需要include這個(gè)接口頭文件就好
并不是所有的文件都需要包含頭文件 iostream，定義了輸出函數(shù)引用就好
ostream頭文件也不要，替換為 iosfwd, 為什么，參數(shù)和返回類型只要前向聲明(forward declared )就可以編譯通過(guò)

盡量減少參數(shù)傳遞，多用引用來(lái)傳遞參數(shù)。

bool func1(string s1,  string s2)
bool func2(string *s1, string *s2)
bool func3(string &s1, string &s2)

指針和引用都不會(huì)創(chuàng)建新的對(duì)象，函數(shù)func2和func3不需要調(diào)用析構(gòu)和構(gòu)造函數(shù)，函數(shù)func1使用值傳遞在參數(shù)傳遞和函數(shù)返回時(shí)，需要調(diào)用string的構(gòu)造函數(shù)和析構(gòu)函數(shù)兩次。

適當(dāng)?shù)牟捎肞IMPL模式

很實(shí)用的一種基礎(chǔ)模式，通過(guò)一個(gè)私有的成員指針，將指針?biāo)赶虻念惖膬?nèi)部實(shí)現(xiàn)數(shù)據(jù)進(jìn)行隱藏。將實(shí)現(xiàn)放到CPP里，主要作用在于編譯分離，其實(shí)是增加了編碼量以及初次編譯時(shí)長(zhǎng)，增量編譯才體現(xiàn)作用。例如：指針的大小為（64位）或32（8位），X發(fā)生變化，指針大小卻不會(huì)改變，文件c.h也不需要重編譯。

未完待續(xù)

方法還有很多，比如使用多線程，多任務(wù)并行編譯，分布式編譯，預(yù)編譯等等，另外，在編譯大型項(xiàng)目時(shí)，分布式編譯更優(yōu)，往往能夠大幅度提升性能。

   
    
     
      
       
        
         推薦閱讀
        
       
       
        （點(diǎn)擊標(biāo)題可跳轉(zhuǎn)閱讀）
       
       
        
         
          
           【編程之美】用C語(yǔ)言實(shí)現(xiàn)狀態(tài)機(jī)(實(shí)用)
           【編程之美】超時(shí)重傳，滑動(dòng)窗口，可靠性傳輸原理

           【編程之美】論嵌入式架構(gòu)的重要性

免責(zé)聲明：本文內(nèi)容由21ic獲得授權(quán)后發(fā)布，版權(quán)歸原作者所有，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。文章僅代表作者個(gè)人觀點(diǎn)，不代表本平臺(tái)立場(chǎng)，如有問(wèn)題，請(qǐng)聯(lián)系我們，謝謝！

如何分析和提高(C/C++)程序的編譯速度？

硬件、編譯器造成的

代碼編寫風(fēng)格

多使用自加、自減指令和復(fù)合賦值表達(dá)式

除法換成乘法或者移位來(lái)表達(dá)

多用直接初始化，少用拷貝初始化

局部變量、靜態(tài)局部變量、全局變量與靜態(tài)全局變量

代碼冗余度

避免大的循環(huán)，循環(huán)中避免判斷語(yǔ)句

盡量不使用繼承和多重繼承

少用模板，因?yàn)槟０迨蔷幾g期技術(shù)，大量采用模板也會(huì)增加編譯時(shí)間

編碼依賴性

聲明與實(shí)現(xiàn)分離，刪除不必要的#include

盡量減少參數(shù)傳遞，多用引用來(lái)傳遞參數(shù)。

適當(dāng)?shù)牟捎肞IMPL模式

未完待續(xù)

【編程之美】用C語(yǔ)言實(shí)現(xiàn)狀態(tài)機(jī)(實(shí)用)

阿維塔、賽力斯已入股！華為引望可能成“中國(guó)博世”

Trianz與AWS達(dá)成戰(zhàn)略合作協(xié)議，徹底改變?cè)撇捎煤凸芾矸绞?/a>

人工智能驅(qū)動(dòng)工具SODA V將顛覆汽車市場(chǎng)，使汽車開(kāi)發(fā)時(shí)間和成本降低90%

從容應(yīng)對(duì)未知風(fēng)險(xiǎn)----解密亞馬遜云科技的韌性之道

中國(guó)游戲市場(chǎng)開(kāi)始復(fù)蘇！騰訊、網(wǎng)易等巨頭縮減在日本投資

獨(dú)立自主！華為董事：致力打造不依賴西方的技術(shù)

華為張平安：數(shù)字世界話語(yǔ)權(quán)最終由生態(tài)繁榮決定！

中國(guó)通信服務(wù)公布2024年中期業(yè)績(jī)

NVI技術(shù)創(chuàng)新聯(lián)盟成立！自主生態(tài)將帶動(dòng)產(chǎn)業(yè)鏈高速發(fā)展

軟通動(dòng)力與長(zhǎng)三角投資達(dá)成戰(zhàn)略合作共謀數(shù)字生態(tài)新發(fā)展

海南區(qū)6家凱悅系酒店與嵐圖達(dá)成戰(zhàn)略合作，共同推動(dòng)新能源出行體驗(yàn)

安嵐攜手妮可?巴菲特開(kāi)啟療愈之旅在秋日紅葉的浪漫中療愈身心

不懼美國(guó)封鎖！華為：我們給大家提供系統(tǒng)、存儲(chǔ)等

尼爾森IQ深耕中國(guó)四十載，共繪未來(lái)新篇章

第二十二屆跨盈年度B2B營(yíng)銷高管峰會(huì)2025聚焦"營(yíng)銷競(jìng)?cè)。蚱剖袌?chǎng)內(nèi)卷實(shí)現(xiàn)認(rèn)知進(jìn)化"

恒久動(dòng)力馳騁天地美孚1號(hào)攜手周冠宇邀您縱擎馳騁，勁享駕趣體驗(yàn)

美通社母公司Cision發(fā)布CisionOne平臺(tái)，進(jìn)軍亞太地區(qū)媒體監(jiān)測(cè)市場(chǎng)

移遠(yuǎn)通信推出大模型解決方案，重塑千行百業(yè)智能邊界

高途公布2024年第二季度未經(jīng)審計(jì)業(yè)績(jī)

華為發(fā)布AI百校計(jì)劃：培養(yǎng)AI人才每年獲最高100萬(wàn)支持

如何分析和提高(C/C++)程序的編譯速度？

硬件、編譯器造成的

代碼編寫風(fēng)格

多使用自加、自減指令和復(fù)合賦值表達(dá)式

除法換成乘法或者移位來(lái)表達(dá)

多用直接初始化，少用拷貝初始化

局部變量、靜態(tài)局部變量、全局變量與靜態(tài)全局變量

代碼冗余度

避免大的循環(huán)，循環(huán)中避免判斷語(yǔ)句

盡量不使用繼承和多重繼承

少用模板，因?yàn)槟０迨蔷幾g期技術(shù)，大量采用模板也會(huì)增加編譯時(shí)間

編碼依賴性

聲明與實(shí)現(xiàn)分離，刪除不必要的#include

盡量減少參數(shù)傳遞，多用引用來(lái)傳遞參數(shù)。

適當(dāng)?shù)牟捎肞IMPL模式

未完待續(xù)

如何分析和提高(C/C++)程序的編譯速度？

多使用自加、自減指令和復(fù)合賦值表達(dá)式

多用直接初始化，少用拷貝初始化

局部變量、靜態(tài)局部變量、全局變量與靜態(tài)全局變量

避免大的循環(huán)，循環(huán)中避免判斷語(yǔ)句

少用模板，因?yàn)槟０迨蔷幾g期技術(shù)，大量采用模板也會(huì)增加編譯時(shí)間

聲明與實(shí)現(xiàn)分離，刪除不必要的#include

盡量減少參數(shù)傳遞，多用引用來(lái)傳遞參數(shù)。