C++項目中字節(jié)對齊與CPU效率和內(nèi)存占用
由于C++的項目做的少,又比較小,所以一直沒有注意字節(jié)對齊的問題,但是,字節(jié)對齊在大規(guī)模應(yīng)用中對內(nèi)存管理和CPU執(zhí)行效率的影響應(yīng)是挺大的。本文根據(jù)一些資料學習,做一個小總結(jié)。
首先拋出第一個結(jié)論,字節(jié)對齊可以提高CPU的執(zhí)行效率。
根據(jù)(1)中分析,CPU執(zhí)行指令時從內(nèi)存中獲取數(shù)據(jù)是按塊操作的,塊的大小可能為2-bytes, 4-bytes, 8-bytes, 16-bytes……
上圖所示4-bytes塊,此時,如果CPU讀取4-bytes或以上大小的數(shù)據(jù)的起始地址為1,則需要至少讀取2個數(shù)據(jù)塊,然后把2個塊中不需要的數(shù)據(jù)拋棄,再將有用數(shù)據(jù)拼接成4-bytes的數(shù)據(jù),這明顯增加了CPU的操作,影響了CPU指令的執(zhí)行效率。如果CPU讀取數(shù)據(jù)的起始地址在0,4……,則一次只需要讀一個數(shù)據(jù)塊,CPU的讀取指令就是一次原子操作。
字節(jié)對齊就是對CPU讀取的每一個數(shù)據(jù),都保證其起始地址在數(shù)據(jù)塊的始端,對數(shù)據(jù)字節(jié)數(shù)小于CPU數(shù)據(jù)塊(粒度)的值進行擴充,使得其占用完整的一個粒度的內(nèi)存空間。字節(jié)對齊,節(jié)省了CPU進行數(shù)據(jù)截取和拼接的操作。
另一個結(jié)論,字節(jié)對齊有利于優(yōu)化內(nèi)存。
在結(jié)構(gòu)體中,根據(jù)字節(jié)自動對齊原則,結(jié)構(gòu)體
typedef?struct?_test?{ char?a; int?b; char?c; }?test;
編譯器將采用結(jié)構(gòu)體中字節(jié)數(shù)最大的基本類型int的字節(jié)數(shù)作為對齊標準,char類型將擴充為4-bytes,因此,sizeof(test)=12,但是這樣的內(nèi)存利用效率比較低。
如果通過指定編譯器1字節(jié)對齊,則CPU的執(zhí)行效率就會降低。
#praama?pack(1) typedef?struct?_test?{ char?a; int?b; char?c; }?test; #pragma?pack()
為了保證CPU執(zhí)行效率的條件下優(yōu)化程序的內(nèi)存,需要調(diào)整結(jié)構(gòu)體中數(shù)據(jù)成員的順序
typedef?struct?_test?{ int?b; char?a; char?c; }?test;
此時,結(jié)構(gòu)體成員b占用4個字節(jié),a和c分享后面的4個字節(jié),其中兩個成員占用前兩個字節(jié),后兩個字節(jié)為字節(jié)對齊時填充的無效數(shù)據(jù),此結(jié)構(gòu)體占用8個字節(jié)的內(nèi)存空間。