來源:李逍遙-技術(shù)讓夢想更偉大
位域是什么?
有些數(shù)據(jù)在存儲時并不需要占用一個完整的字節(jié),只需要占用一個或幾個二進(jìn)制位即可。例如開關(guān)只有通電和斷電兩種狀態(tài),用 0 和 1 表示足以,也就是用一個二進(jìn)位。正是基于這種考慮,C語言又提供了一種叫做位域的數(shù)據(jù)結(jié)構(gòu)。 在結(jié)構(gòu)體定義時,我們可以指定某個成員變量所占用的二進(jìn)制位數(shù)(Bit),這就是位域。請看下面的例子:
1 struct bs { 2 unsigned m; 3 unsigned n: 4 ; 4 unsigned char ch: 6 ; 5 };
: 后面的數(shù)字用來限定成員變量占用的位數(shù)。成員 m 沒有限制,根據(jù)數(shù)據(jù)類型即可推算出它占用 4 個字節(jié)(Byte)的內(nèi)存。成員 n、ch 被:后面的數(shù)字限制,不能再根據(jù)數(shù)據(jù)類型計算長度,它們分別占用 4、6 位(Bit)的內(nèi)存。 n、ch 的取值范圍非常有限,數(shù)據(jù)稍微大些就會發(fā)生溢出,請看下面的例子:
1 #include 2 int main() { 3 struct bs { 4 unsigned m; 5 unsigned n: 4 ; 6 unsigned char ch: 6 ; 7 } a = { 0xad , 0xE , '$' }; 8 //第一次輸出 9 printf ("%#x, %#x, %c\n" , a.m, a.n, a.ch); 10 //更改值后再次輸出 11 a.m = 0xb8901c ; 12 a.n = 0x2d ; 13 a.ch = 'z' ; 14 printf ("%#x, %#x, %c\n" , a.m, a.n, a.ch); 15 system("pause" ); 16 return 0 ; 17 }
運(yùn)行結(jié)果: 對于 n 和 ch,第一次輸出的數(shù)據(jù)是完整的,第二次輸出的數(shù)據(jù)是殘缺的。 第一次輸出時,n、ch 的值分別是 0xE、0x24('$' 對應(yīng)的 ASCII 碼為 0x24),換算成二進(jìn)制是 1110 、 10 0100 ,都沒有超出限定的位數(shù),能夠正常輸出。 第二次輸出時,n、ch 的值變?yōu)?0x2d、0x7a('z' 對應(yīng)的 ASCII 碼為 0x7a),換算成二進(jìn)制分別是 10 1101 、 111 1010 ,都超出了限定的位數(shù)。超出部分被直接截去,剩下 1101 、 11 1010 ,換算成十六進(jìn)制為 0xd、0x3a(0x3a 對應(yīng)的字符是 :)。 C語言標(biāo)準(zhǔn)規(guī)定,位域的寬度不能超過它所依附的數(shù)據(jù)類型的長度。通俗地講,成員變量都是有類型的,這個類型限制了成員變量的最大長度,:后面的數(shù)字不能超過這個長度。
例如上面的 bs,n 的類型是 unsigned int,長度為 4 個字節(jié),共計 32 位,那么 n 后面的數(shù)字就不能超過 32;ch 的類型是 unsigned char,長度為 1 個字節(jié),共計 8 位,那么 ch 后面的數(shù)字就不能超過 8。 我們可以這樣認(rèn)為,位域技術(shù)就是在成員變量所占用的內(nèi)存中選出一部分位寬來存儲數(shù)據(jù)。 C語言標(biāo)準(zhǔn)還規(guī)定,只有有限的幾種數(shù)據(jù)類型可以用于位域。在 ANSI C 中,這幾種數(shù)據(jù)類型是 int、signed int 和 unsigned int(int 默認(rèn)就是 signed int);到了 C99,_Bool 也被支持了。
但編譯器在具體實現(xiàn)時都進(jìn)行了擴(kuò)展,額外支持了 char、signed char、unsigned char 以及 enum 類型,所以上面的代碼雖然不符合C語言標(biāo)準(zhǔn),但它依然能夠被編譯器支持。
位域的存儲
C語言標(biāo)準(zhǔn)并沒有規(guī)定位域的具體存儲方式,不同的編譯器有不同的實現(xiàn),但它們都盡量壓縮存儲空間。 位域的具體存儲規(guī)則如下:
當(dāng)相鄰成員的類型相同時,如果它們的位寬之和小于類型的 sizeof 大小,那么后面的成員緊鄰前一個成員存儲,直到不能容納為止;如果它們的位寬之和大于類型的 sizeof 大小,那么后面的成員將從新的存儲單元開始,其偏移量為類型大小的整數(shù)倍。
以下面的位域 bs 為例:
1 #include 2 int main() { 3 struct bs { 4 unsigned m: 6 ; 5 unsigned n: 12 ; 6 unsigned p: 4 ; 7 }; 8 printf ("%d\n" , sizeof (struct bs)); 9 return 0 ; 10 }
運(yùn)行結(jié)果: m、n、p 的類型都是 unsigned int,sizeof 的結(jié)果為 4 個字節(jié)(Byte),也即 32 個位(Bit)。m、n、p 的位寬之和為 6+12+4 = 22 ,小于 32,所以它們會挨著存儲,中間沒有縫隙。 sizeof(struct bs) 的大小之所以為 4,而不是 3,是因為要將內(nèi)存對齊到 4 個字節(jié),以便提高存取效率。 如果將成員 m 的位寬改為 22,那么輸出結(jié)果將會是 8,因為 22+12 = 34 ,大于 32,n 會從新的位置開始存儲,相對 m 的偏移量是 sizeof(unsigned int) ,也即 4 個字節(jié)。 如果再將成員 p 的位寬也改為 22,那么輸出結(jié)果將會是 12,三個成員都不會挨著存儲。
當(dāng)相鄰成員的類型不同時,不同的編譯器有不同的實現(xiàn)方案,GCC 會壓縮存儲,而 VC/VS 不會。
請看下面的位域 bs:
1 #include 2 int main() { 3 struct bs { 4 unsigned m: 12 ; 5 unsigned char ch: 4 ; 6 unsigned p: 4 ; 7 }; 8 printf ("%d\n" , sizeof (struct bs)); 9 return 0 ; 10 }
在 GCC 下的運(yùn)行結(jié)果為 4,三個成員挨著存儲;在 VC/VS 下的運(yùn)行結(jié)果為 12,三個成員按照各自的類型存儲(與不指定位寬時的存儲方式相同)。 m 、ch、p 的長度分別是 4、1、4 個字節(jié),共計占用 9 個字節(jié)內(nèi)存,為什么在 VC/VS 下的輸出結(jié)果卻是 12 呢?期待您的回復(fù)。
如果成員之間穿插著非位域成員,那么不會進(jìn)行壓縮。例如對于下面的 bs:
1 struct bs { 2 unsigned m: 12 ; 3 unsigned ch; 4 unsigned p: 4 ; 5 };
在各個編譯器下 sizeof 的結(jié)果都是 12。 通過上面的分析,我們發(fā)現(xiàn)位域成員往往不占用完整的字節(jié),有時候也不處于字節(jié)的開頭位置,因此使用&獲取位域成員的地址是沒有意義的,C語言也禁止這樣做。地址是字節(jié)(Byte)的編號,而不是位(Bit)的編號。
無名位域
位域成員可以沒有名稱,只給出數(shù)據(jù)類型和位寬,如下所示:
1 struct bs { 2 int m: 12 ; 3 int : 20 ; //該位域成員不能使用 4 int n: 4 ; 5 };
無名位域一般用來作填充或者調(diào)整成員位置。因為沒有名稱,無名位域不能使用。 上面的例子中,如果沒有位寬為 20 的無名成員,m、n 將會挨著存儲, sizeof(struct bs) 的結(jié)果為 4;有了這 20 位作為填充,m、n 將分開存儲, sizeof(struct bs) 的結(jié)果為 8。
免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺僅提供信息存儲服務(wù)。文章僅代表作者個人觀點(diǎn),不代表本平臺立場,如有問題,請聯(lián)系我們,謝謝!