什么是大端模式和小端模式?
一、大端模式和小端模式的起源 ? ? ? ??
關(guān)于大端小端名詞的由來,有一個(gè)有趣的故事,來自于Jonathan Swift的《格利佛游記》:Lilliput和Blefuscu這兩個(gè)強(qiáng)國在過去的36個(gè)月中一直在苦戰(zhàn)。戰(zhàn)爭(zhēng)的原因:大家都知道,吃雞蛋的時(shí)候,原始的方法是打破雞蛋較大的一端,可以那時(shí)的皇帝的祖父由于小時(shí)侯吃雞蛋,按這種方法把手指弄破了,因此他的父親,就下令,命令所有的子民吃雞蛋的時(shí)候,必須先打破雞蛋較小的一端,違令者重罰。然后老百姓對(duì)此法令極為反感,期間發(fā)生了多次叛亂,其中一個(gè)皇帝因此送命,另一個(gè)丟了王位,產(chǎn)生叛亂的原因就是另一個(gè)國家Blefuscu的國王大臣煽動(dòng)起來的,叛亂平息后,就逃到這個(gè)帝國避難。據(jù)估計(jì),先后幾次有11000余人情愿死也不肯去打破雞蛋較小的端吃雞蛋。這個(gè)其實(shí)諷刺當(dāng)時(shí)英國和法國之間持續(xù)的沖突。Danny
Cohen一位網(wǎng)絡(luò)協(xié)議的開創(chuàng)者,第一次使用這兩個(gè)術(shù)語指代字節(jié)順序,后來就被大家廣泛接受。
?
二、什么是大端和小端
? ? ? ??
Big-Endian和Little-Endian的定義如下:
1) Little-Endian就是低位字節(jié)排放在內(nèi)存的低地址端,高位字節(jié)排放在內(nèi)存的高地址端。
2) Big-Endian就是高位字節(jié)排放在內(nèi)存的低地址端,低位字節(jié)排放在內(nèi)存的高地址端。
舉一個(gè)例子,比如數(shù)字0x12 34 56 78在內(nèi)存中的表示形式為:
1)大端模式:
低地址 -----------------> 高地址
0x12 ?| ?0x34 ?| ?0x56 ?| ?0x78
2)小端模式:
低地址 ------------------> 高地址
0x78 ?| ?0x56 ?| ?0x34 ?| ?0x12
可見,大端模式和字符串的存儲(chǔ)模式類似。
3)下面是兩個(gè)具體例子:
16bit寬的數(shù)0x1234在Little-endian模式(以及Big-endian模式)CPU內(nèi)存中的存放方式(假設(shè)從地址0x4000開始存放)為:
內(nèi)存地址 小端模式存放內(nèi)容 大端模式存放內(nèi)容 0x4000 0x34 0x12 0x4001 0x12 0x34
32bit寬的數(shù)0x12345678在Little-endian模式以及Big-endian模式)CPU內(nèi)存中的存放方式(假設(shè)從地址0x4000開始存放)為:
內(nèi)存地址
小端模式存放內(nèi)容
大端模式存放內(nèi)容
0x4000
0x78
0x12
0x4001
0x56
0x34
0x4002
0x34
0x56
0x4003
0x12
0x78
?4)大端小端沒有誰優(yōu)誰劣,各自優(yōu)勢(shì)便是對(duì)方劣勢(shì):
小端模式 :強(qiáng)制轉(zhuǎn)換數(shù)據(jù)不需要調(diào)整字節(jié)內(nèi)容,1、2、4字節(jié)的存儲(chǔ)方式一樣。
大端模式 :符號(hào)位的判定固定為第一個(gè)字節(jié),容易判斷正負(fù)。
三、數(shù)組在大端小端情況下的存儲(chǔ):
以u(píng)nsigned int value = 0x12345678為例,分別看看在兩種字節(jié)序下其存儲(chǔ)情況,我們可以用unsigned char buf[4]來表示value:
Big-Endian: 低地址存放高位,如下:
高地址
? ? ? ? ---------------
? ? ? ? buf[3] (0x78) -- 低位
? ? ? ? buf[2] (0x56)
? ? ? ? buf[1] (0x34)
? ? ? ? buf[0] (0x12) -- 高位
? ? ? ? ---------------
? ? ? ? 低地址
Little-Endian: 低地址存放低位,如下:
高地址
? ? ? ? ---------------
? ? ? ? buf[3] (0x12) -- 高位
? ? ? ? buf[2] (0x34)
? ? ? ? buf[1] (0x56)
? ? ? ? buf[0] (0x78) -- 低位
? ? ? ? --------------
低地址
四、為什么會(huì)有大小端模式之分呢?
? ? ? 這是因?yàn)樵谟?jì)算機(jī)系統(tǒng)中,我們是以字節(jié)為單位的,每個(gè)地址單元都對(duì)應(yīng)著一個(gè)字節(jié),一個(gè)字節(jié)為8bit。但是在C語言中除了8bit的char之外,還有16bit的short型,32bit的long型(要看具體的編譯器),另外,對(duì)于位數(shù)大于8位的處理器,例如16位或者32位的處理器,由于寄存器寬度大于一個(gè)字節(jié),那么必然存在著一個(gè)如果將多個(gè)字節(jié)安排的問題。因此就導(dǎo)致了大端存儲(chǔ)模式和小端存儲(chǔ)模式。例如一個(gè)16bit的short型x,在內(nèi)存中的地址為0x0010,x的值為0x1122,那么0x11為高字節(jié),0x22為低字節(jié)。對(duì)于大端模式,就將0x11放在低地址中,即0x0010中,0x22放在高地址中,即0x0011中。小端模式,剛好相反。我們常用的X86結(jié)構(gòu)是小端模式,而KEIL
C51則為大端模式。很多的ARM,DSP都為小端模式。有些ARM處理器還可以由硬件來選擇是大端模式還是小端模式。
?
五、如何判斷機(jī)器的字節(jié)序
可以編寫一個(gè)小的測(cè)試程序來判斷機(jī)器的字節(jié)序:
[cpp]?view
plaincopy
BOOL?IsBigEndian()??
{??
????int?a?=?0x1234;??
????char?b?=??*(char?*)&a;??//通過將int強(qiáng)制類型轉(zhuǎn)換成char單字節(jié),通過判斷起始存儲(chǔ)位置。即等于?取b等于a的低地址部分??
????if(?b?==?0x12)??
????{??
????????return?TRUE;??
????}??
????return?FALSE;??
}???
聯(lián)合體union的存放順序是所有成員都從低地址開始存放,利用該特性可以輕松地獲得了CPU對(duì)內(nèi)存采用Little-endian還是Big-endian模式讀寫:
[cpp]?view
plaincopy
BOOL?IsBigEndian()??
{??
????union?NUM??
????{??
????????int?a;??
????????char?b;??
????}num;??
????num.a?=?0x1234;??
????if(?num.b?==?0x12?)??
????{??
????????return?TRUE;??
????}??
????return?FALSE;??
}???
六、常見的字節(jié)序
一般操作系統(tǒng)都是小端,而通訊協(xié)議是大端的。
4.1 常見CPU的字節(jié)序
Big Endian : PowerPC、IBM、Sun
Little Endian : x86、DEC
ARM既可以工作在大端模式,也可以工作在小端模式。
?
4.2 常見文件的字節(jié)序
Adobe PS – Big Endian
BMP – Little Endian
DXF(AutoCAD) – Variable
GIF – Little Endian
JPEG – Big Endian
MacPaint – Big Endian
RTF – Little Endian
?
另外,Java和所有的網(wǎng)絡(luò)通訊協(xié)議都是使用Big-Endian的編碼。
?
七、如何進(jìn)行轉(zhuǎn)換
對(duì)于字?jǐn)?shù)據(jù)(16位):
[cpp]?view
plaincopy
#define?BigtoLittle16(A)???((?((uint16)(A)?&?0xff00)?>>?8)????|???
???????????????????????????????????????((?(uint16)(A)?&?0x00ff)?<<?8))??
對(duì)于雙字?jǐn)?shù)據(jù)(32位):
[cpp]?view plaincopy #define?BigtoLittle32(A)???(((?(uint32)(A)?&?0xff000000)?>>?24)?|??? ???????????????????????????????????????((?(uint32)(A)?&?0x00ff0000)?>>?8)???|??? ???????????????????????????????????????((?(uint32)(A)?&?0x0000ff00)?<<?8)???|??? ???????????????????????????????????????((?(uint32)(A)?&?0x000000ff)?<<?24))??
八、從軟件的角度理解端模式
? ? ? ? 從軟件的角度上,不同端模式的處理器進(jìn)行數(shù)據(jù)傳遞時(shí)必須要考慮端模式的不同。如進(jìn)行網(wǎng)絡(luò)數(shù)據(jù)傳遞時(shí),必須要考慮端模式的轉(zhuǎn)換。在Socket接口編程中,以下幾個(gè)函數(shù)用于大小端字節(jié)序的轉(zhuǎn)換。
[cpp]?view
plaincopy
#define?ntohs(n)?????//16位數(shù)據(jù)類型網(wǎng)絡(luò)字節(jié)順序到主機(jī)字節(jié)順序的轉(zhuǎn)換??
#define?htons(n)?????//16位數(shù)據(jù)類型主機(jī)字節(jié)順序到網(wǎng)絡(luò)字節(jié)順序的轉(zhuǎn)換??
#define?ntohl(n)??????//32位數(shù)據(jù)類型網(wǎng)絡(luò)字節(jié)順序到主機(jī)字節(jié)順序的轉(zhuǎn)換??
#define?htonl(n)??????//32位數(shù)據(jù)類型主機(jī)字節(jié)順序到網(wǎng)絡(luò)字節(jié)順序的轉(zhuǎn)換??
其中互聯(lián)網(wǎng)使用的網(wǎng)絡(luò)字節(jié)順序采用大端模式進(jìn)行編址,而主機(jī)字節(jié)順序根據(jù)處理器的不同而不同,如PowerPC處理器使用大端模式,而Pentuim處理器使用小端模式。
? ? ? ?大端模式處理器的字節(jié)序到網(wǎng)絡(luò)字節(jié)序不需要轉(zhuǎn)換,此時(shí)ntohs(n)=n,ntohl = n;而小端模式處理器的字節(jié)序到網(wǎng)絡(luò)字節(jié)必須要進(jìn)行轉(zhuǎn)換,此時(shí)ntohs(n) = __swab16(n),ntohl = __swab32(n)。__swab16與__swab32函數(shù)定義如下所示。
[cpp]?view
plaincopy
#define?___swab16(x)??
{??
????????????__u16?__x?=?(x);??
????????????((__u16)(??
????????????????????????(((__u16)(__x)?&?(__u16)0x00ffU)?<<?8)?|??
????????????????????????(((__u16)(__x)?&?(__u16)0xff00U)?>>?8)?));??
}??
??
??
#define?___swab32(x)??
{??
????????????__u32?__x?=?(x);??
????????????((__u32)(??
????????????????????????(((__u32)(__x)?&?(__u32)0x000000ffUL)?<<?24)?|??
????????????????????????(((__u32)(__x)?&?(__u32)0x0000ff00UL)?<<?8)?|??
????????????????????????(((__u32)(__x)?&?(__u32)0x00ff0000UL)?>>?8)?|??
????????????????????????(((__u32)(__x)?&?(__u32)0xff000000UL)?>>?24)?));??
}??
? ? ? ? PowerPC處理器提供了lwbrx,lhbrx,stwbrx,sthbrx四條指令用于處理字節(jié)序的轉(zhuǎn)換以優(yōu)化__swab16和__swap32這類函數(shù)。此外PowerPC處理器中的rlwimi指令也可以用來實(shí)現(xiàn)__swab16和__swap32這類函數(shù)。
? ? ? ?在對(duì)普通文件進(jìn)行處理也需要考慮端模式問題。在大端模式的處理器下對(duì)文件的32,16位讀寫操作所得到的結(jié)果與小端模式的處理器不同。單純從軟件的角度理解上遠(yuǎn)遠(yuǎn)不能真正理解大小端模式的區(qū)別。事實(shí)上,真正的理解大小端模式的區(qū)別,必須要從系統(tǒng)的角度,從指令集,寄存器和數(shù)據(jù)總線上深入理解,大小端模式的區(qū)別。
九、從系統(tǒng)的角度理解端模式
先補(bǔ)充兩個(gè)關(guān)鍵詞,MSB和LSB:
MSB:MoST Significant Bit ------- 最高有效位
? ? ? ? LSB:Least Significant Bit ------- 最低有效位
? ? ? ? 處理器在硬件上由于端模式問題在設(shè)計(jì)中有所不同。從系統(tǒng)的角度上看,端模式問題對(duì)軟件和硬件的設(shè)計(jì)帶來了不同的影響,當(dāng)一個(gè)處理器系統(tǒng)中大小端模式同時(shí)存在時(shí),必須要對(duì)這些不同端模式的訪問進(jìn)行特殊的處理。
? ? ? ?PowerPC處理器主導(dǎo)網(wǎng)絡(luò)市場(chǎng),可以說絕大多數(shù)的通信設(shè)備都使用PowerPC處理器進(jìn)行協(xié)議處理和其他控制信息的處理,這也可能也是在網(wǎng)絡(luò)上的絕大多數(shù)協(xié)議都采用大端編址方式的原因。因此在有關(guān)網(wǎng)絡(luò)協(xié)議的軟件設(shè)計(jì)中,使用小端方式的處理器需要在軟件中處理端模式的轉(zhuǎn)變。而Pentium主導(dǎo)個(gè)人機(jī)市場(chǎng),因此多數(shù)用于個(gè)人機(jī)的外設(shè)都采用小端模式,包括一些在網(wǎng)絡(luò)設(shè)備中使用的PCI總線,F(xiàn)lash等設(shè)備,這也要求在硬件設(shè)計(jì)中注意端模式的轉(zhuǎn)換。
? ? ? ?本文提到的小端外設(shè)是指這種外設(shè)中的寄存器以小端方式進(jìn)行存儲(chǔ),如PCI設(shè)備的配置空間,NOR FLASH中的寄存器等等。對(duì)于有些設(shè)備,如DDR顆粒,沒有以小端方式存儲(chǔ)的寄存器,因此從邏輯上講并不需要對(duì)端模式進(jìn)行轉(zhuǎn)換。在設(shè)計(jì)中,只需要將雙方數(shù)據(jù)總線進(jìn)行一一對(duì)應(yīng)的互連,而不需要進(jìn)行數(shù)據(jù)總線的轉(zhuǎn)換。
? ? ? ?如果從實(shí)際應(yīng)用的角度說,采用小端模式的處理器需要在軟件中處理端模式的轉(zhuǎn)換,因?yàn)椴捎眯《四J降奶幚砥髟谂c小端外設(shè)互連時(shí),不需要任何轉(zhuǎn)換。而采用大端模式的處理器需要在硬件設(shè)計(jì)時(shí)處理端模式的轉(zhuǎn)換。大端模式處理器需要在寄存器,指令集,數(shù)據(jù)總線及數(shù)據(jù)總線與小端外設(shè)的連接等等多個(gè)方面進(jìn)行處理,以解決與小端外設(shè)連接時(shí)的端模式轉(zhuǎn)換問題。在寄存器和數(shù)據(jù)總線的位序定義上,基于大小端模式的處理器有所不同。
? ? ? ?一個(gè)采用大端模式的32位處理器,如基于E500內(nèi)核的MPC8541,將其寄存器的最高位msb(most significant bit)定義為0,最低位lsb(lease significant bit)定義為31;而小端模式的32位處理器,將其寄存器的最高位定義為31,低位地址定義為0。與此向?qū)?yīng),采用大端模式的32位處理器數(shù)據(jù)總線的最高位為0,最高位為31;采用小端模式的32位處理器的數(shù)據(jù)總線的最高位為31,最低位為0。? ? ? ? ?
? ? ? ?大小端模式處理器外部總線的位序也遵循著同樣的規(guī)律,根據(jù)所采用的數(shù)據(jù)總線是32位,16位和8位,大小端處理器外部總線的位序有所不同。大端模式下32位數(shù)據(jù)總線的msb是第0位,MSB是數(shù)據(jù)總線的第0~7的字段;而lsb是第31位,LSB是第24~31字段。小端模式下32位總線的msb是第31位,MSB是數(shù)據(jù)總線的第31~24位,lsb是第0位,LSB是7~0字段。大端模式下16位數(shù)據(jù)總線的msb是第0位,MSB是數(shù)據(jù)總線的第0~7的字段;而lsb是第15位,LSB是第8~15字段。小端模式下16位總線的msb是第15位,MSB是數(shù)據(jù)總線的第15~7位,lsb是第0位,LSB是7~0字段。大端模式下8位數(shù)據(jù)總線的msb是第0位,MSB是數(shù)據(jù)總線的第0~7的字段;而lsb是第7位,LSB是第0~7字段。小端模式下8位總線的msb是第7位,MSB是數(shù)據(jù)總線的第7~0位,lsb是第0位,LSB是7~0字段。
? ? ? ? ?由上分析,我們可以得知對(duì)于8位,16位和32位寬度的數(shù)據(jù)總線,采用大端模式時(shí)數(shù)據(jù)總線的msb和MSB的位置都不會(huì)發(fā)生變化,而采用小端模式時(shí)數(shù)據(jù)總線的lsb和LSB位置也不會(huì)發(fā)生變化。
? ? ? ? ?為此,大端模式的處理器對(duì)8位,16位和32位的內(nèi)存訪問(包括外設(shè)的訪問)一般都包含第0~7字段,即MSB。小端模式的處理器對(duì)8位,16位和32位的內(nèi)存訪問都包含第7~0位,小端方式的第7~0字段,即LSB。由于大小端處理器的數(shù)據(jù)總線其8位,16位和32位寬度的數(shù)據(jù)總線的定義不同,因此需要分別進(jìn)行討論在系統(tǒng)級(jí)別上如何處理端模式轉(zhuǎn)換。在一個(gè)大端處理器系統(tǒng)中,需要處理大端處理器對(duì)小端外設(shè)的訪問。
十、實(shí)際中的例子
? ? ? ?雖然很多時(shí)候,字節(jié)序的工作已由編譯器完成了,但是在一些小的細(xì)節(jié)上,仍然需要去仔細(xì)揣摩考慮,尤其是在以太網(wǎng)通訊、MODBUS通訊、軟件移植性方面。這里,舉一個(gè)MODBUS通訊的例子。在MODBUS中,數(shù)據(jù)需要組織成數(shù)據(jù)報(bào)文,該報(bào)文中的數(shù)據(jù)都是大端模式,即低地址存高位,高地址存低位。假設(shè)有一16位緩沖區(qū)m_RegMW[256],因?yàn)槭窃趚86平臺(tái)上,所以內(nèi)存中的數(shù)據(jù)為小端模式:m_RegMW[0].low、m_RegMW[0].high、m_RegMW[1].low、m_RegMW[1].high……
為了方便討論,假設(shè)m_RegMW[0] = 0x3456; 在內(nèi)存中為0x56、0x34。
? ? ? ?現(xiàn)要將該數(shù)據(jù)發(fā)出,如果不進(jìn)行數(shù)據(jù)轉(zhuǎn)換直接發(fā)送,此時(shí)發(fā)送的數(shù)據(jù)為0x56,0x34。而Modbus是大端的,會(huì)將該數(shù)據(jù)解釋為0x5634而非原數(shù)據(jù)0x3456,此時(shí)就會(huì)發(fā)生災(zāi)難性的錯(cuò)誤。所以,在此之前,需要將小端數(shù)據(jù)轉(zhuǎn)換成大端的,即進(jìn)行高字節(jié)和低字節(jié)的交換,此時(shí)可以調(diào)用步驟五中的函數(shù)BigtoLittle16(m_RegMW[0]),之后再進(jìn)行發(fā)送才可以得到正確的數(shù)據(jù)。