根據(jù)c/c++語法,const可以出現(xiàn)的地方,volatile幾乎也都可以出現(xiàn)。但是,const修飾的對象其值不能改變,而volatile修飾的對象其值可以隨意地改變,也就是說,volatile對象值可能會改變,即使沒有任何代碼去改變它。在這一點(diǎn)上,最典型的例子就是內(nèi)存映射的設(shè)備寄存器和多線程中的共享對象。懂得使用volatile也是一門小小的藝術(shù)。使用volatile約束符可以阻止編譯器對代碼過分優(yōu)化防止出現(xiàn)一些你意想不到的情況,達(dá)不到預(yù)期的結(jié)果;過頻地使用volatile很可能會增加代碼尺寸和降低性能。下面舉個例子來說明volatile在優(yōu)化中的微妙作用。
1.阻止編譯器優(yōu)化
ARM Evaluator-7T模擬單機(jī)板使用基于內(nèi)存映射的設(shè)備寄存器叫特殊寄存器,用來
控制和交互外圍設(shè)備。CPU對內(nèi)存的操作可以做到按位進(jìn)行,而特殊寄存器是4字節(jié)對齊并占四個字節(jié)。你可以象unsigned int變量一樣操作特殊寄存器(有些人可能更喜歡uint32_t,認(rèn)為這樣體現(xiàn)寄存器占用4個字節(jié)的特點(diǎn)。uint32_t在C99 頭文件中有定義)。而這里,為了體現(xiàn)寄存器本身作為寄存器的含義而非它的物理意義的,我們做如下定義:
typedef uint32_t special_register;
Evaluator-7T板子上有一個按鈕(可以認(rèn)為是外設(shè)之一)。按下該按鈕可以對IOPDATA寄存器第8位置1,相反,釋放按鈕會將該位重新清0。我們使用枚舉方法為IOPDATA寄存器的第8位置定義一個掩碼mask:
enum { button = 0x100 };
IOPDATA寄存器對應(yīng)的地址為0x3FF5008,我們可以用宏形象地定義IOPDATA:
#define IOPDATA (*(special_register *)0x03FF5008)
有了這個定義,我們執(zhí)行下面的循環(huán)就可以使CPU一直等待該按鈕被按下:
while ((IOPDATA & button) == 0)
;
然而這個期望必須建立在編譯器不對代碼進(jìn)行優(yōu)化的前提假設(shè)之上。如果編譯器優(yōu)化這段代碼,那么它會認(rèn)為在這個循環(huán)中沒有什么會改變 IOPDATA而且認(rèn)為條件判斷結(jié)果總是真或假,最終優(yōu)化的結(jié)果是只對(IOPDATA & button)==0判斷一次,之后的循環(huán)都不在對其進(jìn)行判斷,其等同于:
if ((IOPDATA & button) == 0)
for (;;)
;
顯然,如果條件判斷結(jié)果為真(那么之后都會認(rèn)為是真),那么這段代碼將會陷入死循環(huán)。如果判斷為假,那么循環(huán)就此結(jié)束??梢钥闯?,優(yōu)化的代碼效率更高,因為每次循環(huán)相比原來的執(zhí)行時間要短。不幸的是,這段優(yōu)化代碼使得它根本就不能響應(yīng)按鈕的每次動作。那么,如何解決這個問題呢?解決的關(guān)鍵就是不要讓編譯器優(yōu)化這段代碼,使用volatile就可以辦到這一點(diǎn)。我們修改前面關(guān)于IOPDATA的宏定義:
#define IOPDATA (*(special_register volatile *)0x03FF5008)
這個定義將IOPDATA 定義為volatile類型的寄存器。volatile隱含地告訴編譯器特殊寄存器可能會改變內(nèi)容,即使沒有任何顯式地代碼去改變它的內(nèi)容。這樣一來,編譯器就不對IOPDATA作優(yōu)化,而是每次都去訪問IOPDATA,這其實(shí)正是我們所期望的。
2.無意中降低了效率
有時候,如果不注意的話,使用volatile會無意中降低代碼效率。舉個例子。Evaluator-7T有一個七段數(shù)碼顯示器見下圖:
在IOPDATA 寄存器中第10到16位用來控制顯示器的每一段。比如第10位就是用來控制頂部的那段顯示,置1則點(diǎn)亮它,清0則熄滅它。我們可以定義一個掩碼mask來覆蓋從第10到16的所有位:
enum { display = 0x1FC00 };
假設(shè)變量b用來控制這7段顯示器的每一段顯示,并且b的值已經(jīng)你想要設(shè)置值(準(zhǔn)備用來顯示哪幾段和熄滅哪幾段,其它無關(guān)的位均為0)。那么你想要改變設(shè)置新的顯示方式的操作就是:
IOPDATA = b;
但是這種賦值可能會改變第10到16位之外的其它位,這是我們不期望的。所以,采用下面的方法更好:
IOPDATA |= b
但是,使用 |= 并不能熄滅那些已經(jīng)點(diǎn)亮的顯示段(1 | 0 -> 1),所以我們可以用下面的函數(shù)達(dá)到目的:
void display_put(uint32_t b)
{
IOPDATA &= ~display;
IOPDATA |= b;
}
不過,可能沒想到的是這樣的操作在無意中降低了代碼效率。因為我們定義IOPDATA為
volatile類型,它阻止了編譯器對代碼的優(yōu)化,要求任何讀寫IOPDATA的操作都死死板板地進(jìn)行。IOPDATA &= ~display的等價表現(xiàn)為IOPDATA = IOPDATA & ~display,也就是先從IOPDATA讀出內(nèi)容然后與上~display,最后又回寫IOPDATA。同理,IOPDATA |=b也有相似的過程。整個過程分別有2次讀IOPDATA和2次寫IOPDATA的操作。如果IOPDATA不使用volatile,那么編譯器會要求將IOPDATA & ~display的結(jié)果放在CPU寄存器中,直到完成IOPDATA |= b操作才寫回特殊寄存器IOPDATA。顯然后者較之前者分別省掉了1次讀IOPDATA和1次I寫OPDATA的耗時操作(外設(shè)操作是最耗時的),效率要高很多。如果你想使用volatile但又能使能優(yōu)化功能,你可以將函數(shù)作如下的修改:
void display_put(uint32_t b)
{
register uint32_t temp = IOPDATA;
temp &= ~display;
temp |= b;
IOPDATA = temp;
}
這樣做有點(diǎn)煩瑣,下面的等效方法更簡單:
void display_put(uint32_t b)
{
IOPDATA = (IOPDATA & ~display) | b;
}
結(jié)論:從該例子看出,它并不鼓勵使用volatile,即使要用也要很小心,因為volatile可能在無意中降低了代碼效率,而你卻無法察覺。但是,我們說,不鼓勵并不是說就不能或不要用,而是要懂得何時用,怎么用好它。其所謂智用了。