不要再誤解C ?volatile了
來(lái)源:https://liam.page/2018/01/18/volatile-in-C-and-Cpp/
作者:Liam Huang
最近在討論多線程編程中的一個(gè)可能的 false sharing 問題時(shí),有人提出加 volatile 可能可以解決問題。這種錯(cuò)誤的認(rèn)識(shí)荼毒多年,促使我寫下這篇文章。
約定
Volatile 這個(gè)話題,涉及到計(jì)算機(jī)科學(xué)多個(gè)領(lǐng)域多個(gè)層次的諸多細(xì)節(jié)。僅靠一篇博客,很難窮盡這些細(xì)節(jié)。因此,若不對(duì)討論范圍做一些約定,很容易就有諸多漏洞。到時(shí)誤人子弟,就不好了。以下是一些基本的約定:
1. 這篇博文討論的 volatile 關(guān)鍵字,是 C 和 C 語(yǔ)言中的關(guān)鍵字。Java 等語(yǔ)言中,也有 volatile 關(guān)鍵字。但它們和 C/C 里的 volatile 不完全相同,不在這篇博文的討論范圍內(nèi)。
2. 這篇博文討論的 volatile 關(guān)鍵字,是限定在 C/C 標(biāo)準(zhǔn)之下的。這也就是說,我們討論的內(nèi)容應(yīng)該是與平臺(tái)無(wú)關(guān)的,同時(shí)也是與編譯器擴(kuò)展無(wú)關(guān)的。
3. 相應(yīng)的,這篇文章討論的「標(biāo)準(zhǔn)」指的是 C/C 的標(biāo)準(zhǔn),而不是其他什么東西。
4. 我們希望編寫的代碼是 (1) 符合標(biāo)準(zhǔn)的,(2) 性能良好的,(3) 可移植的。這里 (1) 保證了代碼執(zhí)行結(jié)果的正確性,(2) 保證了高效性,(3) 體現(xiàn)了平臺(tái)無(wú)關(guān)性(以及編譯器擴(kuò)展等的無(wú)關(guān)性)。
含義
單詞 volatile 的含義
在談及 C/C 中的 volatile 關(guān)鍵字時(shí),總有人會(huì)拿 volatile 這個(gè)英文單詞的中文解釋說事。他們把 volatile 翻譯作「易變的」。但事實(shí)上,對(duì)于翻譯來(lái)說,很多時(shí)候目標(biāo)語(yǔ)言很難找到一個(gè)詞能夠反映源語(yǔ)言中單詞的全部含義和細(xì)節(jié)。此處「易變的」就無(wú)法做到這一點(diǎn)。
Volatile 的意思,若要詳細(xì)理解,還是應(yīng)該查閱權(quán)威的英英字典。在柯林斯高階學(xué)習(xí)詞典中,volatile 是這樣解釋的:
A situation that is volatile is likely to change suddenly and unexpectedly.這里對(duì) volatile 的解釋有三個(gè)精髓的形容詞和副詞,體現(xiàn)了 volatile 的含義。
1. likely:可能的。這意味著被 volatile 形容的對(duì)象「有可能也有可能不」發(fā)生改變,因此我們不能對(duì)這樣的對(duì)象的狀態(tài)做出任何假設(shè)。
2. suddenly:突然地。這意味著被 volatile 形容的對(duì)象可能發(fā)生瞬時(shí)改變。
3. unexpectedly:不可預(yù)期地。這與 likely 相互呼應(yīng),意味著被 volatile 形容的對(duì)象可能以各種不可預(yù)期的方式和時(shí)間發(fā)生更改。
因此,volatile 其實(shí)就是告訴我們,被它修飾的對(duì)象出現(xiàn)任何情況都不要奇怪,我們不能對(duì)它們做任何假設(shè)。
程序中 volatile 的含義
對(duì)于程序員來(lái)說,程序本身的任何行為都必須是可預(yù)期的。那么,在程序當(dāng)中,什么才叫 volatile 呢?這個(gè)問題的答案也很簡(jiǎn)單:程序可能受到程序之外的因素影響。
考慮以下 C/C 代碼。
volatile int *p = /* ... */;
int a, b;
a = *p;
b?=?*p;
此處說的「讀取內(nèi)存」,包括了讀取 CPU 緩存和讀取計(jì)算機(jī)主存。然而,由于 MMIP(Memory mapped I/O)的存在,這個(gè)假設(shè)不一定是真的。例如說,假設(shè) p 指向的內(nèi)存是一個(gè)硬件設(shè)備。這樣一來(lái),從 p 指向的內(nèi)存讀取數(shù)據(jù)可能伴隨著可觀測(cè)的副作用:硬件狀態(tài)的修改。此時(shí),代碼的原意可能是將硬件設(shè)備返回的連續(xù)兩個(gè) int 分別保存在 a 和 b 當(dāng)中。這種情況下,編譯器的優(yōu)化就會(huì)導(dǎo)致程序行為不符合預(yù)期了。
總結(jié)來(lái)說,被 volatile 修飾的變量,在對(duì)其進(jìn)行讀寫操作時(shí),會(huì)引發(fā)一些可觀測(cè)的副作用。而這些可觀測(cè)的副作用,是由程序之外的因素決定的。
關(guān)鍵字?volatile?的含義
CPP reference 網(wǎng)站是對(duì) C 和 C 語(yǔ)言標(biāo)準(zhǔn)的整理。因此,絕大多數(shù)時(shí)候,我們可以通過這個(gè)網(wǎng)站對(duì)語(yǔ)言標(biāo)準(zhǔn)進(jìn)行查詢。關(guān)于 volatile 關(guān)鍵字,有 C 語(yǔ)言標(biāo)準(zhǔn)和 C 語(yǔ)言標(biāo)準(zhǔn)可查。這里摘錄兩份標(biāo)準(zhǔn)對(duì) volatile 訪問的描述。
C 語(yǔ)言:Every access (both read and write) made through an lvalue expression of volatile-qualified type is considered an observable side effect for the purpose of optimization and is evaluated strictly according to the rules of the abstract machine (that is, all writes are completed at some time before the next sequence point). This means that within a single thread of execution, a volatile access cannot be optimized out or reordered relative to another visible side effect that is separated by a sequence point from the volatile access.這里首先解釋兩組概念:值類型和序列點(diǎn)(執(zhí)行序列)。
C 語(yǔ)言:Every access (read or write operation, member function call, etc.) made through a glvalue expression of volatile-qualified type is treated as a visible side-effect for the purposes of optimization (that is, within a single thread of execution, volatile accesses cannot be optimized out or reordered with another visible side effect that is sequenced-before or sequenced-after the volatile access. This makes volatile objects suitable for communication with a signal handler, but not with another thread of execution, see std::memory_order). Any attempt to refer to a volatile object through a non-volatile glvalue (e.g. through a reference or pointer to non-volatile type) results in undefined behavior.
值類型指的是左值(lvalue)右值(rvalue)這些概念。關(guān)于左值和右值,前作有過介紹。簡(jiǎn)單的理解,左值可以出現(xiàn)在賦值等號(hào)的左邊,使用時(shí)取的是作為對(duì)象的身份;右值不可以出現(xiàn)在賦值等號(hào)的左邊,使用時(shí)取的是對(duì)象的值。除了 lvalue 和 rvalue,C 還定義了其他的值類型。其中,xvalue 大體可以理解為返回右值引用的函數(shù)調(diào)用或表達(dá)式,而 glvalue 則是 lvalue 和 xvalue 之和。
序列點(diǎn)則是 C/C 中討論執(zhí)行順序時(shí)會(huì)提到的概念。對(duì)于 C/C 的表達(dá)式來(lái)說,執(zhí)行表達(dá)式有兩種類型的動(dòng)作:(1) 計(jì)算某個(gè)值、(2) 副作用(例如訪問 volatile 對(duì)象,原子同步,修改文件等)。因此,如果在兩個(gè)表達(dá)式 E1 和 E2 中間有一個(gè)序列點(diǎn),或者在 C 中 E1 于序列中在 E2 之前,則 E1 的求值動(dòng)作和副作用都會(huì)在 E2 的求值動(dòng)作和副作用之前。關(guān)于序列點(diǎn)和序列順序規(guī)則,可以參考:這里和這里。
因此我們講,在 C/C 中,對(duì) volatile 對(duì)象的訪問,有編譯器優(yōu)化上的副作用:
1. 不允許被優(yōu)化消失(optimized out);
2. 于序列上在另一個(gè)對(duì) volatile 對(duì)象的訪問之前。
這里提及的「不允許被優(yōu)化」表示對(duì) volatile 變量的訪問,編譯器不能做任何假設(shè)和推理,都必須按部就班地與「內(nèi)存」進(jìn)行交互。因此,上述例中「復(fù)用寄存器中的值」就是不允許的。
需要注意的是,無(wú)論是 C 還是 C 的標(biāo)準(zhǔn),對(duì)于 volatile 訪問的序列性,都有單線程執(zhí)行的前提。其中 C 標(biāo)準(zhǔn)特別提及,這個(gè)順序性在多線程環(huán)境里不一定成立。
volatile?與多線程
volatile 可以解決多線程中的某些問題,這一錯(cuò)誤認(rèn)識(shí)荼毒多年。例如,在知乎「volatile」話題下的介紹就是「多線程開發(fā)中保持可見性的關(guān)鍵字」。為了撥亂反正,這里先給出結(jié)論(注意這些結(jié)論都基于本文第一節(jié)提出的約定之上):
1. volatile 不能解決多線程中的問題。
2. 按照 Hans Boehm