不要再誤解C ?volatile了
來源:https://liam.page/2018/01/18/volatile-in-C-and-Cpp/
作者:Liam Huang
最近在討論多線程編程中的一個可能的 false sharing 問題時,有人提出加 volatile 可能可以解決問題。這種錯誤的認識荼毒多年,促使我寫下這篇文章。
約定
Volatile 這個話題,涉及到計算機科學多個領域多個層次的諸多細節(jié)。僅靠一篇博客,很難窮盡這些細節(jié)。因此,若不對討論范圍做一些約定,很容易就有諸多漏洞。到時誤人子弟,就不好了。以下是一些基本的約定:
1. 這篇博文討論的 volatile 關鍵字,是 C 和 C 語言中的關鍵字。Java 等語言中,也有 volatile 關鍵字。但它們和 C/C 里的 volatile 不完全相同,不在這篇博文的討論范圍內(nèi)。
2. 這篇博文討論的 volatile 關鍵字,是限定在 C/C 標準之下的。這也就是說,我們討論的內(nèi)容應該是與平臺無關的,同時也是與編譯器擴展無關的。
3. 相應的,這篇文章討論的「標準」指的是 C/C 的標準,而不是其他什么東西。
4. 我們希望編寫的代碼是 (1) 符合標準的,(2) 性能良好的,(3) 可移植的。這里 (1) 保證了代碼執(zhí)行結(jié)果的正確性,(2) 保證了高效性,(3) 體現(xiàn)了平臺無關性(以及編譯器擴展等的無關性)。
含義
單詞 volatile 的含義
在談及 C/C 中的 volatile 關鍵字時,總有人會拿 volatile 這個英文單詞的中文解釋說事。他們把 volatile 翻譯作「易變的」。但事實上,對于翻譯來說,很多時候目標語言很難找到一個詞能夠反映源語言中單詞的全部含義和細節(jié)。此處「易變的」就無法做到這一點。
Volatile 的意思,若要詳細理解,還是應該查閱權(quán)威的英英字典。在柯林斯高階學習詞典中,volatile 是這樣解釋的:
A situation that is volatile is likely to change suddenly and unexpectedly.這里對 volatile 的解釋有三個精髓的形容詞和副詞,體現(xiàn)了 volatile 的含義。
1. likely:可能的。這意味著被 volatile 形容的對象「有可能也有可能不」發(fā)生改變,因此我們不能對這樣的對象的狀態(tài)做出任何假設。
2. suddenly:突然地。這意味著被 volatile 形容的對象可能發(fā)生瞬時改變。
3. unexpectedly:不可預期地。這與 likely 相互呼應,意味著被 volatile 形容的對象可能以各種不可預期的方式和時間發(fā)生更改。
因此,volatile 其實就是告訴我們,被它修飾的對象出現(xiàn)任何情況都不要奇怪,我們不能對它們做任何假設。
程序中 volatile 的含義
對于程序員來說,程序本身的任何行為都必須是可預期的。那么,在程序當中,什么才叫 volatile 呢?這個問題的答案也很簡單:程序可能受到程序之外的因素影響。
考慮以下 C/C 代碼。
volatile int *p = /* ... */;
int a, b;
a = *p;
b?=?*p;
此處說的「讀取內(nèi)存」,包括了讀取 CPU 緩存和讀取計算機主存。然而,由于 MMIP(Memory mapped I/O)的存在,這個假設不一定是真的。例如說,假設 p 指向的內(nèi)存是一個硬件設備。這樣一來,從 p 指向的內(nèi)存讀取數(shù)據(jù)可能伴隨著可觀測的副作用:硬件狀態(tài)的修改。此時,代碼的原意可能是將硬件設備返回的連續(xù)兩個 int 分別保存在 a 和 b 當中。這種情況下,編譯器的優(yōu)化就會導致程序行為不符合預期了。
總結(jié)來說,被 volatile 修飾的變量,在對其進行讀寫操作時,會引發(fā)一些可觀測的副作用。而這些可觀測的副作用,是由程序之外的因素決定的。
關鍵字?volatile?的含義
CPP reference 網(wǎng)站是對 C 和 C 語言標準的整理。因此,絕大多數(shù)時候,我們可以通過這個網(wǎng)站對語言標準進行查詢。關于 volatile 關鍵字,有 C 語言標準和 C 語言標準可查。這里摘錄兩份標準對 volatile 訪問的描述。
C 語言:Every access (both read and write) made through an lvalue expression of volatile-qualified type is considered an observable side effect for the purpose of optimization and is evaluated strictly according to the rules of the abstract machine (that is, all writes are completed at some time before the next sequence point). This means that within a single thread of execution, a volatile access cannot be optimized out or reordered relative to another visible side effect that is separated by a sequence point from the volatile access.這里首先解釋兩組概念:值類型和序列點(執(zhí)行序列)。
C 語言:Every access (read or write operation, member function call, etc.) made through a glvalue expression of volatile-qualified type is treated as a visible side-effect for the purposes of optimization (that is, within a single thread of execution, volatile accesses cannot be optimized out or reordered with another visible side effect that is sequenced-before or sequenced-after the volatile access. This makes volatile objects suitable for communication with a signal handler, but not with another thread of execution, see std::memory_order). Any attempt to refer to a volatile object through a non-volatile glvalue (e.g. through a reference or pointer to non-volatile type) results in undefined behavior.
值類型指的是左值(lvalue)右值(rvalue)這些概念。關于左值和右值,前作有過介紹。簡單的理解,左值可以出現(xiàn)在賦值等號的左邊,使用時取的是作為對象的身份;右值不可以出現(xiàn)在賦值等號的左邊,使用時取的是對象的值。除了 lvalue 和 rvalue,C 還定義了其他的值類型。其中,xvalue 大體可以理解為返回右值引用的函數(shù)調(diào)用或表達式,而 glvalue 則是 lvalue 和 xvalue 之和。
序列點則是 C/C 中討論執(zhí)行順序時會提到的概念。對于 C/C 的表達式來說,執(zhí)行表達式有兩種類型的動作:(1) 計算某個值、(2) 副作用(例如訪問 volatile 對象,原子同步,修改文件等)。因此,如果在兩個表達式 E1 和 E2 中間有一個序列點,或者在 C 中 E1 于序列中在 E2 之前,則 E1 的求值動作和副作用都會在 E2 的求值動作和副作用之前。關于序列點和序列順序規(guī)則,可以參考:這里和這里。
因此我們講,在 C/C 中,對 volatile 對象的訪問,有編譯器優(yōu)化上的副作用:
1. 不允許被優(yōu)化消失(optimized out);
2. 于序列上在另一個對 volatile 對象的訪問之前。
這里提及的「不允許被優(yōu)化」表示對 volatile 變量的訪問,編譯器不能做任何假設和推理,都必須按部就班地與「內(nèi)存」進行交互。因此,上述例中「復用寄存器中的值」就是不允許的。
需要注意的是,無論是 C 還是 C 的標準,對于 volatile 訪問的序列性,都有單線程執(zhí)行的前提。其中 C 標準特別提及,這個順序性在多線程環(huán)境里不一定成立。
volatile?與多線程
volatile 可以解決多線程中的某些問題,這一錯誤認識荼毒多年。例如,在知乎「volatile」話題下的介紹就是「多線程開發(fā)中保持可見性的關鍵字」。為了撥亂反正,這里先給出結(jié)論(注意這些結(jié)論都基于本文第一節(jié)提出的約定之上):
1. volatile 不能解決多線程中的問題。
2. 按照 Hans Boehm