linux系統(tǒng)編程之基礎(chǔ)必備(六):可重入函數(shù)、sig_atomic_t類型和volatile限定
掃描二維碼
隨時(shí)隨地手機(jī)看文章
一、 POSIX 中對(duì)可重入和線程安全這兩個(gè)概念的定義:
Reentrant Function:A function whose effect, when called by two or more threads,is guaranteed to be as if
the threads each executed the function one after another in an undefined order, even if the actual execution is interleaved.
Thread-Safe Function:A function that may be safely invoked concurrently by multiple threads.
Async-Signal-Safe Function: A function that may be invoked, without restriction from signal-catching functions. No function is async-signal -safe unless explicitly described as such.
以上三者的關(guān)系為:可重入函數(shù) 必然 是 線程安全函數(shù) 和 異步信號(hào)安全函數(shù); 線程安全函數(shù)不一定是可重入函數(shù)。
可重入與線程安全的區(qū)別體現(xiàn)在能否在signal處理函數(shù)中被調(diào)用的問題上,可重入函數(shù)在signal處理函數(shù)中可以被安全調(diào)用,因此同時(shí)也是Async-Signal-Safe Function;而線程安全函數(shù)不保證可以在signal處理函數(shù)中被安全調(diào)用,如果通過設(shè)置信號(hào)阻塞集合等方法保證一個(gè)非可重入函數(shù)不被信號(hào)中斷,那么它也是Async-Signal-Safe Function。
舉個(gè)例子,strtok是既不可重入的,也不是線程安全的;加鎖的strtok不是可重入的,但線程安全;而strtok_r既是可重入的,也是線程安全的。也就是說函數(shù)如果使用靜態(tài)變量,通過加鎖后可以轉(zhuǎn)成線程安全函數(shù),但仍然有可能不是可重入的。我們所熟知的alloc也是線程安全但不是可重入的。
再舉個(gè)例子,假設(shè)函數(shù)func()在執(zhí)行過程中需要訪問某個(gè)共享資源,因此為了實(shí)現(xiàn)線程安全,在使用該資源前加鎖,在不需要資源解鎖。 假設(shè)該函數(shù)在某次執(zhí)行過程中,在已經(jīng)獲得資源鎖之后,有異步信號(hào)發(fā)生,程序的執(zhí)行流轉(zhuǎn)交給對(duì)應(yīng)的信號(hào)處理函數(shù);再假設(shè)在該信號(hào)處理函數(shù)中也需要調(diào)用函數(shù) func(),那么func()在這次執(zhí)行中仍會(huì)在訪問共享資源前試圖獲得資源鎖,然而我們知道前一個(gè)func()實(shí)例已然獲得該鎖,因此信號(hào)處理函數(shù)阻塞;另一方面,信號(hào)處理函數(shù)結(jié)束前被信號(hào)中斷的線程是無法恢復(fù)執(zhí)行的,當(dāng)然也沒有釋放資源的機(jī)會(huì),這樣就出現(xiàn)了線程和信號(hào)處理函數(shù)之間的死鎖局面。
因此,func()盡管通過加鎖的方式能保證線程安全,但是由于函數(shù)體對(duì)共享資源的訪問,因此是非可重入。
對(duì)于這種情況,采用的方法一般是在特定的區(qū)域屏蔽一定的信號(hào)。
二、可重入函數(shù)
我們知道,當(dāng)捕捉到信號(hào)時(shí),不論進(jìn)程的主控制流程當(dāng)前執(zhí)行到哪兒,都會(huì)先跳到信號(hào)處理函數(shù)中執(zhí)行,從信號(hào)處理函數(shù)返回后再繼續(xù)執(zhí)行主控制流程。信號(hào)處理函數(shù)是一個(gè)單獨(dú)的控制流程,因?yàn)樗椭骺刂屏鞒淌钱惒降?,二者不存在調(diào)用和被調(diào)用的關(guān)系,并且使用不同的堆棧空間。引入了信號(hào)處理函數(shù)使得一個(gè)進(jìn)程具有多個(gè)控制流程,如果這些控制流程訪問相同的全局資源(全局變量、硬件資源等),就有可能出現(xiàn)沖突,如下面的例子所示。
main函數(shù)調(diào)用insert函數(shù)向一個(gè)鏈表head中插入節(jié)點(diǎn)node1,插入操作分為兩步,剛做完第一步的時(shí)候,因?yàn)橛布袛嗍惯M(jìn)程切換到內(nèi)核,再次回用戶態(tài)之前檢查到有信號(hào)待處理,于是切換到sighandler函數(shù),sighandler也調(diào)用insert函數(shù)向同一個(gè)鏈表head中插入節(jié)點(diǎn)node2,插入操作的兩步都做完之后從sighandler返回內(nèi)核態(tài),再次回到用戶態(tài)就從main函數(shù)調(diào)用的insert函數(shù)中繼續(xù)往下執(zhí)行,先前做第一步之后被打斷,現(xiàn)在繼續(xù)做完第二步。結(jié)果是,main函數(shù)和sighandler先后向鏈表中插入兩個(gè)節(jié)點(diǎn),而最后只有一個(gè)節(jié)點(diǎn)真正插入鏈表中了。
像上例這樣,insert函數(shù)被不同的控制流程調(diào)用,有可能在第一次調(diào)用還沒返回時(shí)就再次進(jìn)入該函數(shù),這稱為重入,insert函數(shù)訪問一個(gè)全局鏈表,有可能因?yàn)橹厝攵斐慑e(cuò)亂,像這樣的函數(shù)稱為不可重入函數(shù),反之,如果一個(gè)函數(shù)只訪問自己的局部變量或參數(shù),則稱為可重入(Reentrant)函數(shù)。
不可重入函數(shù)的原因在于:
1> 已知它們使用靜態(tài)數(shù)據(jù)結(jié)構(gòu)
2> 它們調(diào)用malloc和free.
因?yàn)閙alloc通常會(huì)為所分配的存儲(chǔ)區(qū)維護(hù)一個(gè)鏈接表,而插入執(zhí)行信號(hào)處理函數(shù)的時(shí)候,進(jìn)程可能正在修改此鏈接表。
3> 它們是標(biāo)準(zhǔn)IO函數(shù).
因?yàn)闃?biāo)準(zhǔn)IO庫的很多實(shí)現(xiàn)都使用了全局?jǐn)?shù)據(jù)結(jié)構(gòu)
3、sig_atomic_t類型與volatile限定符
在上面的圖示例子中,main和sighandler都調(diào)用insert函數(shù)則有可能出現(xiàn)鏈表的錯(cuò)亂,其根本原因在于,對(duì)全局鏈表的插入操作要分兩步完成,不是一個(gè)原子操作,假如這兩步操作必定會(huì)一起做完,中間不可能被打斷,就不會(huì)出現(xiàn)錯(cuò)亂了。
關(guān)于原子操作最原始的說法是一條匯編指令能夠完成(對(duì)于多線程程序來說原子操作可以指加鎖后的幾個(gè)步驟集合),即使是一條C語句也不一定是一個(gè)原子操作,比如 a = 5; 如果a是32位的int變量,在32位機(jī)上賦值是原子操作,在16位機(jī)上就不是。如果在程序中需要使用一個(gè)變量,要保證對(duì)它的讀寫都是原子操作,應(yīng)該采用什么類型呢?
為了解決這些平臺(tái)相關(guān)的問題,C標(biāo)準(zhǔn)定義了一個(gè)類型sig_atomic_t,在不同平臺(tái)的C語言庫中取不同的類型,例如在32位機(jī)上定義sig_atomic_t為int類型。
在使用sig_atomic_t類型的變量時(shí),還需要注意另一個(gè)問題??慈缦碌睦樱?/p>
#include
sig_atomic_t a=0;
int main(void)
{
/* register a sighandler */
while(!a); /* wait until a changes in sighandler */
/* do something after signal arrives *
/ return 0;
}
為了簡潔,這里只寫了一個(gè)代碼框架來說明問題。在main函數(shù)中首先要注冊(cè)某個(gè)信號(hào)的處理函數(shù)sighandler,然后在一個(gè)while死循環(huán)中等待信號(hào)發(fā)生,如果有信號(hào)遞達(dá)則執(zhí)行sighandler,在sighandler中將a改為1,這樣再次回到main函數(shù)時(shí)就可以退出while循環(huán),執(zhí)行后續(xù)處理。如果在編譯時(shí)加了優(yōu)化選項(xiàng),則如果第一次比較a是否為0,如果相等則成了死循環(huán),因?yàn)椴粫?huì)再次從內(nèi)存讀取變量a的值。[!--empirenews.page--]
是編譯器優(yōu)化得有錯(cuò)誤嗎?不是的。設(shè)想一下,如果程序只有單一的執(zhí)行流程,只要當(dāng)前執(zhí)行流程沒有改變a的值,a的值就沒有理由會(huì)變,不需要反復(fù)從內(nèi)存讀取,因此上面的兩條指令和while(!a);循環(huán)是等價(jià)的,并且優(yōu)化之后省去了每次循環(huán)讀內(nèi)存的操作,效率非常高。
所以不能說編譯器做錯(cuò)了,只能說編譯器無法識(shí)別程序中存在多個(gè)執(zhí)行流程。之所以程序中存在多個(gè)執(zhí)行流程,是因?yàn)檎{(diào)用了特定平臺(tái)上的特定庫函數(shù),比如sigaction、pthread_create,這些不是C語言本身的規(guī)范,不歸編譯器管,程序員應(yīng)該自己處理這些問題。
C語言提供了volatile限定符,如果將上述變量定義為volatile sig_atomic_t a=0;那么即使指定了優(yōu)化選項(xiàng),編譯器也不會(huì)優(yōu)化掉對(duì)變量a內(nèi)存單元的讀寫。
對(duì)于程序中存在多個(gè)執(zhí)行流程訪問同一全局變量的情況,volatile限定符是必要的,此外,雖然程序只有單一的執(zhí)行流程,但是變量屬于以下情況之一的,也需要volatile限定:
變量的內(nèi)存單元中的數(shù)據(jù)不需要寫操作就可以自己發(fā)生變化,每次讀上來的值都可能不一樣;
即使多次向變量的內(nèi)存單元中寫數(shù)據(jù),只寫不讀,也并不是在做無用功,而是有特殊意義的;
什么樣的內(nèi)存單元會(huì)具有這樣的特性呢?肯定不是普通的內(nèi)存,而是映射到內(nèi)存地址空間的硬件寄存器,例如串口的
接收寄存器屬于上述第一種情況,而發(fā)送寄存器屬于上述第二種情況。
sig_atomic_t類型的變量應(yīng)該總是加上volatile限定符,因?yàn)橐褂胹ig_atomic_t類型的理由也正是
要加volatile限定符的理由。
對(duì)于多線程的程序,訪問沖突的問題是很普遍的,解決的辦法是引入鎖,獲得鎖的線程可以完成“讀-修改-寫”的操作,然后釋放鎖給其它線程,沒有獲得鎖的線程只能等待而不能訪問共享數(shù)據(jù),這樣“讀-修改-寫”三步操作組成一個(gè)原子操作,要么都執(zhí)行,要么都不執(zhí)行,不會(huì)執(zhí)行到中間被打斷,也不會(huì)在其它處理器上并行做這個(gè)操作。