linux內(nèi)核解析之內(nèi)核同步機(jī)制
本文講述了linux內(nèi)核中常見的同步機(jī)制,使讀者掌握每處理器變量和rcu這兩種新的同步機(jī)制。
內(nèi)核同步機(jī)制
內(nèi)核同步主要是同步各執(zhí)行單元對共享數(shù)據(jù)的訪問,尤其是多處理器的同步。 Linux2.6中內(nèi)核同步機(jī)制主要包括以下幾種:原子操作、信號量(semaphore)、讀寫信號量(rw_semaphore)、自旋鎖(spinlock)、大內(nèi)核鎖(BKL)等。
(1)原子操作
原子操作就是指某一個操作在執(zhí)行過程中不可以被打斷,要么全部執(zhí)行,要不就一點(diǎn)也不執(zhí)行。原子操作需要硬件的支持,與體系結(jié)構(gòu)相關(guān),使用匯編語言實現(xiàn)。 原子操作主要用于實現(xiàn)資源計數(shù),很多引用計數(shù)就是通過原子操作實現(xiàn)。Linux中提供了兩種原子操作接口,分別是原子整數(shù)操作和原子位操作。
原子整數(shù)操作只對atomic_t類型的數(shù)據(jù)進(jìn)行操作,不能對C語言的int進(jìn)行操作,使用atomic_t只能將其作為24位數(shù)據(jù)處理,主要是在SPARC體系結(jié)構(gòu)中int的低8為中設(shè)置了一個鎖,避免對原子類型數(shù)據(jù)的并發(fā)訪問。 原子位操作是針對由指針變量指定的任意一塊內(nèi)存區(qū)域的位序列的某一位進(jìn)行操作。它只是針對普通指針的操作,不需要定義一個與該操作相對應(yīng)的數(shù)據(jù)類型。
(2)自旋鎖
Linux自旋鎖保證了任意時刻只能有一個執(zhí)行線程進(jìn)入臨界區(qū),其他試圖進(jìn)入臨界區(qū)的線程將一直進(jìn)行嘗試(即自旋),直到獲得該鎖。自旋鎖主要應(yīng)用在加鎖時間不長并且不會睡眠的情況。
自旋鎖的本質(zhì)是對內(nèi)存區(qū)域的一個整數(shù)的操作,任何線程進(jìn)入臨界區(qū)之前都必須檢查該整數(shù),可用則進(jìn)入,都則一直忙循環(huán)等待。
自旋鎖機(jī)制讓試圖獲得該鎖的線程一直進(jìn)行忙循環(huán)(占用CPU),因此自旋鎖適合于斷時間內(nèi)進(jìn)行輕量級加鎖。而且自旋鎖絕對不可以遞歸使用,否則會被自己鎖死。
Linux自旋鎖主要應(yīng)用與多核處理器中,單CPU中不會進(jìn)行自旋鎖操作。 linux上的自旋鎖有三種實現(xiàn):
a. 在單cpu,不可搶占內(nèi)核中,自旋鎖為空操作。
b. 在單cpu,可搶占內(nèi)核中,自旋鎖實現(xiàn)為“禁止內(nèi)核搶占”,并不實現(xiàn)“自旋”。
c. 在多cpu,可搶占內(nèi)核中,自旋鎖實現(xiàn)為“禁止內(nèi)核搶占” + “自旋”。 其中,禁止內(nèi)核搶占只是關(guān)閉“可搶占標(biāo)志”,而不是禁止進(jìn)程切換。顯式使用schedule或進(jìn)程阻塞(此也會導(dǎo)致調(diào)用schedule)時,還是會發(fā)生進(jìn)程調(diào)度的。
(3)讀/寫自旋鎖
Linux中規(guī)定,讀/寫自旋鎖允許多個線程同時以只讀的方式訪問臨界資源,只有當(dāng)一個線程想更新數(shù)據(jù)時,才會互斥訪問資源。讀寫自旋鎖包括一個24位讀者計數(shù)和一個解鎖標(biāo)記來實現(xiàn)的。
(4)信號量
Linux中提供了兩種信號量:
a. 內(nèi)核信號量,由內(nèi)核程序使用
b. System V IPC 信號量,由用戶進(jìn)程使用
當(dāng)一個線程去請求以不可用的信號量時,和自旋鎖不同,該進(jìn)程會進(jìn)入睡眠(不再占用CPU),加入到等待隊列中,直到被喚醒,所以只有可睡眠的狀態(tài)才可以使用信號量。 信號量實現(xiàn)的結(jié)構(gòu)體semphore中有一變量count計數(shù)。根據(jù)count取值的設(shè)定,信號量可以分為二元信號量和計數(shù)信號量,當(dāng)count初值為1時,則為二元信號量。計數(shù)信號量允許任意數(shù)量的鎖持有者,這點(diǎn)和自旋鎖是不同的(自旋鎖只允許一個)。
(5)讀/寫信號量
讀寫信號量實際上對于讀者使用的是一個計數(shù)信號量,寫者使用的是二元信號量。讀寫信號量同讀寫自旋鎖一樣提高了內(nèi)核的并發(fā)度。
Linux內(nèi)核時按照先進(jìn)先出(FIFO)的順序來處理等待讀寫信號量的進(jìn)程。具體過程是如果一個進(jìn)程試圖獲取一個不可用的信號量時,加入到等待隊列的末尾,當(dāng)信號量可用時,內(nèi)核首先喚醒等待隊列的第一個進(jìn)程,如果該進(jìn)程為寫進(jìn)程,那么該進(jìn)程獲得信號量。如果該進(jìn)程如果為一個讀進(jìn)程,那么其后的所有的讀進(jìn)程都可以被喚醒并獲得信號量,但是中間不能跳躍。
(6)BKL(Big Kernel Lock)
BKL即全局內(nèi)核鎖,也稱大內(nèi)核鎖,它是一個全局自旋鎖。大內(nèi)核鎖也是用來保護(hù)臨界區(qū)資源的,避免出現(xiàn)多個處理器上的進(jìn)程同時訪問同一區(qū)域,整個內(nèi)核中只有一個大內(nèi)核鎖。 BKL是一個名為kernel_flag的自旋鎖,持有該鎖的進(jìn)程仍可以睡眠,當(dāng)睡眠時持有的鎖將被自動釋放,該進(jìn)程被喚醒時重新持有該鎖。Linux允許一個進(jìn)程可以遞歸的持有BKL,BKL是一個遞歸鎖。
它的設(shè)計思想是,一旦某個內(nèi)核路徑獲取了這把鎖,那么其他所有的內(nèi)核路徑都不能再獲取到這把鎖。 自旋鎖加鎖的對象一般是一個全局變量,大內(nèi)核鎖加鎖的對象是一段代碼,里面可能包含多個全局變量。 那么他帶來的問題是,雖然A只需要互斥訪問全局變量a,但附帶鎖了全局變量b,從而導(dǎo)致B不能訪問b了
(7)屏障
屏障或稱內(nèi)存屏障,是用來解決內(nèi)存同步問題的,具體為對由于編譯器的優(yōu)化和緩存的使用,導(dǎo)致對內(nèi)存的寫入操作不能及時的反應(yīng)出來,也就是說當(dāng)完成對內(nèi)存的寫入操作之后,讀取出來的可能是舊的內(nèi)容的一種解決機(jī)制。
內(nèi)存屏障分類:
a.編譯器引起的內(nèi)存屏障 b.緩存引起的內(nèi)存屏障 c.亂序執(zhí)行引起的內(nèi)存屏障