linux內(nèi)核解析之內(nèi)核同步機(jī)制
掃描二維碼
隨時(shí)隨地手機(jī)看文章
本文講述了linux內(nèi)核中常見的同步機(jī)制,使讀者掌握每處理器變量和rcu這兩種新的同步機(jī)制。
內(nèi)核同步機(jī)制
內(nèi)核同步主要是同步各執(zhí)行單元對(duì)共享數(shù)據(jù)的訪問,尤其是多處理器的同步。 Linux2.6中內(nèi)核同步機(jī)制主要包括以下幾種:原子操作、信號(hào)量(semaphore)、讀寫信號(hào)量(rw_semaphore)、自旋鎖(spinlock)、大內(nèi)核鎖(BKL)等。
(1)原子操作
原子操作就是指某一個(gè)操作在執(zhí)行過程中不可以被打斷,要么全部執(zhí)行,要不就一點(diǎn)也不執(zhí)行。原子操作需要硬件的支持,與體系結(jié)構(gòu)相關(guān),使用匯編語言實(shí)現(xiàn)。 原子操作主要用于實(shí)現(xiàn)資源計(jì)數(shù),很多引用計(jì)數(shù)就是通過原子操作實(shí)現(xiàn)。Linux中提供了兩種原子操作接口,分別是原子整數(shù)操作和原子位操作。
原子整數(shù)操作只對(duì)atomic_t類型的數(shù)據(jù)進(jìn)行操作,不能對(duì)C語言的int進(jìn)行操作,使用atomic_t只能將其作為24位數(shù)據(jù)處理,主要是在SPARC體系結(jié)構(gòu)中int的低8為中設(shè)置了一個(gè)鎖,避免對(duì)原子類型數(shù)據(jù)的并發(fā)訪問。 原子位操作是針對(duì)由指針變量指定的任意一塊內(nèi)存區(qū)域的位序列的某一位進(jìn)行操作。它只是針對(duì)普通指針的操作,不需要定義一個(gè)與該操作相對(duì)應(yīng)的數(shù)據(jù)類型。
(2)自旋鎖
Linux自旋鎖保證了任意時(shí)刻只能有一個(gè)執(zhí)行線程進(jìn)入臨界區(qū),其他試圖進(jìn)入臨界區(qū)的線程將一直進(jìn)行嘗試(即自旋),直到獲得該鎖。自旋鎖主要應(yīng)用在加鎖時(shí)間不長(zhǎng)并且不會(huì)睡眠的情況。
自旋鎖的本質(zhì)是對(duì)內(nèi)存區(qū)域的一個(gè)整數(shù)的操作,任何線程進(jìn)入臨界區(qū)之前都必須檢查該整數(shù),可用則進(jìn)入,都則一直忙循環(huán)等待。
自旋鎖機(jī)制讓試圖獲得該鎖的線程一直進(jìn)行忙循環(huán)(占用CPU),因此自旋鎖適合于斷時(shí)間內(nèi)進(jìn)行輕量級(jí)加鎖。而且自旋鎖絕對(duì)不可以遞歸使用,否則會(huì)被自己鎖死。
Linux自旋鎖主要應(yīng)用與多核處理器中,單CPU中不會(huì)進(jìn)行自旋鎖操作。 linux上的自旋鎖有三種實(shí)現(xiàn):
a. 在單cpu,不可搶占內(nèi)核中,自旋鎖為空操作。
b. 在單cpu,可搶占內(nèi)核中,自旋鎖實(shí)現(xiàn)為“禁止內(nèi)核搶占”,并不實(shí)現(xiàn)“自旋”。
c. 在多cpu,可搶占內(nèi)核中,自旋鎖實(shí)現(xiàn)為“禁止內(nèi)核搶占” + “自旋”。 其中,禁止內(nèi)核搶占只是關(guān)閉“可搶占標(biāo)志”,而不是禁止進(jìn)程切換。顯式使用schedule或進(jìn)程阻塞(此也會(huì)導(dǎo)致調(diào)用schedule)時(shí),還是會(huì)發(fā)生進(jìn)程調(diào)度的。
(3)讀/寫自旋鎖
Linux中規(guī)定,讀/寫自旋鎖允許多個(gè)線程同時(shí)以只讀的方式訪問臨界資源,只有當(dāng)一個(gè)線程想更新數(shù)據(jù)時(shí),才會(huì)互斥訪問資源。讀寫自旋鎖包括一個(gè)24位讀者計(jì)數(shù)和一個(gè)解鎖標(biāo)記來實(shí)現(xiàn)的。
(4)信號(hào)量
Linux中提供了兩種信號(hào)量:
a. 內(nèi)核信號(hào)量,由內(nèi)核程序使用
b. System V IPC 信號(hào)量,由用戶進(jìn)程使用
當(dāng)一個(gè)線程去請(qǐng)求以不可用的信號(hào)量時(shí),和自旋鎖不同,該進(jìn)程會(huì)進(jìn)入睡眠(不再占用CPU),加入到等待隊(duì)列中,直到被喚醒,所以只有可睡眠的狀態(tài)才可以使用信號(hào)量。 信號(hào)量實(shí)現(xiàn)的結(jié)構(gòu)體semphore中有一變量count計(jì)數(shù)。根據(jù)count取值的設(shè)定,信號(hào)量可以分為二元信號(hào)量和計(jì)數(shù)信號(hào)量,當(dāng)count初值為1時(shí),則為二元信號(hào)量。計(jì)數(shù)信號(hào)量允許任意數(shù)量的鎖持有者,這點(diǎn)和自旋鎖是不同的(自旋鎖只允許一個(gè))。
(5)讀/寫信號(hào)量
讀寫信號(hào)量實(shí)際上對(duì)于讀者使用的是一個(gè)計(jì)數(shù)信號(hào)量,寫者使用的是二元信號(hào)量。讀寫信號(hào)量同讀寫自旋鎖一樣提高了內(nèi)核的并發(fā)度。
Linux內(nèi)核時(shí)按照先進(jìn)先出(FIFO)的順序來處理等待讀寫信號(hào)量的進(jìn)程。具體過程是如果一個(gè)進(jìn)程試圖獲取一個(gè)不可用的信號(hào)量時(shí),加入到等待隊(duì)列的末尾,當(dāng)信號(hào)量可用時(shí),內(nèi)核首先喚醒等待隊(duì)列的第一個(gè)進(jìn)程,如果該進(jìn)程為寫進(jìn)程,那么該進(jìn)程獲得信號(hào)量。如果該進(jìn)程如果為一個(gè)讀進(jìn)程,那么其后的所有的讀進(jìn)程都可以被喚醒并獲得信號(hào)量,但是中間不能跳躍。
(6)BKL(Big Kernel Lock)
BKL即全局內(nèi)核鎖,也稱大內(nèi)核鎖,它是一個(gè)全局自旋鎖。大內(nèi)核鎖也是用來保護(hù)臨界區(qū)資源的,避免出現(xiàn)多個(gè)處理器上的進(jìn)程同時(shí)訪問同一區(qū)域,整個(gè)內(nèi)核中只有一個(gè)大內(nèi)核鎖。 BKL是一個(gè)名為kernel_flag的自旋鎖,持有該鎖的進(jìn)程仍可以睡眠,當(dāng)睡眠時(shí)持有的鎖將被自動(dòng)釋放,該進(jìn)程被喚醒時(shí)重新持有該鎖。Linux允許一個(gè)進(jìn)程可以遞歸的持有BKL,BKL是一個(gè)遞歸鎖。
它的設(shè)計(jì)思想是,一旦某個(gè)內(nèi)核路徑獲取了這把鎖,那么其他所有的內(nèi)核路徑都不能再獲取到這把鎖。 自旋鎖加鎖的對(duì)象一般是一個(gè)全局變量,大內(nèi)核鎖加鎖的對(duì)象是一段代碼,里面可能包含多個(gè)全局變量。 那么他帶來的問題是,雖然A只需要互斥訪問全局變量a,但附帶鎖了全局變量b,從而導(dǎo)致B不能訪問b了
(7)屏障
屏障或稱內(nèi)存屏障,是用來解決內(nèi)存同步問題的,具體為對(duì)由于編譯器的優(yōu)化和緩存的使用,導(dǎo)致對(duì)內(nèi)存的寫入操作不能及時(shí)的反應(yīng)出來,也就是說當(dāng)完成對(duì)內(nèi)存的寫入操作之后,讀取出來的可能是舊的內(nèi)容的一種解決機(jī)制。
內(nèi)存屏障分類:
a.編譯器引起的內(nèi)存屏障 b.緩存引起的內(nèi)存屏障 c.亂序執(zhí)行引起的內(nèi)存屏障