linux內(nèi)核解析之內(nèi)核同步機(jī)制

時(shí)間：2019-11-12 11:23:41

關(guān)鍵字： Linux linux內(nèi)核內(nèi)核同步機(jī)制

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]本文講述了linux內(nèi)核中常見的同步機(jī)制，使讀者掌握每處理器變量和rcu這兩種新的同步機(jī)制。

本文講述了linux內(nèi)核中常見的同步機(jī)制，使讀者掌握每處理器變量和rcu這兩種新的同步機(jī)制。

內(nèi)核同步機(jī)制

內(nèi)核同步主要是同步各執(zhí)行單元對(duì)共享數(shù)據(jù)的訪問，尤其是多處理器的同步。 Linux2.6中內(nèi)核同步機(jī)制主要包括以下幾種：原子操作、信號(hào)量(semaphore)、讀寫信號(hào)量(rw_semaphore)、自旋鎖(spinlock)、大內(nèi)核鎖(BKL)等。

(1)原子操作

原子操作就是指某一個(gè)操作在執(zhí)行過程中不可以被打斷，要么全部執(zhí)行，要不就一點(diǎn)也不執(zhí)行。原子操作需要硬件的支持，與體系結(jié)構(gòu)相關(guān)，使用匯編語言實(shí)現(xiàn)。原子操作主要用于實(shí)現(xiàn)資源計(jì)數(shù)，很多引用計(jì)數(shù)就是通過原子操作實(shí)現(xiàn)。Linux中提供了兩種原子操作接口，分別是原子整數(shù)操作和原子位操作。

原子整數(shù)操作只對(duì)atomic_t類型的數(shù)據(jù)進(jìn)行操作，不能對(duì)C語言的int進(jìn)行操作，使用atomic_t只能將其作為24位數(shù)據(jù)處理，主要是在SPARC體系結(jié)構(gòu)中int的低8為中設(shè)置了一個(gè)鎖，避免對(duì)原子類型數(shù)據(jù)的并發(fā)訪問。原子位操作是針對(duì)由指針變量指定的任意一塊內(nèi)存區(qū)域的位序列的某一位進(jìn)行操作。它只是針對(duì)普通指針的操作，不需要定義一個(gè)與該操作相對(duì)應(yīng)的數(shù)據(jù)類型。

(2)自旋鎖

Linux自旋鎖保證了任意時(shí)刻只能有一個(gè)執(zhí)行線程進(jìn)入臨界區(qū)，其他試圖進(jìn)入臨界區(qū)的線程將一直進(jìn)行嘗試(即自旋)，直到獲得該鎖。自旋鎖主要應(yīng)用在加鎖時(shí)間不長(zhǎng)并且不會(huì)睡眠的情況。

自旋鎖的本質(zhì)是對(duì)內(nèi)存區(qū)域的一個(gè)整數(shù)的操作，任何線程進(jìn)入臨界區(qū)之前都必須檢查該整數(shù)，可用則進(jìn)入，都則一直忙循環(huán)等待。

自旋鎖機(jī)制讓試圖獲得該鎖的線程一直進(jìn)行忙循環(huán)(占用CPU)，因此自旋鎖適合于斷時(shí)間內(nèi)進(jìn)行輕量級(jí)加鎖。而且自旋鎖絕對(duì)不可以遞歸使用，否則會(huì)被自己鎖死。

Linux自旋鎖主要應(yīng)用與多核處理器中，單CPU中不會(huì)進(jìn)行自旋鎖操作。 linux上的自旋鎖有三種實(shí)現(xiàn)：

a. 在單cpu，不可搶占內(nèi)核中，自旋鎖為空操作。

b. 在單cpu，可搶占內(nèi)核中，自旋鎖實(shí)現(xiàn)為“禁止內(nèi)核搶占”，并不實(shí)現(xiàn)“自旋”。

c. 在多cpu，可搶占內(nèi)核中，自旋鎖實(shí)現(xiàn)為“禁止內(nèi)核搶占” + “自旋”。其中，禁止內(nèi)核搶占只是關(guān)閉“可搶占標(biāo)志”，而不是禁止進(jìn)程切換。顯式使用schedule或進(jìn)程阻塞(此也會(huì)導(dǎo)致調(diào)用schedule)時(shí)，還是會(huì)發(fā)生進(jìn)程調(diào)度的。

(3)讀/寫自旋鎖

Linux中規(guī)定，讀/寫自旋鎖允許多個(gè)線程同時(shí)以只讀的方式訪問臨界資源，只有當(dāng)一個(gè)線程想更新數(shù)據(jù)時(shí)，才會(huì)互斥訪問資源。讀寫自旋鎖包括一個(gè)24位讀者計(jì)數(shù)和一個(gè)解鎖標(biāo)記來實(shí)現(xiàn)的。

(4)信號(hào)量

Linux中提供了兩種信號(hào)量：

a. 內(nèi)核信號(hào)量，由內(nèi)核程序使用

b. System V IPC 信號(hào)量，由用戶進(jìn)程使用

當(dāng)一個(gè)線程去請(qǐng)求以不可用的信號(hào)量時(shí)，和自旋鎖不同，該進(jìn)程會(huì)進(jìn)入睡眠(不再占用CPU)，加入到等待隊(duì)列中，直到被喚醒，所以只有可睡眠的狀態(tài)才可以使用信號(hào)量。信號(hào)量實(shí)現(xiàn)的結(jié)構(gòu)體semphore中有一變量count計(jì)數(shù)。根據(jù)count取值的設(shè)定，信號(hào)量可以分為二元信號(hào)量和計(jì)數(shù)信號(hào)量，當(dāng)count初值為1時(shí)，則為二元信號(hào)量。計(jì)數(shù)信號(hào)量允許任意數(shù)量的鎖持有者，這點(diǎn)和自旋鎖是不同的(自旋鎖只允許一個(gè))。

(5)讀/寫信號(hào)量

讀寫信號(hào)量實(shí)際上對(duì)于讀者使用的是一個(gè)計(jì)數(shù)信號(hào)量，寫者使用的是二元信號(hào)量。讀寫信號(hào)量同讀寫自旋鎖一樣提高了內(nèi)核的并發(fā)度。

Linux內(nèi)核時(shí)按照先進(jìn)先出(FIFO)的順序來處理等待讀寫信號(hào)量的進(jìn)程。具體過程是如果一個(gè)進(jìn)程試圖獲取一個(gè)不可用的信號(hào)量時(shí)，加入到等待隊(duì)列的末尾，當(dāng)信號(hào)量可用時(shí)，內(nèi)核首先喚醒等待隊(duì)列的第一個(gè)進(jìn)程，如果該進(jìn)程為寫進(jìn)程，那么該進(jìn)程獲得信號(hào)量。如果該進(jìn)程如果為一個(gè)讀進(jìn)程，那么其后的所有的讀進(jìn)程都可以被喚醒并獲得信號(hào)量，但是中間不能跳躍。

(6)BKL(Big Kernel Lock)

BKL即全局內(nèi)核鎖，也稱大內(nèi)核鎖，它是一個(gè)全局自旋鎖。大內(nèi)核鎖也是用來保護(hù)臨界區(qū)資源的，避免出現(xiàn)多個(gè)處理器上的進(jìn)程同時(shí)訪問同一區(qū)域，整個(gè)內(nèi)核中只有一個(gè)大內(nèi)核鎖。 BKL是一個(gè)名為kernel_flag的自旋鎖，持有該鎖的進(jìn)程仍可以睡眠，當(dāng)睡眠時(shí)持有的鎖將被自動(dòng)釋放，該進(jìn)程被喚醒時(shí)重新持有該鎖。Linux允許一個(gè)進(jìn)程可以遞歸的持有BKL，BKL是一個(gè)遞歸鎖。

它的設(shè)計(jì)思想是，一旦某個(gè)內(nèi)核路徑獲取了這把鎖，那么其他所有的內(nèi)核路徑都不能再獲取到這把鎖。自旋鎖加鎖的對(duì)象一般是一個(gè)全局變量，大內(nèi)核鎖加鎖的對(duì)象是一段代碼，里面可能包含多個(gè)全局變量。那么他帶來的問題是，雖然A只需要互斥訪問全局變量a，但附帶鎖了全局變量b，從而導(dǎo)致B不能訪問b了

(7)屏障

屏障或稱內(nèi)存屏障，是用來解決內(nèi)存同步問題的，具體為對(duì)由于編譯器的優(yōu)化和緩存的使用，導(dǎo)致對(duì)內(nèi)存的寫入操作不能及時(shí)的反應(yīng)出來，也就是說當(dāng)完成對(duì)內(nèi)存的寫入操作之后，讀取出來的可能是舊的內(nèi)容的一種解決機(jī)制。

內(nèi)存屏障分類：

a.編譯器引起的內(nèi)存屏障 b.緩存引起的內(nèi)存屏障 c.亂序執(zhí)行引起的內(nèi)存屏障