Linux 中的各種棧:進(jìn)程棧 線程棧 內(nèi)核棧 中斷棧
棧是什么?棧有什么作用?
首先,棧 (stack) 是一種串列形式的 數(shù)據(jù)結(jié)構(gòu)。這種數(shù)據(jù)結(jié)構(gòu)的特點(diǎn)是 后入先出 (LIFO, Last In First Out),數(shù)據(jù)只能在串列的一端 (稱為:棧頂 top) 進(jìn)行 推入 (push) 和 彈出 (pop) 操作。根據(jù)棧的特點(diǎn),很容易的想到可以利用數(shù)組,來(lái)實(shí)現(xiàn)這種數(shù)據(jù)結(jié)構(gòu)。但是本文要討論的并不是軟件層面的棧,而是硬件層面的棧。大多數(shù)的處理器架構(gòu),都有實(shí)現(xiàn)硬件棧。有專門的棧指針寄存器,以及特定的硬件指令來(lái)完成 入棧/出棧 的操作。例如在 ARM 架構(gòu)上,R13 (SP) 指針是堆棧指針寄存器,而 PUSH 是用于壓棧的匯編指令,POP 則是出棧的匯編指令。【擴(kuò)展閱讀】ARM 寄存器簡(jiǎn)介ARM 處理器擁有 37 個(gè)寄存器。這些寄存器按部分重疊組方式加以排列。每個(gè)處理器模式都有一個(gè)不同的寄存器組。編組的寄存器為處理處理器異常和特權(quán)操作提供了快速的上下文切換。提供了下列寄存器:上面是棧的原理和實(shí)現(xiàn),下面我們來(lái)看看棧有什么作用。棧作用可以從兩個(gè)方面體現(xiàn):函數(shù)調(diào)用 和 多任務(wù)支持 。
- 三十個(gè) 32 位通用寄存器:
- 存在十五個(gè)通用寄存器,它們分別是 r0-r12、sp、lr
- sp (r13) 是堆棧指針。C/C 編譯器始終將 sp 用作堆棧指針
- lr (r14) 用于存儲(chǔ)調(diào)用子例程時(shí)的返回地址。如果返回地址存儲(chǔ)在堆棧上,則可將 lr 用作通用寄存器
- 程序計(jì)數(shù)器 (pc):指令寄存器
- 應(yīng)用程序狀態(tài)寄存器 (APSR):存放算術(shù)邏輯單元 (ALU) 狀態(tài)標(biāo)記的副本
- 當(dāng)前程序狀態(tài)寄存器 (CPSR):存放 APSR 標(biāo)記,當(dāng)前處理器模式,中斷禁用標(biāo)記等
- 保存的程序狀態(tài)寄存器 (SPSR):當(dāng)發(fā)生異常時(shí),使用 SPSR 來(lái)存儲(chǔ) CPSR
一、函數(shù)調(diào)用
我們知道一個(gè)函數(shù)調(diào)用有以下三個(gè)基本過程:- 調(diào)用參數(shù)的傳入
- 局部變量的空間管理
- 函數(shù)返回
【擴(kuò)展閱讀】:函數(shù)棧幀 (Stack Frame)函數(shù)調(diào)用經(jīng)常是嵌套的,在同一時(shí)刻,棧中會(huì)有多個(gè)函數(shù)的信息。每個(gè)未完成運(yùn)行的函數(shù)占用一個(gè)獨(dú)立的連續(xù)區(qū)域,稱作棧幀(Stack Frame)。棧幀存放著函數(shù)參數(shù),局部變量及恢復(fù)前一棧幀所需要的數(shù)據(jù)等,函數(shù)調(diào)用時(shí)入棧的順序?yàn)椋?/p>實(shí)參N~1 → 主調(diào)函數(shù)返回地址 → 主調(diào)函數(shù)幀基指針EBP → 被調(diào)函數(shù)局部變量1~N棧幀的邊界由 棧幀基地址指針 EBP 和 棧指針 ESP 界定,EBP 指向當(dāng)前棧幀底部(高地址),在當(dāng)前棧幀內(nèi)位置固定;ESP指向當(dāng)前棧幀頂部(低地址),當(dāng)程序執(zhí)行時(shí)ESP會(huì)隨著數(shù)據(jù)的入棧和出棧而移動(dòng)。因此函數(shù)中對(duì)大部分?jǐn)?shù)據(jù)的訪問都基于EBP進(jìn)行。函數(shù)調(diào)用棧的典型內(nèi)存布局如下圖所示:
二、多任務(wù)支持
然而棧的意義還不只是函數(shù)調(diào)用,有了它的存在,才能構(gòu)建出操作系統(tǒng)的多任務(wù)模式。我們以 main 函數(shù)調(diào)用為例,main 函數(shù)包含一個(gè)無(wú)限循環(huán)體,循環(huán)體中先調(diào)用 A 函數(shù),再調(diào)用 B 函數(shù)。func?B():
??return;
func?A():
??B();
func?main():
??while?(1)
????A();
試想在單處理器情況下,程序?qū)⒂肋h(yuǎn)停留在此 main 函數(shù)中。即使有另外一個(gè)任務(wù)在等待狀態(tài),程序是沒法從此 main 函數(shù)里面跳轉(zhuǎn)到另一個(gè)任務(wù)。因?yàn)槿绻呛瘮?shù)調(diào)用關(guān)系,本質(zhì)上還是屬于 main 函數(shù)的任務(wù)中,不能算多任務(wù)切換。此刻的 main 函數(shù)任務(wù)本身其實(shí)和它的棧綁定在了一起,無(wú)論如何嵌套調(diào)用函數(shù),棧指針都在本棧范圍內(nèi)移動(dòng)。由此可以看出一個(gè)任務(wù)可以利用以下信息來(lái)表征:- main 函數(shù)體代碼
- main 函數(shù)棧指針
- 當(dāng)前 CPU 寄存器信息
【擴(kuò)展閱讀】:任務(wù)、線程、進(jìn)程 三者關(guān)系任務(wù)是一個(gè)抽象的概念,即指軟件完成的一個(gè)活動(dòng);而線程則是完成任務(wù)所需的動(dòng)作;進(jìn)程則指的是完成此動(dòng)作所需資源的統(tǒng)稱;關(guān)于三者的關(guān)系,有一個(gè)形象的比喻:
- 任務(wù) = 送貨
- 線程 = 開送貨車
- 系統(tǒng)調(diào)度 = 決定合適開哪部送貨車
- 進(jìn)程 = 道路 加油站 送貨車 修車廠
Linux 中有幾種棧?各種棧的內(nèi)存位置?
介紹完棧的工作原理和用途作用后,我們回歸到 Linux 內(nèi)核上來(lái)。內(nèi)核將棧分成四種:- 進(jìn)程棧
- 線程棧
- 內(nèi)核棧
- 中斷棧
一、進(jìn)程棧
進(jìn)程棧是屬于用戶態(tài)棧,和進(jìn)程 虛擬地址空間 (Virtual Address Space) 密切相關(guān)。那我們先了解下什么是虛擬地址空間:在 32 位機(jī)器下,虛擬地址空間大小為 4G。這些虛擬地址通過頁(yè)表 (Page Table) 映射到物理內(nèi)存,頁(yè)表由操作系統(tǒng)維護(hù),并被處理器的內(nèi)存管理單元 (MMU) 硬件引用。每個(gè)進(jìn)程都擁有一套屬于它自己的頁(yè)表,因此對(duì)于每個(gè)進(jìn)程而言都好像獨(dú)享了整個(gè)虛擬地址空間。Linux 內(nèi)核將這 4G 字節(jié)的空間分為兩部分,將最高的 1G 字節(jié)(0xC0000000-0xFFFFFFFF)供內(nèi)核使用,稱為 內(nèi)核空間。而將較低的3G字節(jié)(0x00000000-0xBFFFFFFF)供各個(gè)進(jìn)程使用,稱為 用戶空間。每個(gè)進(jìn)程可以通過系統(tǒng)調(diào)用陷入內(nèi)核態(tài),因此內(nèi)核空間是由所有進(jìn)程共享的。雖然說(shuō)內(nèi)核和用戶態(tài)進(jìn)程占用了這么大地址空間,但是并不意味它們使用了這么多物理內(nèi)存,僅表示它可以支配這么大的地址空間。它們是根據(jù)需要,將物理內(nèi)存映射到虛擬地址空間中使用。Linux 對(duì)進(jìn)程地址空間有個(gè)標(biāo)準(zhǔn)布局,地址空間中由各個(gè)不同的內(nèi)存段組成 (Memory Segment),主要的內(nèi)存段如下:- 程序段 (Text Segment):可執(zhí)行文件代碼的內(nèi)存映射
- 數(shù)據(jù)段 (Data Segment):可執(zhí)行文件的已初始化全局變量的內(nèi)存映射
- BSS段 (BSS Segment):未初始化的全局變量或者靜態(tài)變量(用零頁(yè)初始化)
- 堆區(qū) (Heap) : 存儲(chǔ)動(dòng)態(tài)內(nèi)存分配,匿名的內(nèi)存映射
- 棧區(qū) (Stack) : 進(jìn)程用戶空間棧,由編譯器自動(dòng)分配釋放,存放函數(shù)的參數(shù)值、局部變量的值等
- 映射段(Memory Mapping Segment):任何內(nèi)存映射文件
而上面進(jìn)程虛擬地址空間中的棧區(qū),正指的是我們所說(shuō)的進(jìn)程棧。進(jìn)程棧的初始化大小是由編譯器和鏈接器計(jì)算出來(lái)的,但是棧的實(shí)時(shí)大小并不是固定的,Linux 內(nèi)核會(huì)根據(jù)入棧情況對(duì)棧區(qū)進(jìn)行動(dòng)態(tài)增長(zhǎng)(其實(shí)也就是添加新的頁(yè)表)。但是并不是說(shuō)棧區(qū)可以無(wú)限增長(zhǎng),它也有最大限制 RLIMIT_STACK (一般為 8M),我們可以通過 ulimit 來(lái)查看或更改 RLIMIT_STACK 的值。
【擴(kuò)展閱讀】:如何確認(rèn)進(jìn)程棧的大小我們要知道棧的大小,那必須得知道棧的起始地址和結(jié)束地址。棧起始地址 獲取很簡(jiǎn)單,只需要嵌入?yún)R編指令獲取棧指針 esp 地址即可。棧結(jié)束地址 的獲取有點(diǎn)麻煩,我們需要先利用遞歸函數(shù)把棧搞溢出了,然后再 GDB 中把棧溢出的時(shí)候把棧指針 esp 打印出來(lái)即可。代碼如下:
/*?file?name:?stacksize.c?*/
void?*orig_stack_pointer;
void?blow_stack()?{
????blow_stack();
}
int?main()?{
????__asm__("movl?%esp,?orig_stack_pointer");
????blow_stack();
????return?0;
}
$ g -g stacksize.c -o ./stacksize
$ gdb ./stacksize
(gdb) r
Starting program: /home/home/misc-code/setrlimit
Program received signal SIGSEGV, Segmentation fault.
blow_stack () at setrlimit.c:4
4 blow_stack();
(gdb) print (void *)$esp
$1 = (void *) 0xffffffffff7ff000
(gdb) print (void *)orig_stack_pointer
$2 = (void *) 0xffffc800
(gdb) print 0xffffc800-0xff7ff000
$3 = 8378368 // Current Process Stack Size is 8M
上面對(duì)進(jìn)程的地址空間有個(gè)比較全局的介紹,那我們看下 Linux 內(nèi)核中是怎么體現(xiàn)上面內(nèi)存布局的。內(nèi)核使用內(nèi)存描述符來(lái)表示進(jìn)程的地址空間,該描述符表示著進(jìn)程所有地址空間的信息。內(nèi)存描述符由 mm_struct 結(jié)構(gòu)體表示,下面給出內(nèi)存描述符結(jié)構(gòu)中各個(gè)域的描述,請(qǐng)大家結(jié)合前面的 進(jìn)程內(nèi)存段布局 圖一起看:struct?mm_struct?{
????struct?vm_area_struct?*mmap;???????????/*?內(nèi)存區(qū)域鏈表?*/
????struct?rb_root?mm_rb;??????????????????/*?VMA?形成的紅黑樹?*/
????...
????struct?list_head?mmlist;???????????????/*?所有?mm_struct?形成的鏈表?*/
????...
????unsigned?long?total_vm;????????????????/*?全部頁(yè)面數(shù)目?*/
????unsigned?long?locked_vm;???????????????/*?上鎖的頁(yè)面數(shù)據(jù)?*/
????unsigned?long?pinned_vm;???????????????/*?Refcount?permanently?increased?*/
????unsigned?long?shared_vm;???????????????/*?共享頁(yè)面數(shù)目?Shared?pages?(files)?*/
????unsigned?long?exec_vm;?????????????????/*?可執(zhí)行頁(yè)面數(shù)目?VM_EXEC?