Linux 進程創(chuàng)建

時間：2018-07-13 18:00:02

關鍵字： Linux 進程

手機看文章

掃描二維碼
隨時隨地手機看文章

作者：李智敏,華清遠見嵌入式學院上海分中心講師。

在 Linux 內(nèi)核內(nèi)，進程是由相當大的一個稱為 task_STruct 的結(jié)構(gòu)表示的。此結(jié)構(gòu)包含所有表示此進程所必需的數(shù)據(jù)，此外，還包含了大量的其他數(shù)據(jù)用來統(tǒng)計（accounTIng）和維護與其他進程的關系（父和子）。下面給出了 task_struct 的一小部分。task_struct 位于 ./linux/include/linux/sched.h。

struct task_struct {

volatile lONg state;

void *stack;

unsigned int flags;

int prio, static_prio;

struct list_head tasks;

struct mm_struct *mm, *active_mm;

pid_t pid;

pid_t tgid;

struct task_struct *real_parent;

char comm[TASK_COMM_LEN];

struct thread_struct thread;

struct files_struct *files;

...

};

在task_struct中，可以看到幾個預料之中的項，比如執(zhí)行的狀態(tài)、堆棧、一組標志、父進程、執(zhí)行的線程（可以有很多）以及開放文件。對其做簡單聲明如下

<1> state 變量是一些表明任務狀態(tài)的比特位。最常見的狀態(tài)有：

1．TASK_RUNNING 表示進程正在運行，或是排在運行隊列中正要運行

2．TASK_INTERRUPTIBLE 表示進程正在休眠

3．TASK_UNINTERRUPTIBLE 表示進程正在休眠但不能叫醒

4．TASK_STOPPED 表示進程停止

注：這些標志的完整列表可以在 ./linux/include/linux/sched.h 內(nèi)找到。

<2> flags 定義了很多指示符，表明進程是否正在被創(chuàng)建（PF_STARTING）或退出（PF_EXITING），或是進程當前是否在分配內(nèi)存（PF_MEMALLOC）。

<3> 每個進程都會被賦予優(yōu)先級（稱為 static_prio），但進程的實際優(yōu)先級是基于加載以及其他幾個因素動態(tài)決定的。優(yōu)先級值越低，實際的優(yōu)先級越高。

<4> tasks 字段提供了鏈接列表的能力。它包含一個 prev 指針（指向前一個任務）和一個 next 指針（指向下一個任務）。

<5> 進程的地址空間由 mm 和 active_mm 字段表示。mm 代表的是進程的內(nèi)存描述符，而 active_mm 則是前一個進程的內(nèi)存描述符（為改進上下文切換時間的一種優(yōu)化）。

<6> 可執(zhí)行程序的名稱（不包含路徑）占用 comm（命令）字段。

<7> thread_struct 則用來標識進程的存儲狀態(tài)。此元素依賴于 Linux 在其上運行的特定架構(gòu)，在 ./linux/include/asm-i386/processor.h 內(nèi)有這樣的一個例子。在此結(jié)構(gòu)內(nèi)，可以找到該進程自執(zhí)行上下文切換后的存儲（硬件注冊表、程序計數(shù)器等）。

在很多情況下，進程都是動態(tài)創(chuàng)建并由一個動態(tài)分配的 task_struct 表示。當然 init 進程例外，它總是存在并由一個靜態(tài)分配的 task_struct 表示。

Linux 內(nèi)所有進程的分配有兩種方式。第一種方式是通過一個哈希表，由 PID 值進行哈希計算得到；第二種方式是通過雙鏈循環(huán)表。循環(huán)表非常適合于對任務列表進行迭代。由于列表是循環(huán)的，沒有頭或尾；但是由于 init_task 總是存在，所以可以將其用作繼續(xù)向前迭代的一個錨點。

任務列表無法從用戶空間訪問，但該問題很容易解決，方法是以模塊形式向內(nèi)核內(nèi)插入代碼。例如通過如下代碼，它會迭代任務列表并會提供有關每個任務的少量信息（name、pid 和 parent 名）。

struct task_struct *task = &init_task;

/* Walk through the task list, until we hit the init_task again */

do {

printk( KERN_INFO "*** %s [%d] parent %s\n",

task->comm, task->pid, task->parent->comm );

} while ( (task = next_task(task)) != &init_task );

注意，還可以標識當前正在運行的任務。Linux 維護一個稱為 current 的符號，代表的是當前運行的進程（類型是 task_struct）。為此可使用如下代碼：

printk( KERN_INFO, "Current task is %s [%d]”, current->comm, current->pid );

Linux創(chuàng)建用戶空間進程的情況與內(nèi)核空間進程類似。二者底層機制是一致的，因為最終都會依賴于一個名為 do_fork 的函數(shù)來創(chuàng)建新進程。

在創(chuàng)建內(nèi)核線程時，內(nèi)核會調(diào)用一個名為 kernel_thread 的函數(shù)（參見 ./linux/arch/i386/kernel/process.c），此函數(shù)執(zhí)行某些初始化后會調(diào)用 do_fork。

在用戶空間，一個程序會調(diào)用 fork，這會導致對名為 sys_fork 的內(nèi)核函數(shù)的系統(tǒng)調(diào)用（參見 ./linux/arch/i386/kernel/process.c）。

do_fork 是進程創(chuàng)建的基礎?？梢栽?./linux/kernel/fork.c 內(nèi)找到 do_fork 函數(shù)（以及相關函數(shù) copy_process）。

do_fork 函數(shù)首先調(diào)用 alloc_pidmap，該調(diào)用會分配一個新的 PID。接下來，do_fork 檢查調(diào)試器是否在跟蹤父進程。如果是，在 clone_flags 內(nèi)設置 CLONE_PTRACE 標志以做好執(zhí)行 fork 操作的準備。之后 do_fork 函數(shù)還會調(diào)用 copy_process，向其傳遞這些標志、堆棧、注冊表、父進程以及最新分配的 PID。

新的進程在 copy_process 函數(shù)內(nèi)作為父進程的一個副本創(chuàng)建。此函數(shù)能執(zhí)行除啟動進程之外的所有操作，啟動進程在之后進行處理。copy_process 內(nèi)的第一步是驗證 CLONE 標志以確保這些標志是一致的。如果不一致，就會返回 EINVAL 錯誤。接下來，詢問 Linux Security Module (LSM) 看當前任務是否可以創(chuàng)建一個新任務。

接下來，調(diào)用 dup_task_struct 函數(shù)（./linux/kernel/fork.c ），這會分配一個新 task_struct 并將當前進程的描述符復制到其內(nèi)。在新的線程堆棧設置好后，一些狀態(tài)信息也會被初始化，并且會將控制返回給 copy_process?？刂苹氐?copy_process 后，除了其他幾個限制和安全檢查之外，還會執(zhí)行一些常規(guī)管理，包括在新 task_struct 上的各種初始化。之后，會調(diào)用一系列復制函數(shù)來復制此進程的各個方面，比如復制開放文件描述符（copy_files）、復制符號信息（copy_sighand 和 copy_signal）、復制進程內(nèi)存（copy_mm）以及最終復制線程（copy_thread）。

之后，這個新任務會被指定給一個處理程序，同時對允許執(zhí)行進程的處理程序進行額外的檢查（cpus_allowed）。新進程的優(yōu)先級從父進程的優(yōu)先級繼承后，執(zhí)行一小部分額外的常規(guī)管理，而且控制也會被返回給 do_fork。在此時，新進程存在但尚未運行。do_fork 函數(shù)通過調(diào)用 wake_up_new_task 來修復此問題。此函數(shù)（./linux/kernel/sched.c ）初始化某些調(diào)度程序的常規(guī)管理信息，將新進程放置在運行隊列之內(nèi)，然后將其喚醒以便執(zhí)行。最后，一旦返回至 do_fork，此 PID 值即被返回給調(diào)用程序，進程完成。

“本文由華清遠見http://www.embedu.org/index.htm提供”

華清遠見