目錄
-
bootloader 跳轉(zhuǎn)到操作系統(tǒng)
-
操作系統(tǒng)跳轉(zhuǎn)到應(yīng)用程序
-
應(yīng)用程序調(diào)用操作系統(tǒng)中的函數(shù)
不論是在x86平臺上,還是在嵌入式平臺上,系統(tǒng)的啟動一般都經(jīng)歷了
bootloader 到
操作系統(tǒng),再到
應(yīng)用程序,這樣的三級跳過程。
每一個相互交接的過程,都是我們學(xué)習(xí)的重點。
這篇文章,我們?nèi)匀灰詘86平臺為例,一起來看一下:
從上電之后,系統(tǒng)是如何一步一步的進入應(yīng)用程序的入口地址。
bootloader 跳轉(zhuǎn)到操作系統(tǒng)
在上一篇文章中,討論了bootloader在進入保護模式之后,在地址0x0001_0000處創(chuàng)建了
全局描述符表(GDT),表中創(chuàng)建了3個段描述符:
只要在GDT中創(chuàng)建了這3個描述符,然后把GDT的地址(eg: 0x0001_0000)設(shè)置到GDTR寄存器中,此時就可以進入保護模式工作了(設(shè)置CR0寄存器的bit0為1)。
之前的第6篇文章中Linux從頭學(xué)06:16張結(jié)構(gòu)圖,徹底理解【代碼重定位】的底層原理,我們是假設(shè)bootloader把操作系統(tǒng)程序讀取到內(nèi)存0x0002_0000的位置,這里繼續(xù)使用這個示例:
關(guān)于文件頭header的內(nèi)容,與實模式下是不同的。
在實模式下,header的布局如下圖:
bootloader在把操作系統(tǒng),從硬盤加載到內(nèi)存中之后,從header中取得3個段的匯編地址(即:段的開始地址相對于文件開始的偏移量),然后計算得到段的
基地址,最后把段基地址寫回到header的這3個段地址空間中。
這樣的話,操作系統(tǒng)開始執(zhí)行時,就可以從header中準確的獲取到每一個段的
基地址了,然后就可以設(shè)置相應(yīng)的段寄存器,進入正確的執(zhí)行上下文了。
那么在
保護模式下呢,操作系統(tǒng)需要的就
不是段的基地址了,
而是要獲取到每一個段的描述符才行。
很顯然,需要借助bootloader才可以完成這個目標,也就是:
-
在 GDT 中為操作系統(tǒng)程序中的三個段,建立相應(yīng)的描述符;
-
把每一個段的描述符索引號,寫回到操作系統(tǒng)程序的 header 中;
注意:
這里描述的僅僅是一個
可能的過程,主要用來理解原理。
有些系統(tǒng)可以用不同的實現(xiàn)方式,例如:在進入操作系統(tǒng)之后,在
另外一個位置存放GDT,并重新創(chuàng)建其中的段描述符。
操作系統(tǒng)的 header 布局
既然header需要作為媒介,來接收bootloader往其中寫入段索引號,所以bootloader與OS就要協(xié)商好,
寫在什么位置?
可以按照之前的方式,直接覆寫在每個段的匯編地址位置,也可以寫在其他的位置,例如:
其中,最后的3個位置可以用來接收操作系統(tǒng)的三個段索引號。
建立操作系統(tǒng)的三個段描述符
bootloader把OS加載到內(nèi)存中之后,會解析OS的header中數(shù)據(jù),得到每個段的
基地址以及界限。
雖然header中沒有明確的記錄每個段的界限,可以根據(jù)下一個段的開始地址,來計算得到上一個段的長度。
我們可以聯(lián)想一下:
現(xiàn)代Linux系統(tǒng)中ELF文件的格式,在文件頭部中記錄了每一個段的長度,具體解析請參考這篇文章:Linux系統(tǒng)中編譯、鏈接的基石-ELF文件:扒開它的層層外衣,從字節(jié)碼的粒度來探索。
此時,bootloader就可以利用這幾個信息:段基地址、界限、類型以及其他屬性,來構(gòu)造出相應(yīng)的段描述符了(下圖橙色部分):
PS:這里的示例只為操作系統(tǒng)創(chuàng)建了 3 個段描述符,實際情況也許有更多的段。
OS段描述符建立之后,bootloader再把這3個段描述符在GDT中的索引號,填寫到OS的header中相應(yīng)的位置:
上圖中,“入口地址”下面的那個4,本質(zhì)上是不需要的,加上更有好處,好處如下:
當(dāng)從bootloader跳入到操作系統(tǒng)的入口地址時,需要告訴處理器兩件事情:
-
代碼段的索引號;
-
代碼的入口地址;
因此,把入口地址和索引號
放在一起,有助于bootloader直接使用跳轉(zhuǎn)語句,進入到OS的start標記處開始執(zhí)行。
操作系統(tǒng)跳轉(zhuǎn)到應(yīng)用程序
從現(xiàn)代操作系統(tǒng)來看,這個標題是有
錯誤的:
操作系統(tǒng)是應(yīng)用程序的下層支撐,相當(dāng)于是應(yīng)用程序的runtime,怎么能叫做
跳轉(zhuǎn)到應(yīng)用程序呢?
其實我想表達的意思是:
操作系統(tǒng)是如何加載、執(zhí)行一個應(yīng)用程序的。
既然是保護模式,那么操作系統(tǒng)就承擔(dān)起重要的職責(zé):
保護系統(tǒng)不會受到每一個應(yīng)用程序的惡意破壞!
因此,操作系統(tǒng):把應(yīng)用程序從硬盤上復(fù)制到內(nèi)存中
之后,跳入應(yīng)用程序的第一條指令
之前,需要為應(yīng)用程序分配好內(nèi)存資源:
-
代碼段的基地址、界限、類型和權(quán)限等信息;
-
數(shù)據(jù)段的基地址、界限、類型和權(quán)限等信息;
-
棧段的基地址、界限、類型和權(quán)限等信息;
以上這些信息,都以段描述符的形式,創(chuàng)建在GDT中。
PS: 在現(xiàn)代操作系統(tǒng)中,應(yīng)用程序都會有一個自己
私有的局部描述符表 LDT,專門存儲應(yīng)用程序自己的段描述符。
還記得之前討論過的下面這張圖嗎?
段寄存器的bit2位TI標志,就說明了需要到GDT中查找段描述符?還是到LDT中去查找?
為了方便起見,我們就把所有的段描述符都放在GDT中。
就猶如bootloader為OS創(chuàng)建段描述符一樣,OS也以同樣的步驟為應(yīng)用程序來創(chuàng)建每一個段描述符。
此時的GDT就是下面這樣:
從這張圖中已經(jīng)可以看出一個
問題了:
如果所有應(yīng)用程序的段描述符都放在全局的GDT中,當(dāng)應(yīng)用程序結(jié)束之后,還得去更新GDT,勢必給操作系統(tǒng)的代碼帶來很多麻煩。
因此,更合理的方式應(yīng)該是放在應(yīng)用程序私有的LDT中,這個問題,以后還會進一步討論到。
不管怎樣,OS 啟動應(yīng)用程序的
整體流程如下:
-
操作系統(tǒng)把應(yīng)用程序讀取到內(nèi)存中的某個空閑位置;
-
操作系統(tǒng)分析應(yīng)用程序 header 部分的信息;
-
操作系統(tǒng)為應(yīng)用程序創(chuàng)建每一個段描述符,并且把索引號寫回到 header 中;
-
跳轉(zhuǎn)到應(yīng)用程序的入口地址,應(yīng)用程序從 header 中獲取到每個段索引號,設(shè)置好自己的執(zhí)行上下文(即:設(shè)置好各種寄存器);
應(yīng)用程序調(diào)用操作系統(tǒng)中的函數(shù)
這里的函數(shù)可以理解成
系統(tǒng)調(diào)用,也就是操作系統(tǒng)為所有的應(yīng)用程序提供的公共函數(shù)。
在Linux系統(tǒng)中,系統(tǒng)調(diào)用是通過
中斷來實現(xiàn)的,在中斷處理器程序中,再通過一個寄存器來標識:當(dāng)前應(yīng)用程序想調(diào)用哪一個系統(tǒng)函數(shù),也就是說:
每一個系統(tǒng)函數(shù)都有一個固定的數(shù)字編號。
再回到我們當(dāng)前討論的x86處理器中,操作系統(tǒng)提供系統(tǒng)函數(shù)的最簡單的方法就是:
把所有的系統(tǒng)函數(shù)都放在一個
單獨的代碼段中,把這個段的
索引號以及每一個系統(tǒng)函數(shù)的
偏移地址告訴應(yīng)用程序。
這樣的話,應(yīng)用程序就可以通過這2個信息調(diào)用到系統(tǒng)函數(shù)了。
假如:有2個系統(tǒng)函數(shù)os_func1和os_func2,放在一個獨立的段中:
既然OS中多了一個代碼段,那么bootloader就需要幫助它在GDT中多創(chuàng)建一個段描述符:
在應(yīng)用程序的header中,預(yù)留一個足夠大的空間來存放每一個系統(tǒng)函數(shù)的跳轉(zhuǎn)信息(系統(tǒng)函數(shù)的
段索引號和函數(shù)的
偏移地址):
應(yīng)用程序有了這個信息之后,當(dāng)需要調(diào)用os_func1時,就直接跳轉(zhuǎn)到相應(yīng)的
段索引號:函數(shù)偏移地址,就可以調(diào)用到這個系統(tǒng)函數(shù)了。
這里同樣的會引出2個問題:
-
如果操作系統(tǒng)提供的系統(tǒng)函數(shù)很多,應(yīng)用程序也很多,那么操作系統(tǒng)在加載每一個應(yīng)用程序時,豈不是要忙死了?而且應(yīng)用程序也不知道應(yīng)該保留多大的空間來存放這些系統(tǒng)函數(shù)的跳轉(zhuǎn)信息;
-
在執(zhí)行系統(tǒng)函數(shù)時,此時代碼段、數(shù)據(jù)段都是屬于操作系統(tǒng)的勢力范圍,但是棧基址和棧頂指針使用的仍然是應(yīng)用程序擁有的棧,這樣合理嗎?
對于第一個問題,所以Linux中通過中斷,提供一個統(tǒng)一的調(diào)用入口地址,然后通過一個寄存器來區(qū)分是哪一個函數(shù)。
對于第二個問題,Linux在加載每一個應(yīng)用程序時,會在內(nèi)核中建立與該應(yīng)用程序相關(guān)的數(shù)據(jù)結(jié)構(gòu),并且在內(nèi)核中創(chuàng)建一塊內(nèi)存空間,
專門用作:從這個應(yīng)用程序跳轉(zhuǎn)到內(nèi)核中執(zhí)行代碼時,所使用的??臻g。
但是,還有一些問題依然存在,例如:
-
應(yīng)用程序雖然可以調(diào)用操作系統(tǒng)提供的函數(shù)了,但是操作系統(tǒng)如何對內(nèi)核代碼進行保護?;
-
Linux 為應(yīng)用程序建立內(nèi)部棧的底層支撐是什么?
這就涉及到 x86 中復(fù)雜的
特權(quán)級的相關(guān)內(nèi)容了,下一篇文章,我們就向這些細節(jié)問題繼續(xù)探索。
------ End ------