當(dāng)前位置:首頁(yè) > 嵌入式 > 嵌入式軟件
[導(dǎo)讀]本文旨在介紹一種解讀linux內(nèi)核源碼的入門(mén)方法,而不是解說(shuō)linux復(fù)雜的內(nèi)核機(jī)制

針對(duì)好多Linux 愛(ài)好者對(duì)內(nèi)核很有興趣卻無(wú)從下口,本文旨在介紹一種解讀linux內(nèi)核源碼的入門(mén)方法,而不是解說(shuō)linux復(fù)雜的內(nèi)核機(jī)制;

一.核心源程序的文件組織:

1.Linux核心源程序通常都安裝在/usr/src/linux下,而且它有一個(gè)非常簡(jiǎn)單的編號(hào)約定:任何偶數(shù)的核心(例如2.0.30)都是一個(gè)穩(wěn)定地發(fā)行的核心,而任何奇數(shù)的核心(例如2.1.42)都是一個(gè)開(kāi)發(fā)中的核心。

本文基于穩(wěn)定的2.2.5源代碼,第二部分的實(shí)現(xiàn)平臺(tái)為 Redhat Linux 6.0。

2.核心源程序的文件按樹(shù)形結(jié)構(gòu)進(jìn)行組織,在源程序樹(shù)的最上層你會(huì)看到這樣一些目錄:

●Arch :arch子目錄包括了所有和體系結(jié)構(gòu)相關(guān)的核心代碼。它的每一個(gè)子目錄都代表一種支持的體系結(jié)構(gòu),例如i386就是關(guān)于intel cpu及與之相兼容體系結(jié)構(gòu)的子目錄。PC機(jī)一般都基于此目錄;

●Include: include子目錄包括編譯核心所需要的大部分頭文件。與平臺(tái)無(wú)關(guān)的頭文件在 include/linux子目錄下,與 intel cpu相關(guān)的頭文件在include/asm-i386子目錄下,而include/scsi目錄則是有關(guān)scsi設(shè)備的頭文件目錄;

●Init: 這個(gè)目錄包含核心的初始化代碼(注:不是系統(tǒng)的引導(dǎo)代碼),包含兩個(gè)文件main.c和Version.c,這是研究核心如何工作的一個(gè)非常好的起點(diǎn)。

●Mm :這個(gè)目錄包括所有獨(dú)立于 cpu 體系結(jié)構(gòu)的內(nèi)存管理代碼,如頁(yè)式存儲(chǔ)管理內(nèi)存的分配和釋放等;而和體系結(jié)構(gòu)相關(guān)的內(nèi)存管理代碼則位于arch/*/mm/,例如arch/i386/mm/Fault.c

●Kernel:主要的核心代碼,此目錄下的文件實(shí)現(xiàn)了大多數(shù)linux系統(tǒng)的內(nèi)核函數(shù),其中最重要的文件當(dāng)屬sched.c;同樣,和體系結(jié)構(gòu)相關(guān)的代碼在arch/*/kernel中;

●Drivers: 放置系統(tǒng)所有的設(shè)備驅(qū)動(dòng)程序;每種驅(qū)動(dòng)程序又各占用一個(gè)子目錄:如,/block 下為塊設(shè)備驅(qū)動(dòng)程序,比如ide(ide.c)。如果你希望查看所有可能包含文件系統(tǒng)的設(shè)備是如何初始化的,你可以看drivers/block/genhd.c中的device_setup()。它不僅初始化硬盤(pán),也初始化網(wǎng)絡(luò),因?yàn)榘惭bnfs文件系統(tǒng)的時(shí)候需要網(wǎng)絡(luò)其他: 如, Lib放置核心的庫(kù)代碼; Net,核心與網(wǎng)絡(luò)相關(guān)的代碼; Ipc,這個(gè)目錄包含核心的進(jìn)程間通訊的代碼; Fs ,所有的文件系統(tǒng)代碼和各種類(lèi)型的文件操作代碼,它的每一個(gè)子目錄支持一個(gè)文件系統(tǒng),例如fat和ext2;

scripts, 此目錄包含用于配置核心的腳本文件等。

一般,在每個(gè)目錄下,都有一個(gè) .depend 文件和一個(gè) Makefile 文件,這兩個(gè)文件都是編譯時(shí)使用的輔助文件,仔細(xì)閱讀這兩個(gè)文件對(duì)弄清各個(gè)文件這間的聯(lián)系和依托關(guān)系很有幫助;而且,在有的目錄下還有Readme 文件,它是對(duì)該目錄下的文件的一些說(shuō)明,同樣有利于我們對(duì)內(nèi)核源碼的理解;

二.解讀實(shí)戰(zhàn):為你的內(nèi)核增加一個(gè)系統(tǒng)調(diào)用

雖然,Linux 的內(nèi)核源碼用樹(shù)形結(jié)構(gòu)組織得非常合理、科學(xué),把功能相關(guān)聯(lián)的文件都放在同一個(gè)子目錄下,這樣使得程序更具可讀性。然而,Linux 的內(nèi)核源碼實(shí)在是太大而且非常復(fù)雜,即便采用了很合理的文件組織方法,在不同目錄下的文件之間還是有很多的關(guān)聯(lián),分析核心的一部分代碼通常會(huì)要查看其它的幾個(gè)相關(guān)的文件,而且可能這些文件還不在同一個(gè)子目錄下。

體系的龐大復(fù)雜和文件之間關(guān)聯(lián)的錯(cuò)綜復(fù)雜,可能就是很多人對(duì)其望而生畏的主要原因。當(dāng)然,這種令人生畏的勞動(dòng)所帶來(lái)的回報(bào)也是非常令人著迷的:你不僅可以從中學(xué)到很多的計(jì)算機(jī)的底層的知識(shí)(如下面將講到的系統(tǒng)的引導(dǎo)),體會(huì)到整個(gè)操作系統(tǒng)體系結(jié)構(gòu)的精妙和在解決某個(gè)具體細(xì)節(jié)問(wèn)題時(shí),算法的巧妙;而且更重要的是:在源碼的分析過(guò)程中,你就會(huì)被一點(diǎn)一點(diǎn)地、潛移默化地專(zhuān)業(yè)化;甚至,只要分析十分之一的代碼后,你就會(huì)深刻地體會(huì)到,什么樣的代碼才是一個(gè)專(zhuān)業(yè)的程序員寫(xiě)的,什么樣的代碼是一個(gè)業(yè)余愛(ài)好者寫(xiě)的。

為了使讀者能更好的體會(huì)到這一特點(diǎn),下面舉了一個(gè)具體的內(nèi)核分析實(shí)例,希望能通過(guò)這個(gè)實(shí)例,使讀者對(duì) Linux的內(nèi)核的組織有些具體的認(rèn)識(shí),從中讀者也可以學(xué)到一些對(duì)內(nèi)核的分析方法。
以下即為分析實(shí)例:

【一】操作平臺(tái):

硬件:cpu intel Pentium II

軟件:Redhat Linux 6.0; 內(nèi)核版本2.2.5【二】相關(guān)內(nèi)核源代碼分析:

1.系統(tǒng)的引導(dǎo)和初始化:Linux 系統(tǒng)的引導(dǎo)有好幾種方式:常見(jiàn)的有 Lilo, Loadin引導(dǎo)和Linux的自舉引導(dǎo)
(bootsect-loader),而后者所對(duì)應(yīng)源程序?yàn)閍rch/i386/boot/bootsect.S,它為實(shí)模式的匯編程序,限于篇幅在此不做分析;無(wú)論是哪種引導(dǎo)方式,最后都要跳轉(zhuǎn)到 arch/i386/Kernel/setup.S, setup.S主要是進(jìn)行時(shí)模式下的初始化,為系統(tǒng)進(jìn)入保護(hù)模式做準(zhǔn)備;此后,系統(tǒng)執(zhí)行 arch/i386/kernel/head.S (對(duì)經(jīng)壓縮后存放的內(nèi)核要先執(zhí)行 arch/i386/boot/compressed/head.S); head.S 中定義的一段匯編程序setup_idt ,它負(fù)責(zé)建立一張256項(xiàng)的 idt 表(Interrupt Descriptor Table),此表保存著所有自陷和中斷的入口地址;其中包括系統(tǒng)調(diào)用總控程序 system_call 的入口地址;當(dāng)然,除此之外,head.S還要做一些其他的初始化工作;

2.系統(tǒng)初始化后運(yùn)行的第一個(gè)內(nèi)核程序asmlinkage void __init start_kernel(void) 定義在
/usr/src/linux/init/main.c中,它通過(guò)調(diào)用usr/src/linux/arch/i386/kernel/traps.c 中的一個(gè)函數(shù)
void __init trap_init(void) 把各自陷和中斷服務(wù)程序的入口地址設(shè)置到 idt 表中,其中系統(tǒng)調(diào)用總控程序system_cal就是中斷服務(wù)程序之一;void __init trap_init(void) 函數(shù)則通過(guò)調(diào)用一個(gè)宏set_system_gate(SYSCALL_VECTOR,&system_call); 把系統(tǒng)調(diào)用總控程序的入口掛在中斷0x80上; 其中SYSCALL_VECTOR是定義在 /usr/src/linux/arch/i386/kernel/irq.h中的一個(gè)常量0x80; 而 system_call 即為中斷總控程序的入口地址;中斷總控程序用匯編語(yǔ)言定義在/usr/src/linux/arch/i386/kernel/entry.S中;

3.中斷總控程序主要負(fù)責(zé)保存處理機(jī)執(zhí)行系統(tǒng)調(diào)用前的狀態(tài),檢驗(yàn)當(dāng)前調(diào)用是否合法, 并根據(jù)系統(tǒng)調(diào)用向量,使處理機(jī)跳轉(zhuǎn)到保存在 sys_call_table 表中的相應(yīng)系統(tǒng)服務(wù)例程的入口; 從系統(tǒng)服務(wù)例程返回后恢復(fù)處理機(jī)狀態(tài)退回用戶(hù)程序;
而系統(tǒng)調(diào)用向量則定義在/usr/src/linux/include/asm-386/unistd.h 中;sys_call_table 表定義在/usr/src/linux/arch/i386/kernel/entry.S 中; 同時(shí)在 /usr/src/linux/include/asm-386/unistd.h 中也定義了系統(tǒng)調(diào)用的用戶(hù)編程接口;

4.由此可見(jiàn) , linux 的系統(tǒng)調(diào)用也象 dos 系統(tǒng)的 int 21h 中斷服務(wù), 它把0x80 中斷作為總的入口, 然后轉(zhuǎn)到保存在 sys_call_table 表中的各種中斷服務(wù)例程的入口地址 , 形成各種不同的中斷服務(wù);
由以上源代碼分析可知, 要增加一個(gè)系統(tǒng)調(diào)用就必須在 sys_call_table 表中增加一項(xiàng) , 并在其中保存好自己的系統(tǒng)服務(wù)例程的入口地址,然后重新編譯內(nèi)核,當(dāng)然,系統(tǒng)服務(wù)例程是必不可少的。
由此可知在此版linux內(nèi)核源程序中,與系統(tǒng)調(diào)用相關(guān)的源程序文件就包括以下這些:

1.a(chǎn)rch/i386/boot/bootsect.S
2.a(chǎn)rch/i386/Kernel/setup.S
3.a(chǎn)rch/i386/boot/compressed/head.S
4.a(chǎn)rch/i386/kernel/head.S
5.init/main.c
6.a(chǎn)rch/i386/kernel/traps.c
7.a(chǎn)rch/i386/kernel/entry.S
8.a(chǎn)rch/i386/kernel/irq.h
9.include/asm-386/unistd.h

當(dāng)然,這只是涉及到的幾個(gè)主要文件。而事實(shí)上,增加系統(tǒng)調(diào)用真正要修改文件只有include/asm-386/unistd.h和arch/i386/kernel/entry.S兩個(gè);

【三】 對(duì)內(nèi)核源碼的修改:

1.在kernel/sys.c中增加系統(tǒng)服務(wù)例程如下:

asmlinkage int sys_addtotal(int numdata)
{
int i=0,enddata=0;
while(i<=numdata)
enddata+=i++;
return enddata;
}

該函數(shù)有一個(gè) int 型入口參數(shù) numdata , 并返回從 0 到 numdata 的累加值; 當(dāng)然也可以把系統(tǒng)服務(wù)例程放在一個(gè)自己定義的文件或其他文件中,只是要在相應(yīng)文件中作必要的說(shuō)明;

2.把 asmlinkage int sys_addtotal( int) 的入口地址加到sys_call_table表中:

arch/i386/kernel/entry.S 中的最后幾行源代碼修改前為:
... ...
.long SYMBOL_NAME(sys_sendfile)
.long SYMBOL_NAME(sys_ni_syscall) /* streams1 */
.long SYMBOL_NAME(sys_ni_syscall) /* streams2 */
.long SYMBOL_NAME(sys_vfork) /* 190 */
.rept NR_syscalls-190
.long SYMBOL_NAME(sys_ni_syscall)
.endr
修改后為: ... ...
.long SYMBOL_NAME(sys_sendfile)
.long SYMBOL_NAME(sys_ni_syscall) /* streams1 */
.long SYMBOL_NAME(sys_ni_syscall) /* streams2 */
.long SYMBOL_NAME(sys_vfork) /* 190 */
/* add by I */
.long SYMBOL_NAME(sys_addtotal)
.rept NR_syscalls-191
.long SYMBOL_NAME(sys_ni_syscall)
.endr

3. 把增加的 sys_call_table 表項(xiàng)所對(duì)應(yīng)的向量,在include/asm-386/unistd.h 中進(jìn)行必要申明,以供用戶(hù)進(jìn)程和其他系統(tǒng)進(jìn)程查詢(xún)或調(diào)用:

增加后的部分 /usr/src/linux/include/asm-386/unistd.h 文件如下:
... ...
#define __NR_sendfile 187
#define __NR_getpmsg 188
#define __NR_putpmsg 189
#define __NR_vfork 190
/* add by I */
#define __NR_addtotal 191

4.測(cè)試程序(test.c)如下:

#include
#include
_syscall1(int,addtotal,int, num)
main()
{
int i,j;
do
printf("Please input a numbern");
while(scanf(" d",&i)==EOF);
if((j=addtotal(i))==-1)
printf("Error occurred in syscall-addtotal();n");
printf("Total from 0 to d is d n",i,j);
}

對(duì)修改后的新的內(nèi)核進(jìn)行編譯,并引導(dǎo)它作為新的操作系統(tǒng),運(yùn)行幾個(gè)程序后可以發(fā)現(xiàn)一切正常;在新的系統(tǒng)下對(duì)測(cè)試程序進(jìn)行編譯(*注:由于原內(nèi)核并未提供此系統(tǒng)調(diào)用,所以只有在編譯后的新內(nèi)核下,此測(cè)試程序才能可能被編譯通過(guò)),運(yùn)行情況如下:

$gcc -o test test.c
$./test
Please input a number
36
Total from 0 to 36 is 666

可見(jiàn),修改成功;

而且,對(duì)相關(guān)源碼的進(jìn)一步分析可知,在此版本的內(nèi)核中,從/usr/src/linux/arch/i386/kernel/entry.S
文件中對(duì) sys_call_table 表的設(shè)置可以看出,有好幾個(gè)系統(tǒng)調(diào)用的服務(wù)例程都是定義在/usr/src/linux/kernel/sys.c 中的同一個(gè)函數(shù):

asmlinkage int sys_ni_syscall(void)
{
return -ENOSYS;
}

例如第188項(xiàng)和第189項(xiàng)就是如此:
... ...
.long SYMBOL_NAME(sys_sendfile)
.long SYMBOL_NAME(sys_ni_syscall) /* streams1 */
.long SYMBOL_NAME(sys_ni_syscall) /* streams2 */
.long SYMBOL_NAME(sys_vfork) /* 190 */
... ...
而這兩項(xiàng)在文件 /usr/src/linux/include/asm-386/unistd.h 中卻申明如下:
... ...
#define __NR_sendfile 187
#define __NR_getpmsg 188 /* some people actually want streams */
#define __NR_putpmsg 189 /* some people actually want streams */
#define __NR_vfork 190

由此可見(jiàn),在此版本的內(nèi)核源代碼中,由于asmlinkage int sys_ni_syscall(void) 函數(shù)并不進(jìn)行任何操作,所以包括 getpmsg, putpmsg 在內(nèi)的好幾個(gè)系統(tǒng)調(diào)用都是不進(jìn)行任何操作的,即有待擴(kuò)充的空調(diào)用; 但它們卻仍然占用著sys_call_table表項(xiàng),估計(jì)這是設(shè)計(jì)者們?yōu)榱朔奖銛U(kuò)充系統(tǒng)調(diào)用而安排的; 所以只需增加相應(yīng)服務(wù)例程(如增加服務(wù)例程getmsg或putpmsg),就可以達(dá)到增加系統(tǒng)調(diào)用的作用。

結(jié)語(yǔ):當(dāng)然對(duì)于龐大復(fù)雜的 linux 內(nèi)核而言,一篇文章遠(yuǎn)遠(yuǎn)不夠,而且與系統(tǒng)調(diào)用相關(guān)的代碼也只是內(nèi)核中極其微小的一部分;但重要的是方法、掌握好的分析方法;所以上的分析只是起個(gè)引導(dǎo)的作用,而正真的分析還有待于讀者自己的努力。:)

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專(zhuān)欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車(chē)的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車(chē)技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車(chē)工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車(chē)。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車(chē) 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶(hù)希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱(chēng),數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱(chēng)"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉