Linux 內核中采用可加載的模塊化設計(LKMs,Loadable Kernel Modules),一般情況下編譯的Linux 內核是支持可插入式模塊的,也就是將最基本的核心代碼編譯在內核中,其他的代碼可以選擇在內核中,或者編譯為內核的模塊文件。常見的驅動程序也是作為內核模塊動態(tài)加載的。
模塊相關命令
lsmod 列出當前系統(tǒng)加載的模塊
rmmod 將當前模塊卸載
insmod、modprobe 用于加載當前模塊。但insmod不會自動解決依存關系,而modprobe可以根據(jù)模塊間的依存關系以及 /etc/modules.conf 文件中的內容自動插入模塊
mknod 創(chuàng)建相關模塊
Linux 系統(tǒng)的設備文件分為三類:塊設備文件、字符設備文件和網絡設備文件。
· 塊設備文件通常指一些需要以塊(如512 字節(jié))的方式寫入的設備,如IDE 硬盤、SCSI硬盤、光驅等。
· 字符型設備文件通常指可以直接讀寫,沒有緩沖區(qū)的設備,如并口、虛擬控制臺等。
· 網絡設備文件通常是指網絡設備訪問的BSD socket接口,如網卡等。
設備號設備號是一個數(shù)字,它是設備的標志。就如前面所述,一個設備文件(也就是設備節(jié)點)可以通過mknod命令來創(chuàng)建,其中指定了主設備號和次設備號。主設備號表明某一類設備,
一般對應著確定的驅動程序;次設備號一般是用于區(qū)分標明不同屬性,例如不同的使用方法,不同的位置,不同的操作等,它標志著某個具體的物理設備。高字節(jié)為主設備號和底字節(jié)為次設備號。例如,在系統(tǒng)中的塊設備IDE 硬盤的主設備號是3,而多個IDE 硬盤及其各個分區(qū)分別賦予次設備號1、2、3……
Linux 設備驅動程序包含中斷處理程序和設備服務子程序兩部分
設備服務子程序包含了所有與設備操作相關的處理代碼。它從面向用戶進程的設備文件系統(tǒng)中接受用戶命令,并對設備控制器執(zhí)行操作。這樣,設備驅動程序屏蔽了設備的特殊性,使用戶可以像對待文件一樣操作設備。
設備控制器需要獲得系統(tǒng)服務時有兩種方式:查詢和中斷。因為Linux 下的設備驅動程序是內核的一部分,在設備查詢期間系統(tǒng)不能運行其他代碼,查詢方式的工作效率比較低,所以只有少數(shù)設備如軟盤驅動程序采取這種方式,大多設備以中斷方式向設備驅動程序發(fā)出輸入/輸出請求。
screen.width*0.7) {this.resized=true; this.width=screen.width*0.7; this.style.cursor='hand'; this.alt='Click here to open new window\nCTRL+Mouse wheel to zoom in/out';}" onclick="if(!this.resized) {return true;} else {window.open(this.src);}" alt="" src="http://blogimg.chinaunix.net/blog/upfile2/080413193842.jpg" onload="if(this.width>screen.width*0.7) {this.resized=true; this.width=screen.width*0.7; this.alt='Click here to open new window\nCTRL+Mouse wheel to zoom in/out';}" border=0>
Linux 中的設備驅動程序有如下特點。
(1)內核代碼:設備驅動程序是內核的一部分,如果驅動程序出錯,則可能導致系統(tǒng)崩潰。
(2)內核接口:設備驅動程序必須為內核或者其子系統(tǒng)提供一個標準接口。比如,一個終端驅動程序必須為內核提供一個文件I/O 接口;一個SCSI設備驅動程序應該為SCSI子系統(tǒng)提供一個SCSI設備接口,同時SCSI子系統(tǒng)也必須為內核提供文件的I/O 接口及緩沖區(qū)。
(3)內核機制和服務:設備驅動程序使用一些標準的內核服務,如內存分配等。
(4)可裝載:大多數(shù)的Linux 操作系統(tǒng)設備驅動程序都可以在需要時裝載進內核,在不需要時從內核中卸載。
(5)可設置:Linux 操作系統(tǒng)設備驅動程序可以集成為內核的一部分,并可以根據(jù)需要把其中的某一部分集成到內核中,這只需要在系統(tǒng)編譯時進行相應的設置即可。
(6)動態(tài)性:在系統(tǒng)啟動且各個設備驅動程序初始化后,驅動程序將維護其控制的設備。
如果該設備驅動程序控制的設備不存在也不影響系統(tǒng)的運行,那么此時的設備驅動程序只是多占用了一點系統(tǒng)內存罷了。
驅動開發(fā)時卻沒有main 函數(shù),模塊在調用insmod命令時被加載,此時的入口點是init_module函數(shù),通常在該函數(shù)中完成設備的注冊。同樣,模塊在調rmmod
函數(shù)時被卸載,此時的入口點是cleanup_module函數(shù),在該函數(shù)中完成設備的卸載。在設備完成注冊加載之后,用戶的應用程序就可以對該設備進行一定的操作,如read、write等,而驅動程序就是用于實現(xiàn)這些操作,在用戶應用程序調用相應入口函數(shù)時執(zhí)行相關的操作,init_module入口點函數(shù)則不需要完成其他如read、write之類功能。
設備驅動程序的入口點,它是一個在中定義的struct file結構,這是一個內核結構,不會出現(xiàn)在用戶空間的程序中,它定義了常見文件I/O 函數(shù)的入口。
struct file_operations {
loff_t (*llseek) (struct file *, loff_t, int);
ssize_t (*read) (struct file *filp, char *buff, size_t count, loff_t *offp);
ssize_t (*write) (struct file *filp, const char *buff, size_t count, loff_t *offp);
int (*readdir) (struct file *, void *, filldir_t);
unsigned int (*poll) (struct file *, struct poll_table_struct *);
int (*ioctl) (struct inode *, struct file *, unsigned int, unsigned
long);
int (*mmap) (struct file *, struct vm_area_struct *);
int (*open) (struct inode *, struct file *);
int (*flush) (struct file *);
int (*release) (struct inode *, struct file *);
int (*fsync) (struct file *, struct dentry *);
int (*fasync) (int, struct file *, int);
int (*check_media_change) (kdev_t dev);
int (*revalidate) (kdev_t dev);
int (*lock) (struct file *, int, struct file_lock *);
};
每個設備的驅動程序不一定要實現(xiàn)其中所有的函數(shù)操作,若不需要定義實現(xiàn)時,則只需將其設為NULL即可。[!--empirenews.page--]
struct inode提供了關于設備文件/dev/driver(假設此設備名為driver)的信息。struct file 提供關于被打開的文件信息,主要用于與文件系統(tǒng)對應的設備驅動程序使用。struct file 較為重要,這里列出了它的定義:
struct file {
mode_t f_mode;/*標識文件是否可讀或可寫,F(xiàn)MODE_READ或FMODE_WRITE*/
dev_t f_rdev; /* 用于/dev/tty */
off_t f_pos; /* 當前文件位移 */
unsigned short f_flags; /* 文件標志,如O_RDONLY、O_NONBLOCK和O_SYNC */
unsigned short f_count; /* 打開的文件數(shù)目 */
unsigned short f_reada;
struct inode *f_inode; /*指向inode的結構指針 */
struct file_operations *f_op;/* 文件索引指針 */
};
設備驅動程序主要組成
(1)設備注冊
設備注冊使用函數(shù)register_chrdev,調用該函數(shù)后就可以向系統(tǒng)申請主設備號,如果register_chrdev操作成功,設備名就會出現(xiàn)在/proc/devices 文件里。
register_chrdev等函數(shù)語法要點所需頭文件 #i nclude 函數(shù)原型 int register_chrdev(unsigned int major, const char *name,struct file_operations *fops) major:設備驅動程序向系統(tǒng)申請的主設備號 如果為0 則系統(tǒng)為此驅動程序動態(tài)地分配一個主設備號函數(shù)傳入值 name:設備名 fops:對各個調用的入口點函數(shù)返回值 成功:如果是動態(tài)分配主設備號,此返回所分配的主設備號 且設備名就會出現(xiàn)在/proc/devices文函數(shù)返回值 件里
出錯:-1
(2)設備解除注冊
在關閉設備時,通常需要解除原先的設備注冊,此時可使用函數(shù)unregister_chrdev,此后該設備就會從/proc/devices 里消失。
unregister_chrdev等函數(shù)語法要點
所需頭文件 #i nclude
函數(shù)原型 int unregister_chrdev(unsigned int major, const char *name)
major:設備的主設備號,必須和注冊時的主設備號相同。
函數(shù)傳入值 name:設備名
函數(shù)返回值 成功:0,且設備名從/proc/devices文件里消失。
出錯:-1
(3)打開設備
打開設備的接口函數(shù)是open,根據(jù)設備的不同,open函數(shù)完成的功能也有所不同,但通常情況下在open函數(shù)中要完成如下工作。
· 遞增計數(shù)器。
· 檢查特定設備的特殊情況。
· 初始化設備。
· 識別次設備號
其中遞增計數(shù)器是用于設備計數(shù)的。由于設備在使用時通常會打開較多次數(shù),也可以由不同的進程所使用,所以若有一進程想要關閉該設備,則必須保證其他設備沒有使用該設備。因此使用計數(shù)器就可以很好地完成這項功能。
這里,實現(xiàn)計數(shù)器操作的是用在中定義的3 個宏如下。
· MOD_INC_USE_COUNT:計數(shù)器加一。
· MOD_DEC_USE_COUNT:計數(shù)器減一。
· MOD_IN_USE:計數(shù)器非零時返回真。
另外,當有多個物理設備時,就需要識別次設備號來對各個不同的設備進行不同的操作,在有些驅動程序中并不需要用到。
雖然這是對設備文件執(zhí)行的第一個操作,但卻不是驅動程序一定要聲明的操作。若這個函數(shù)的入口為NULL,那么設備的打開操作將永遠成功,但系統(tǒng)不會通知驅動程序。
(4)釋放設備
釋放設備的接口函數(shù)是release。要注意釋放設備和關閉設備是完全不同的。當一個進程釋放設備時,其他進程還能繼續(xù)使用該設備,只是該進程暫時停止對該設備的使用;而當一個進程關閉設備時,其他進程必須重新打開此設備才能使用。
釋放設備時要完成的工作如下。
· 遞減計數(shù)器MOD_DEC_USE_COUNT。
· 在最后一次釋放設備操作時關閉設備。
(5)讀寫設備
讀寫設備的主要任務就是把內核空間的數(shù)據(jù)復制到用戶空間,或者從用戶空間復制到內核空間,也就是將內核空間緩沖區(qū)里的數(shù)據(jù)復制到用戶空間的緩沖區(qū)中或者相反。這里首先解釋一個read和write函數(shù)的入口函數(shù),如下表所示。
read、write函數(shù)語法要點
所需頭文件 #i nclude
函數(shù)原型 ssize_t (*read) (struct file *filp, char *buff, size_t count, loff_t *offp)
ssize_t (*write) (struct file *filp, const char *buff, size_t count, loff_t *offp)
filp:文件指針
函數(shù)傳入值 buff:指向用戶緩沖區(qū)
count:傳入的數(shù)據(jù)長度
offp:用戶在文件中的位置
函數(shù)返回值 成功:寫入的數(shù)據(jù)長度
雖然這個過程看起來很簡單,但是內核空間地址和應用空間地址是有很大區(qū)別的,其中之一就是用戶空間的內存是可以被換出的,因此可能會出現(xiàn)頁面失效等情況。所以就不能使用諸如memcpy 之類的函數(shù)來完成這樣的操作。在這里就要使用copy_to_user 或copy_from_user 函數(shù),它們就是用來實現(xiàn)用戶空間和內核空間的數(shù)據(jù)交換的。copy_to_user 和copy_from_user 的格式如下表
所需頭文件 #i nclude
函數(shù)原型 Unsigned long copy_to_user(void *to, const void *from, unsigned long count)
Unsigned long copy_from_user(void *to, const void *from, unsigned long count)
To:數(shù)據(jù)目的緩沖區(qū)
函數(shù)傳入值 From:數(shù)據(jù)源函數(shù)傳入值 緩沖區(qū)
count:數(shù)據(jù)長度
函數(shù)返回值 成功:寫入的數(shù)據(jù)長度
失敗:-EFAULT
這兩個函數(shù)不僅實現(xiàn)了用戶空間和內核空間的數(shù)據(jù)轉換,而且還會檢查用戶空間指針的有效性。如果指針無效,那么就不進行復制
(6)獲取內存
在應用程序中獲取內存通常使用函數(shù)malloc,但在設備驅動程序中動態(tài)開辟內存可以有基于內存地址和基于頁面為單位兩類。其中,基于內存地址的函數(shù)有kmalloc,注意的是,kmalloc函數(shù)返回的是物理地址,而malloc 等返回的是線性地址,因此在驅動程序中不能使用malloc函數(shù)。與malloc()不同,kmalloc()申請空間有大小限制。長度是2的整次方,并且不會對所獲取的內存空間清零。
基于頁為單位的內存有函數(shù)族有如下。
· get_zeroed_page:獲得一個已清零頁面。[!--empirenews.page--]
· get_free_page:獲得一個或幾個連續(xù)頁面。
· get_dma_pages:獲得用于DMA傳輸?shù)捻撁妗?/p>
與之相對應的釋放內存用也有kfree或free_pages 族。
kmalloc 函數(shù)語法要點
所需頭文件 #i nclude
函數(shù)原型 void *kmalloc(unsigned int len,int flags)
Len:希望申請的字節(jié)數(shù)
GFP_KERNEL:內核內存的通常分配方法,可能引起睡眠
GFP_BUFFER:用于管理緩沖區(qū)高速緩存
函數(shù)傳入值 flags GFP_ATOMIC:為中斷處理程序或其他運行于進程上下文之外的代碼分
配內存,且不會引起睡眠
GFP_USER:用戶分配內存,可能引起睡眠
GFP_HIGHUSER:優(yōu)先高端內存分配
_GFP_DMA:DMA數(shù)據(jù)傳輸請求內存
_GFP_HIGHMEN:請求高端內存
函數(shù)返回值 成功:寫入的數(shù)據(jù)長度
失?。?EFAULT
kfree函數(shù)的語法格式
所需頭文件 #i nclude
函數(shù)原型 void kfree(void * obj)
函數(shù)傳入值 obj:要釋放的內存指針
函數(shù)返回值 成功:寫入的數(shù)據(jù)長度
失?。?EFAULT
get_free_ page類函數(shù)語法要點
unsigned long get_zeroed_page(int flags)
unsigned long __get_free_page(int flags)
函數(shù)原型 unsigned long __get_free_page(int flags,unsigned long order)
unsigned long __get_dma_page(int flags,unsigned long order)
函數(shù)傳入值 flags:同kmalloc
order:要請求的頁面數(shù),以2為底的對數(shù)
函數(shù)返回值 成功:寫入的數(shù)據(jù)長度
失?。?EFAULT
free_page類函數(shù)語法要點
所需頭文件 #i nclude
函數(shù)原型 unsigned long free_page(unsigned long addr)
unsigned long free_page(unsigned long addr)
函數(shù)傳入值 flags:同kmalloc
order:要請求的頁面數(shù),以2為底的對數(shù)
函數(shù)返回值 成功:寫入的數(shù)據(jù)長度
失?。?EFAULT
printk類函數(shù)語法要點
所需頭文件 #i nclude
函數(shù)原型 int printk(const char * fmt,…)
KERN_EMERG:緊急時間消息
KERN_ALERT:需要立即采取動作的情況
KERN_CRIT:臨界狀態(tài),通常涉及嚴重的硬件或軟件操作失敗
KERN_ERR:錯誤報告
函數(shù)傳入值 fmt: KERN_WARNING:對可能出現(xiàn)的問題提出警告
日志級別 KERN_NOTICE:有必要進行提示的正常情況
KERN_INFO:提示性信息
KERN_DEBUG:調試信息
…:如printf一樣的格式說明
函數(shù)返回值 成功:0
失敗:-1
這些不同優(yōu)先級的信息可以輸出到控制臺上、/var/log/messages 里。其中,對輸出給控制臺的信息有一個特定的優(yōu)先級console_loglevel。若優(yōu)先級小于這個整數(shù)值時,則消息才能顯示到控制臺上,否則,消息會顯示在/var/log/messages 里。若不加任何優(yōu)先級選項,則消息默認輸出到/var/log/messages 文件中。
要開啟klogd和syslogd服務,消息才能正常輸出。
proc 文件系統(tǒng)
/proc 文件系統(tǒng)是一個偽文件系統(tǒng),它是一種內核和內核模塊用來向進程發(fā)送信息的機制。這個偽文件系統(tǒng)讓用戶可以和內核內部數(shù)據(jù)結構進行交互,獲取有關進程的有用信息,在運行時通過改變內核參數(shù)改變設置。與其他文件系統(tǒng)不同,/proc存在于內存之中而不是硬盤上。讀者可以通過“ls”查看/proc文件系統(tǒng)的內容。
/proc文件系統(tǒng)主要目錄內容
screen.width*0.7) {this.resized=true; this.width=screen.width*0.7; this.style.cursor='hand'; this.alt='Click here to open new window\nCTRL+Mouse wheel to zoom in/out';}" onclick="if(!this.resized) {return true;} else {window.open(this.src);}" alt="" src="http://blogimg.chinaunix.net/blog/upfile2/080413215654.jpg" onload="if(this.width>screen.width*0.7) {this.resized=true; this.width=screen.width*0.7; this.alt='Click here to open new window\nCTRL+Mouse wheel to zoom in/out';}" border=0>
除此之外,還有一些是以數(shù)字命名的目錄,它們是進程目錄。系統(tǒng)中當前運行的每一個進程都有對應的一個目錄在/proc下,以進程的PID 號為目錄名,它們是讀取進程信息的接口。進程目錄的結構如下
screen.width*0.7) {this.resized=true; this.width=screen.width*0.7; this.style.cursor='hand'; this.alt='Click here to open new window\nCTRL+Mouse wheel to zoom in/out';}" onclick="if(!this.resized) {return true;} else {window.open(this.src);}" alt="" src="http://blogimg.chinaunix.net/blog/upfile2/080413215720.jpg" onload="if(this.width>screen.width*0.7) {this.resized=true; this.width=screen.width*0.7; this.alt='Click here to open new window\nCTRL+Mouse wheel to zoom in/out';}" border=0>
用戶可以使用cat命令來查看其中的內容。
可以看到,/proc文件系統(tǒng)體現(xiàn)了內核及進程運行的內容,在加載模塊成功后,讀者可以使用查看/proc/device文件獲得相關設備的主設備號。