當(dāng)前位置:首頁 > 嵌入式 > 嵌入式教程
[導(dǎo)讀]Linux網(wǎng)卡驅(qū)動程序編寫

工作需要寫了我們公司一塊網(wǎng)卡的Linux驅(qū)動程序。經(jīng)歷一個從無到有的過程,深感技術(shù)交流的重要。Linux作為挑戰(zhàn)微軟壟斷的強(qiáng)有力武器,日益受到大家的喜愛。真希望她能在中國迅速成長。把程序文檔貼出來,希望和大家探討Linux技術(shù)和應(yīng)用,促進(jìn)Linux在中國的普及。

Linux操作系統(tǒng)網(wǎng)絡(luò)驅(qū)動程序編寫

一.Linux系統(tǒng)設(shè)備驅(qū)動程序概述

1.1Linux設(shè)備驅(qū)動程序分類

1.2編寫驅(qū)動程序的一些基本概念

二.Linux系統(tǒng)網(wǎng)絡(luò)設(shè)備驅(qū)動程序

2.1網(wǎng)絡(luò)驅(qū)動程序的結(jié)構(gòu)

2.2網(wǎng)絡(luò)驅(qū)動程序的基本方法

2.3網(wǎng)絡(luò)驅(qū)動程序中用到的數(shù)據(jù)結(jié)構(gòu)

2.4常用的系統(tǒng)支持

三.編寫Linux網(wǎng)絡(luò)驅(qū)動程序中可能遇到的問題

3.1中斷共享

3.2硬件發(fā)送忙時的處理

3.3流量控制(flowcontrol)

3.4調(diào)試

四.進(jìn)一步的閱讀

五.雜項

一.Linux系統(tǒng)設(shè)備驅(qū)動程序概述

1.1Linux設(shè)備驅(qū)動程序分類

Linux設(shè)備驅(qū)動程序在Linux的內(nèi)核源代碼中占有很大的比例,源代碼的長度日益增加,主要是驅(qū)動程序的增加。在Linux內(nèi)核的不斷升級過程中,驅(qū)動程序的結(jié)構(gòu)還是相對穩(wěn)定。在2.0.xx到2.2.xx的變動里,驅(qū)動程序的編寫做了一些改變,但是從2.0.xx的驅(qū)動到2.2.xx的移植只需做少量的工作。

Linux系統(tǒng)的設(shè)備分為字符設(shè)備(chardevice),塊設(shè)備(blockdevice)和網(wǎng)絡(luò)設(shè)備(networkdevice)三種。字符設(shè)備是指存取時沒有緩存的設(shè)備。塊設(shè)備的讀寫都有緩存來支持,并且塊設(shè)備必須能夠隨機(jī)存取(randomaccess),字符設(shè)備則沒有這個要求。典型的字符設(shè)備包括鼠標(biāo),鍵盤,串行口等。塊設(shè)備主要包括硬盤軟盤設(shè)備,CD-ROM等。一個文件系統(tǒng)要安裝進(jìn)入操作系統(tǒng)必須在塊設(shè)備上。

網(wǎng)絡(luò)設(shè)備在Linux里做專門的處理。Linux的網(wǎng)絡(luò)系統(tǒng)主要是基于BSDunix的socket機(jī)制。在系統(tǒng)和驅(qū)動程序之間定義有專門的數(shù)據(jù)結(jié)構(gòu)(sk_buff)進(jìn)行數(shù)據(jù)的傳遞。系統(tǒng)里支持對發(fā)送數(shù)據(jù)和接收數(shù)據(jù)的緩存,提供流量控制機(jī)制,提供對多協(xié)議的支持。

1.2編寫驅(qū)動程序的一些基本概念

無論是什么操作系統(tǒng)的驅(qū)動程序,都有一些通用的概念。操作系統(tǒng)提供給驅(qū)動程序的支持也大致相同。下面簡單介紹一下網(wǎng)絡(luò)設(shè)備驅(qū)動程序的一些基本要求。

1.2.1發(fā)送和接收

這是一個網(wǎng)絡(luò)設(shè)備最基本的功能。一塊網(wǎng)卡所做的無非就是收發(fā)工作。所以驅(qū)動程序里要告訴系統(tǒng)你的發(fā)送函數(shù)在哪里,系統(tǒng)在有數(shù)據(jù)要發(fā)送時就會調(diào)用你的發(fā)送程序。還有驅(qū)動程序由于是直接操縱硬件的,所以網(wǎng)絡(luò)硬件有數(shù)據(jù)收到最先能得到這個數(shù)據(jù)的也就是驅(qū)動程序,它負(fù)責(zé)把這些原始數(shù)據(jù)進(jìn)行必要的處理然后送給系統(tǒng)。這里,操作系統(tǒng)必須要提供兩個機(jī)制,一個是找到驅(qū)動程序的發(fā)送函數(shù),一個是驅(qū)動程序把收到的數(shù)據(jù)送給系統(tǒng)。

1.2.2中斷

中斷在現(xiàn)代計算機(jī)結(jié)構(gòu)中有重要的地位。操作系統(tǒng)必須提供驅(qū)動程序響應(yīng)中斷的能力。一般是把一個中斷處理程序注冊到系統(tǒng)中去。操作系統(tǒng)在硬件中斷發(fā)生后調(diào)用驅(qū)動程序的處理程序。Linux支持中斷的共享,即多個設(shè)備共享一個中斷。

1.2.3時鐘

在實(shí)現(xiàn)驅(qū)動程序時,很多地方會用到時鐘。如某些協(xié)議里的超時處理,沒有中斷機(jī)制的硬件的輪詢等。操作系統(tǒng)應(yīng)為驅(qū)動程序提供定時機(jī)制。一般是在預(yù)定的時間過了以后回調(diào)注冊的時鐘函數(shù)。在網(wǎng)絡(luò)驅(qū)動程序中,如果硬件沒有中斷功能,定時器可以提供輪詢(poll)方式對硬件進(jìn)行存取?;蛘呤菍?shí)現(xiàn)某些協(xié)議時需要的超時重傳等。

二.Linux系統(tǒng)網(wǎng)絡(luò)設(shè)備驅(qū)動程序

2.1網(wǎng)絡(luò)驅(qū)動程序的結(jié)構(gòu)

所有的Linux網(wǎng)絡(luò)驅(qū)動程序遵循通用的接口。設(shè)計時采用的是面向?qū)ο蟮姆椒?。一個設(shè)備就是一個對象(device結(jié)構(gòu)),它內(nèi)部有自己的數(shù)據(jù)和方法。每一個設(shè)備的方法被調(diào)用時的第一個參數(shù)都是這個設(shè)備對象本身。這樣這個方法就可以存取自身的數(shù)據(jù)(類似面向?qū)ο蟪绦蛟O(shè)計時的this引用)。

一個網(wǎng)絡(luò)設(shè)備最基本的方法有初始化、發(fā)送和接收。

----------------------------------------

|deliverpackets||receivepacketsqueue|

|(dev_queue_xmit())||them(netif_rx())|

----------------------------------------

||/

/||

-------------------------------------------------------

|methodsandvariables(initialize,open,close,hard_xmit,|

|interrupthandler,config,resources,status...)|

-------------------------------------------------------

||/

/||

---------------------------------------

|sendtohardware||receivcefromhardware|

---------------------------------------

||/

/||

-----------------------------------------------------

|hardwaremedia|

-----------------------------------------------------

初始化程序完成硬件的初始化、device中變量的初始化和系統(tǒng)資源的申請。發(fā)送程序是在驅(qū)動程序的上層協(xié)議層有數(shù)據(jù)要發(fā)送時自動調(diào)用的。一般驅(qū)動程序中不對發(fā)送數(shù)據(jù)進(jìn)行緩存,而是直接使用硬件的發(fā)送功能把數(shù)據(jù)發(fā)送出去。接收數(shù)據(jù)一般是通過硬件中斷來通知的。在中斷處理程序里,把硬件幀信息填入一個skbuff結(jié)構(gòu)中,然后調(diào)用netif_rx()傳遞給上層處理。

2.2網(wǎng)絡(luò)驅(qū)動程序的基本方法

網(wǎng)絡(luò)設(shè)備做為一個對象,提供一些方法供系統(tǒng)訪問。正是這些有統(tǒng)一接口的方法,掩蔽了硬件的具體細(xì)節(jié),讓系統(tǒng)對各種網(wǎng)絡(luò)設(shè)備的訪問都采用統(tǒng)一的形式,做到硬件無關(guān)性。

下面解釋最基本的方法。

2.2.1初始化(initialize)

驅(qū)動程序必須有一個初始化方法。在把驅(qū)動程序載入系統(tǒng)的時候會調(diào)用這個初始化程序。它做以下幾方面的工作。檢測設(shè)備。在初始化程序里你可以根據(jù)硬件的特征檢查硬件是否存在,然后決定是否啟動這個驅(qū)動程序。配置和初始化硬件。在初始化程序里你可以完成對硬件資源的配置,比如即插即用的硬件就可以在這個時候進(jìn)行配置(Linux內(nèi)核對PnP功能沒有很好的支持,可以在驅(qū)動程序里完成這個功能)。配置或協(xié)商好硬件占用的資源以后,就可以向系統(tǒng)申請這些資源。有些資源是可以和別的設(shè)備共享的,如中斷。有些是不能共享的,如IO、DMA。接下來你要初始化device結(jié)構(gòu)中的變量。最后,你可以讓硬件正式開始工作。[!--empirenews.page--]

2.2.2打開(open)

open這個方法在網(wǎng)絡(luò)設(shè)備驅(qū)動程序里是網(wǎng)絡(luò)設(shè)備被激活的時候被調(diào)用(即設(shè)備狀態(tài)由down-->up)。所以實(shí)際上很多在initialize中的工作可以放到這里來做。比如資源的申請,硬件的激活。如果dev->open返回非0(error),則硬件的狀態(tài)還是down。

open方法另一個作用是如果驅(qū)動程序做為一個模塊被裝入,則要防止模塊卸載時設(shè)備處于打開狀態(tài)。在open方法里要調(diào)用MOD_INC_USE_COUNT宏。

2.2.3關(guān)閉(stop)

close方法做和open相反的工作??梢葬尫拍承┵Y源以減少系統(tǒng)負(fù)擔(dān)。close是在設(shè)備狀態(tài)由up轉(zhuǎn)為down時被調(diào)用的。另外如果是做為模塊裝入的驅(qū)動程序,close里應(yīng)該調(diào)用MOD_DEC_USE_COUNT,減少設(shè)備被引用的次數(shù),以使驅(qū)動程序可以被卸載。

另外close方法必須返回成功(0==success)。

2.2.4發(fā)送(hard_start_xmit)

所有的網(wǎng)絡(luò)設(shè)備驅(qū)動程序都必須有這個發(fā)送方法。在系統(tǒng)調(diào)用驅(qū)動程序的xmit時,發(fā)送的數(shù)據(jù)放在一個sk_buff結(jié)構(gòu)中。一般的驅(qū)動程序把數(shù)據(jù)傳給硬件發(fā)出去。也有一些特殊的設(shè)備比如loopback把數(shù)據(jù)組成一個接收數(shù)據(jù)再回送給系統(tǒng),或者dummy設(shè)備直接丟棄數(shù)據(jù)。

如果發(fā)送成功,hard_start_xmit方法里釋放sk_buff,返回0(發(fā)送成功)。如果設(shè)備暫時無法處理,比如硬件忙,則返回1。這時如果dev->tbusy置為非0,則系統(tǒng)認(rèn)為硬件忙,要等到dev->tbusy置0以后才會再次發(fā)送。tbusy的置0任務(wù)一般由中斷完成。硬件在發(fā)送結(jié)束后產(chǎn)生中斷,這時可以把tbusy置0,然后用mark_bh()調(diào)用通知系統(tǒng)可以再次發(fā)送。在發(fā)送不成功的情況下,也可以不置dev->tbusy為非0,這樣系統(tǒng)會不斷嘗試重發(fā)。如果hard_start_xmit發(fā)送不成功,則不要釋放sk_buff。傳送下來的sk_buff中的數(shù)據(jù)已經(jīng)包含硬件需要的幀頭。所以在發(fā)送方法里不需要再填充硬件幀頭,數(shù)據(jù)可以直接提交給硬件發(fā)送。sk_buff是被鎖住的(locked),確保其他程序不會存取它。

2.2.5接收(reception)

驅(qū)動程序并不存在一個接收方法。有數(shù)據(jù)收到應(yīng)該是驅(qū)動程序來通知系統(tǒng)的。一般設(shè)備收到數(shù)據(jù)后都會產(chǎn)生一個中斷,在中斷處理程序中驅(qū)動程序申請一塊sk_buff(skb),從硬件讀出數(shù)據(jù)放置到申請好的緩沖區(qū)里。接下來填充sk_buff中的一些信息。skb->dev=dev,判斷收到幀的協(xié)議類型,填入skb->protocol(多協(xié)議的支持)。把指針skb->mac.raw指向硬件數(shù)據(jù)然后丟棄硬件幀頭(skb_pull)。還要設(shè)置skb->pkt_type,標(biāo)明第二層(鏈路層)數(shù)據(jù)類型??梢允且韵骂愋停?/p>

PACKET_BROADCAST:鏈路層廣播

PACKET_MULTICAST:鏈路層組播

PACKET_SELF:發(fā)給自己的幀

PACKET_OTHERHOST:發(fā)給別人的幀(監(jiān)聽模式時會有這種幀)

最后調(diào)用netif_rx()把數(shù)據(jù)傳送給協(xié)議層。netif_rx()里數(shù)據(jù)放入處理隊列然后返回,真正的處理是在中斷返回以后,這樣可以減少中斷時間。調(diào)用netif_rx()以后,

驅(qū)動程序就不能再存取數(shù)據(jù)緩沖區(qū)skb。

2.2.6硬件幀頭(hard_header)

硬件一般都會在上層數(shù)據(jù)發(fā)送之前加上自己的硬件幀頭,比如以太網(wǎng)(Ethernet)就有14字節(jié)的幀頭。這個幀頭是加在上層ip、ipx等數(shù)據(jù)包的前面的。驅(qū)動程序提供一個hard_header方法,協(xié)議層(ip、ipx、arp等)在發(fā)送數(shù)據(jù)之前會調(diào)用這段程序。

硬件幀頭的長度必須填在dev->hard_header_len,這樣協(xié)議層回在數(shù)據(jù)之前保留好硬件幀頭的空間。這樣hard_header程序只要調(diào)用skb_push然后正確填入硬件幀頭就可以了。

在協(xié)議層調(diào)用hard_header時,傳送的參數(shù)包括(2.0.xx):數(shù)據(jù)的sk_buff,device指針,protocol,目的地址(daddr),源地址(saddr),數(shù)據(jù)長度(len)。數(shù)據(jù)長度不要使用sk_buff中的參數(shù),因?yàn)檎{(diào)用hard_header時數(shù)據(jù)可能還沒完全組織好。saddr是NULL的話是使用缺省地址(default)。daddr是NULL表明協(xié)議層不知道硬件目的地址。如果hard_header完全填好了硬件幀頭,則返回添加的字節(jié)數(shù)。如果硬件幀頭中的信息還不完全(比如daddr為NULL,但是幀頭中需要目的硬件地址。典型的情況是以太網(wǎng)需要地址解析(arp)),則返回負(fù)字節(jié)數(shù)。hard_header返回負(fù)數(shù)的情況下,協(xié)議層會做進(jìn)一步的buildheader的工作。目前Linux系統(tǒng)里就是做arp(如果hard_header返回正,dev->arp=1,表明不需要做arp,返回負(fù),dev->arp=0,做arp)。

對hard_header的調(diào)用在每個協(xié)議層的處理程序里。如ip_output。

2.2.7地址解析(xarp)

有些網(wǎng)絡(luò)有硬件地址(比如Ethernet),并且在發(fā)送硬件幀時需要知道目的硬件地址。這樣就需要上層協(xié)議地址(ip、ipx)和硬件地址的對應(yīng)。這個對應(yīng)是通過地址解析完成的。需要做arp的的設(shè)備在發(fā)送之前會調(diào)用驅(qū)動程序的rebuild_header方法。調(diào)用的主要參數(shù)包括指向硬件幀頭的指針,協(xié)議層地址。如果驅(qū)動程序能夠解析硬件地址,就返回1,如果不能,返回0。

對rebuild_header的調(diào)用在net/core/dev.c的do_dev_queue_xmit()里。

2.2.8參數(shù)設(shè)置和統(tǒng)計數(shù)據(jù)

在驅(qū)動程序里還提供一些方法供系統(tǒng)對設(shè)備的參數(shù)進(jìn)行設(shè)置和讀取信息。一般只有超級用戶(root)權(quán)限才能對設(shè)備參數(shù)進(jìn)行設(shè)置。設(shè)置方法有:

dev->set_mac_address()

當(dāng)用戶調(diào)用ioctl類型為SIOCSIFHWADDR時是要設(shè)置這個設(shè)備的mac地址。一般對mac地址的設(shè)置沒有太大意義的。

dev->set_config()

當(dāng)用戶調(diào)用ioctl時類型為SIOCSIFMAP時,系統(tǒng)會調(diào)用驅(qū)動程序的set_config方法。用戶會傳遞一個ifmap結(jié)構(gòu)包含需要的I/O、中斷等參數(shù)。

dev->do_ioctl()

如果用戶調(diào)用ioctl時類型在SIOCDEVPRIVATE和SIOCDEVPRIVATE+15之間,系統(tǒng)會調(diào)用驅(qū)動程序的這個方法。一般是設(shè)置設(shè)備的專用數(shù)據(jù)。

讀取信息也是通過ioctl調(diào)用進(jìn)行。除次之外驅(qū)動程序還可以提供一個

dev->get_stats方法,返回一個enet_statistics結(jié)構(gòu),包含發(fā)送接收的統(tǒng)計信息。ioctl的處理在net/core/dev.c的dev_ioctl()和dev_ifsioc()里。

linuxman@263.net

.3網(wǎng)絡(luò)驅(qū)動程序中用到的數(shù)據(jù)結(jié)構(gòu)

最重要的是網(wǎng)絡(luò)設(shè)備的數(shù)據(jù)結(jié)構(gòu)。定義在include/linux/netdevice.h里。它的注釋已經(jīng)足夠詳盡。

structdevice[!--empirenews.page--]

{

/*

*Thisisthefirstfieldofthe"visible"partofthisstructure

*(i.e.asseenbyusersinthe"Space.c"file).Itisthename

*theinterface.

*/

char*name;

/*I/Ospecificfields-FIXME:Mergetheseandstructifmapintoone*/

unsignedlongrmem_end;/*shmem"recv"end*/

unsignedlongrmem_start;/*shmem"recv"start*/

unsignedlongmem_end;/*sharedmemend*/

unsignedlongmem_start;/*sharedmemstart*/

unsignedlongbase_addr;/*deviceI/Oaddress*/

unsignedcharirq;/*deviceIRQnumber*/

/*Low-levelstatusflags.*/

volatileunsignedcharstart,/*startanoperation*/

interrupt;/*interruptarrived*/

/*在處理中斷時interrupt設(shè)為1,處理完清0。*/

unsignedlongtbusy;/*transmitterbusymustbelongfor

bitops*/

structdevice*next;

/*Thedeviceinitializationfunction.Calledonlyonce.*/

/*指向驅(qū)動程序的初始化方法。*/

int(*init)(structdevice*dev);

/*Somehardwarealsoneedsthesefields,buttheyarenotpartofthe

usualsetspecifiedinSpace.c.*/

/*一些硬件可以在一塊板上支持多個接口,可能用到if_port。*/

unsignedcharif_port;/*SelectableAUI,TP,..*/

unsignedchardma;/*DMAchannel*/

structenet_statistics*(*get_stats)(structdevice*dev);

/*

*Thismarkstheendofthe"visible"partofthestructure.All

*fieldshereafterareinternaltothesystem,andmaychangeat

*will(read:maybecleanedupatwill).

*/

/*Thesemaybeneededforfuturenetwork-power-downcode.*/

/*trans_start記錄最后一次成功發(fā)送的時間??梢杂脕泶_定硬件是否工作正常。*/

unsignedlongtrans_start;/*Time(injiffies)oflastTx*/

unsignedlonglast_rx;/*TimeoflastRx*/

/*flags里面有很多內(nèi)容,定義在include/linux/if.h里。*/

unsignedshortflags;/*interfaceflags(alaBSD)*/

unsignedshortfamily;/*addressfamilyID(AF_INET)*/

unsignedshortmetric;/*routingmetric(notused)*/

unsignedshortmtu;/*interfaceMTUvalue*/

/*type標(biāo)明物理硬件的類型。主要說明硬件是否需要arp。定義在

include/linux/if_arp.h里。*/

unsignedshorttype;/*interfacehardwaretype*/

/*上層協(xié)議層根據(jù)hard_header_len在發(fā)送數(shù)據(jù)緩沖區(qū)前面預(yù)留硬件幀頭空間。*/

unsignedshorthard_header_len;/*hardwarehdrlength*/

/*priv指向驅(qū)動程序自己定義的一些參數(shù)。*/

void*priv;/*pointertoprivatedata*/

/*Interfaceaddressinfo.*/

unsignedcharbroadcast[MAX_ADDR_LEN];/*hwbcastadd*/

unsignedcharpad;/*makedev_addralignedto8

bytes*/

unsignedchardev_addr[MAX_ADDR_LEN];/*hwaddress*/

unsignedcharaddr_len;/*hardwareaddresslength*/

unsignedlongpa_addr;/*protocoladdress*/

unsignedlongpa_brdaddr;/*protocolbroadcastaddr*/

unsignedlongpa_dstaddr;/*protocolP-Pothersideaddr*/

unsignedlongpa_mask;/*protocolnetmask*/

unsignedshortpa_alen;/*protocoladdresslength*/

structdev_mc_list*mc_list;/*Multicastmacaddresses*/

intmc_count;/*Numberofinstalledmcasts*/

structip_mc_list*ip_mc_list;/*IPmulticastfilterchain*/

__u32tx_queue_len;/*Maxframesperqueueallowed*/

/*Forloadbalancingdriverpairsupport*/

unsignedlongpkt_queue;/*Packetsqueued*/

structdevice*slave;/*Slavedevice*/

structnet_alias_info*alias_info;/*maindevaliasinfo*/

structnet_alias*my_alias;/*aliasdevs*/

/*Pointertotheinterfacebuffers.*/

structsk_buff_headbuffs[DEV_NUMBUFFS];

/*Pointerstointerfaceserviceroutines.*/

int(*open)(structdevice*dev);

int(*stop)(structdevice*dev);

int(*hard_start_xmit)(structsk_buff*skb,

structdevice*dev);

int(*hard_header)(structsk_buff*skb,

structdevice*dev,

unsignedshorttype,

void*daddr,

void*saddr,

unsignedlen);

int(*rebuild_header)(void*eth,structdevice*dev,

unsignedlongraddr,structsk_buff*skb);

#defineHAVE_MULTICAST

void(*set_multicast_list)(structdevice*dev);

#defineHAVE_SET_MAC_ADDR

int(*set_mac_address)(structdevice*dev,void*addr);

#defineHAVE_PRIVATE_IOCTL

int(*do_ioctl)(structdevice*dev,structifreq*ifr,intcmd);

#defineHAVE_SET_CONFIG

int(*set_config)(structdevice*dev,structifmap*map);

#defineHAVE_HEADER_CACHE

void(*header_cache_bind)(structhh_cache**hhp,structdevice

*dev,unsignedshorthtype,__u32daddr);

void(*header_cache_update)(structhh_cache*hh,structdevice

*dev,unsignedchar*haddr);

#defineHAVE_CHANGE_MTU

int(*change_mtu)(structdevice*dev,intnew_mtu);

structiw_statistics*(*get_wireless_stats)(structdevice*dev);

};

2.4常用的系統(tǒng)支持

2.4.1內(nèi)存申請和釋放

include/linux/kernel.h里聲明了kmalloc()和kfree()。用于在內(nèi)核模式下申請和釋放內(nèi)存。

void*kmalloc(unsignedintlen,intpriority);

voidkfree(void*__ptr);

[!--empirenews.page--]

與用戶模式下的malloc()不同,kmalloc()申請空間有大小限制。長度是2的整次方。可以申請的最大長度也有限制。另外kmalloc()有priority參數(shù),通常使用時可以為GFP_KERNEL,如果在中斷里調(diào)用用GFP_ATOMIC參數(shù),因?yàn)槭褂肎FP_KERNEL則調(diào)用者可能進(jìn)入sleep狀態(tài),在處理中斷時是不允許的。

kfree()釋放的內(nèi)存必須是kmalloc()申請的。如果知道內(nèi)存的大小,也可以用kfree_s()釋放。

2.4.2request_irq()、free_irq()

這是驅(qū)動程序申請中斷和釋放中斷的調(diào)用。在include/linux/sched.h里聲明。

request_irq()調(diào)用的定義:

intrequest_irq(unsignedintirq,

void(*handler)(intirq,void*dev_id,structpt_regs*regs),

unsignedlongirqflags,

constchar*devname,

void*dev_id);

irq是要申請的硬件中斷號。在Intel平臺,范圍0--15。handler是向系統(tǒng)登記的中斷處理函數(shù)。這是一個回調(diào)函數(shù),中斷發(fā)生時,系統(tǒng)調(diào)用這個函數(shù),傳入的參數(shù)包括硬件中斷號,deviceid,寄存器值。dev_id就是下面的request_irq時傳遞給系統(tǒng)的參數(shù)dev_id。irqflags是中斷處理的一些屬性。比較重要的有SA_INTERRUPT,

標(biāo)明中斷處理程序是快速處理程序(設(shè)置SA_INTERRUPT)還是慢速處理程序(不設(shè)置SA_INTERRUPT)??焖偬幚沓绦虮徽{(diào)用時屏蔽所有中斷。慢速處理程序不屏蔽。還有一個SA_SHIRQ屬性,設(shè)置了以后運(yùn)行多個設(shè)備共享中斷。dev_id在中斷共享時會用到。一般設(shè)置為這個設(shè)備的device結(jié)構(gòu)本身或者NULL。中斷處理程序可以用dev_id找到相應(yīng)的控制這個中斷的設(shè)備,或者用irq2dev_map找到中斷對應(yīng)的設(shè)備。

voidfree_irq(unsignedintirq,void*dev_id);

2.4.3時鐘

時鐘的處理類似中斷,也是登記一個時間處理函數(shù),在預(yù)定的時間過后,系統(tǒng)會調(diào)用這個函數(shù)。在include/linux/timer.h里聲明。

structtimer_list{

structtimer_list*next;

structtimer_list*prev;

unsignedlongexpires;

unsignedlongdata;

void(*function)(unsignedlong);

};

voidadd_timer(structtimer_list*timer);

intdel_timer(structtimer_list*timer);

voidinit_timer(structtimer_list*timer);

使用時鐘,先聲明一個timer_list結(jié)構(gòu),調(diào)用init_timer對它進(jìn)行初始化。

time_list結(jié)構(gòu)里expires是標(biāo)明這個時鐘的周期,單位采用jiffies的單位。

jiffies是Linux一個全局變量,代表時間。它的單位隨硬件平臺的不同而不同。

系統(tǒng)里定義了一個常數(shù)HZ,代表每秒種最小時間間隔的數(shù)目。這樣jiffies的單位就是1/HZ。Intel平臺jiffies的單位是1/100秒,這就是系統(tǒng)所能分辨的最小時間間隔了。所以expires/HZ就是以秒為單位的這個時鐘的周期。

function就是時間到了以后的回調(diào)函數(shù),它的參數(shù)就是timer_list中的data。data這個參數(shù)在初始化時鐘的時候賦值,一般賦給它設(shè)備的device結(jié)構(gòu)指針。

在預(yù)置時間到系統(tǒng)調(diào)用function,同時系統(tǒng)把這個time_list從定時隊列里清除。所以如果需要一直使用定時函數(shù),要在function里再次調(diào)用add_timer()把這個timer_list加進(jìn)定時隊列。

2.4.4I/O

I/O端口的存取使用:

inlineunsignedintinb(unsignedshortport);

inlineunsignedintinb_p(unsignedshortport);

inlinevoidoutb(charvalue,unsignedshortport);

inlinevoidoutb_p(charvalue,unsignedshortport);

在include/adm/io.h里定義。

inb_p()、outb_p()與inb()、outb_p()的不同在于前者在存取I/O時有等待(pause)一適應(yīng)慢速的I/O設(shè)備。

為了防止存取I/O時發(fā)生沖突,Linux提供對端口使用情況的控制。在使用端口之前,可以檢查需要的I/O是否正在被使用,如果沒有,則把端口標(biāo)記為正在使用,使用完后再釋放。系統(tǒng)提供以下幾個函數(shù)做這些工作。

intcheck_region(unsignedintfrom,unsignedintextent);

voidrequest_region(unsignedintfrom,unsignedintextent,constchar*name);

voidrelease_region(unsignedintfrom,unsignedintextent);

其中的參數(shù)from表示用到的I/O端口的起始地址,extent標(biāo)明從from開始的端口數(shù)目。name為設(shè)備名稱。

2.4.5中斷打開關(guān)閉

系統(tǒng)提供給驅(qū)動程序開放和關(guān)閉響應(yīng)中斷的能力。是在include/asm/system.h中的兩個定義。

#definecli()__asm____volatile__("cli"::)

#definesti()__asm____volatile__("sti"::)

2.4.6打印信息

類似普通程序里的printf(),驅(qū)動程序要輸出信息使用printk()。在include/linux/kernel.h里聲明。

intprintk(constchar*fmt,...);

其中fmt是格式化字符串。...是參數(shù)。都是和printf()格式一樣的。

2.4.7注冊驅(qū)動程序

如果使用模塊(module)方式加載驅(qū)動程序,需要在模塊初始化時把設(shè)備注冊到系統(tǒng)設(shè)備表里去。不再使用時,把設(shè)備從系統(tǒng)中卸除。定義在drivers/net/net_init.h里的兩個函數(shù)完成這個工作。

intregister_netdev(structdevice*dev);

voidunregister_netdev(structdevice*dev);

dev就是要注冊進(jìn)系統(tǒng)的設(shè)備結(jié)構(gòu)指針。在register_netdev()時,dev結(jié)構(gòu)一般填寫前面11項,即到init,后面的暫時可以不用初始化。最重要的是name指針和init方法。name指針空(NULL)或者內(nèi)容為或者name[0]為空格(space),則系統(tǒng)把你的設(shè)備做為以太網(wǎng)設(shè)備處理。以太網(wǎng)設(shè)備有統(tǒng)一的命名格式,ethX。對以太網(wǎng)這么特別對待大概和Linux的歷史有關(guān)。

init方法一定要提供,register_netdev()會調(diào)用這個方法讓你對硬件檢測和設(shè)置。

register_netdev()返回0表示成功,非0不成功。

2.4.8sk_buff

Linux網(wǎng)絡(luò)各層之間的數(shù)據(jù)傳送都是通過sk_buff。sk_buff提供一套管理緩沖區(qū)的方法,是Linux系統(tǒng)網(wǎng)絡(luò)高效運(yùn)行的關(guān)鍵。每個sk_buff包括一些控制方法和一塊數(shù)據(jù)緩沖區(qū)??刂品椒ò垂δ芊譃閮煞N類型。一種是控制整個buffer鏈的方法,

另一種是控制數(shù)據(jù)緩沖區(qū)的方法。sk_buff組織成雙向鏈表的形式,根據(jù)網(wǎng)絡(luò)應(yīng)用的特點(diǎn),對鏈表的操作主要是刪除鏈表頭的元素和添加到鏈表尾。sk_buff的控制[!--empirenews.page--]

方法都很短小以盡量減少系統(tǒng)負(fù)荷。(translatedfromarticlewrittenbyAlanCox)

常用的方法包括:

.alloc_skb()申請一個sk_buff并對它初始化。返回就是申請到的sk_buff。

.dev_alloc_skb()類似alloc_skb,在申請好緩沖區(qū)后,保留16字節(jié)的幀頭空間。主要用在Ethernet驅(qū)動程序。

.kfree_skb()釋放一個sk_buff。

.skb_clone()復(fù)制一個sk_buff,但不復(fù)制數(shù)據(jù)部分。

.skb_copy()完全復(fù)制一個sk_buff。

.skb_dequeue()從一個sk_buff鏈表里取出第一個元素。返回取出的sk_buff,如果鏈表空則返回NULL。這是常用的一個操作。

.skb_queue_head()在一個sk_buff鏈表頭放入一個元素。

.skb_queue_tail()在一個sk_buff鏈表尾放入一個元素。這也是常用的一個操作。網(wǎng)絡(luò)數(shù)據(jù)的處理主要是對一個先進(jìn)先出隊列的管理,skb_queue_tail()

和skb_dequeue()完成這個工作。

.skb_insert()在鏈表的某個元素前插入一個元素。

.skb_append()在鏈表的某個元素后插入一個元素。一些協(xié)議(如TCP)對沒按順序到達(dá)的數(shù)據(jù)進(jìn)行重組時用到skb_insert()和skb_append()。

.skb_reserve()在一個申請好的sk_buff的緩沖區(qū)里保留一塊空間。這個空間一般是用做下一層協(xié)議的頭空間的。

.skb_put()在一個申請好的sk_buff的緩沖區(qū)里為數(shù)據(jù)保留一塊空間。在

alloc_skb以后,申請到的sk_buff的緩沖區(qū)都是處于空(free)狀態(tài),有一個tail指針指向free空間,實(shí)際上開始時tail就指向緩沖區(qū)頭。skb_reserve()

在free空間里申請協(xié)議頭空間,skb_put()申請數(shù)據(jù)空間。見下面的圖。

.skb_push()把sk_buff緩沖區(qū)里數(shù)據(jù)空間往前移。即把Headroom中的空間移一部分到Dataarea。

.skb_pull()把sk_buff緩沖區(qū)里Dataarea中的空間移一部分到Headroom中。

--------------------------------------------------

|Tailroom(free)|

--------------------------------------------------

Afteralloc_skb()

--------------------------------------------------

|Headroom|Tailroom(free)|

--------------------------------------------------

Afterskb_reserve()

--------------------------------------------------

|Headroom|Dataarea|Tailroom(free)|

--------------------------------------------------

Afterskb_put()

--------------------------------------------------

|Head|skb_|Data|Tailroom(free)|

|room|push|||

||Dataarea||

--------------------------------------------------

Afterskb_push()

--------------------------------------------------

|Head|skb_|Dataarea|Tailroom(free)|

||pull|||

|Headroom|||

--------------------------------------------------

Afterskb_pull()

三.編寫Linux網(wǎng)絡(luò)驅(qū)動程序中需要注意的問題

3.1中斷共享

Linux系統(tǒng)運(yùn)行幾個設(shè)備共享同一個中斷。需要共享的話,在申請的時候指明共享方式。系統(tǒng)提供的request_irq()調(diào)用的定義:

intrequest_irq(unsignedintirq,

void(*handler)(intirq,void*dev_id,structpt_regs*regs),

unsignedlongirqflags,

constchar*devname,

void*dev_id);

如果共享中斷,irqflags設(shè)置SA_SHIRQ屬性,這樣就允許別的設(shè)備申請同一個中斷。需要注意所有用到這個中斷的設(shè)備在調(diào)用request_irq()都必須設(shè)置這個屬性。系統(tǒng)在回調(diào)每個中斷處理程序時,可以用dev_id這個參數(shù)找到相應(yīng)的設(shè)備。一般dev_id就設(shè)為device結(jié)構(gòu)本身。系統(tǒng)處理共享中斷是用各自的dev_id參數(shù)依次調(diào)用每一個中斷處理程序。

3.2硬件發(fā)送忙時的處理

主CPU的處理能力一般比網(wǎng)絡(luò)發(fā)送要快,所以經(jīng)常會遇到系統(tǒng)有數(shù)據(jù)要發(fā),但上一包數(shù)據(jù)網(wǎng)絡(luò)設(shè)備還沒發(fā)送完。因?yàn)樵贚inux里網(wǎng)絡(luò)設(shè)備驅(qū)動程序一般不做數(shù)據(jù)緩存,不能發(fā)送的數(shù)據(jù)都是通知系統(tǒng)發(fā)送不成功,所以必須要有一個機(jī)制在硬件不忙時及時通知系統(tǒng)接著發(fā)送下面的數(shù)據(jù)。

一般對發(fā)送忙的處理在前面設(shè)備的發(fā)送方法(hard_start_xmit)里已經(jīng)描述過,即如果發(fā)送忙,置tbusy為1。處理完發(fā)送數(shù)據(jù)后,在發(fā)送結(jié)束中斷里清tbusy,同時用mark_bh()調(diào)用通知系統(tǒng)繼續(xù)發(fā)送。

但在具體實(shí)現(xiàn)我的驅(qū)動程序時發(fā)現(xiàn),這樣的處理系統(tǒng)好象并不能及時地知道硬件已經(jīng)空閑了,即在mark_bh()以后,系統(tǒng)要等一段時間才會接著發(fā)送。造成發(fā)送效率很低。2M線路只有10%不到的使用率。內(nèi)核版本為2.0.35。

我最后的實(shí)現(xiàn)是不把tbusy置1,讓系統(tǒng)始終認(rèn)為硬件空閑,但是報告發(fā)送不成功。系統(tǒng)會一直嘗試重發(fā)。這樣處理就運(yùn)行正常了。但是遍循內(nèi)核源碼中的網(wǎng)絡(luò)驅(qū)動程序,似乎沒有這樣處理的。不知道癥結(jié)在哪里。

3.3流量控制(flowcontrol)

網(wǎng)絡(luò)數(shù)據(jù)的發(fā)送和接收都需要流量控制。這些控制是在系統(tǒng)里實(shí)現(xiàn)的,不需要驅(qū)動程序做工作。每個設(shè)備數(shù)據(jù)結(jié)構(gòu)里都有一個參數(shù)dev->tx_queue_len,這個參數(shù)標(biāo)明發(fā)送時最多緩存的數(shù)據(jù)包。在Linux系統(tǒng)里以太網(wǎng)設(shè)備(10/100Mbps)tx_queue_len一般設(shè)置為100,串行線路(異步串口)為10。實(shí)際上如果看源碼可以知道,設(shè)置了dev->tx_queue_len并不是為緩存這些數(shù)據(jù)申請了空間。這個參數(shù)只是在收到協(xié)議層的數(shù)據(jù)包時判斷發(fā)送隊列里的數(shù)據(jù)是不是到了tx_queue_len的限度,以決定這一包數(shù)據(jù)加不加進(jìn)發(fā)送隊列。發(fā)送時另一個方面的流控是更高層協(xié)議的發(fā)送窗口(TCP協(xié)議里就有發(fā)送窗口)。達(dá)到了窗口大小,高層協(xié)議就不會再發(fā)送數(shù)據(jù)。

接收流控也分兩個層次。netif_rx()緩存的數(shù)據(jù)包有限制。另外高層協(xié)議也會有一個最大的等待處理的數(shù)據(jù)量。

發(fā)送和接收流控處理在net/core/dev.c的do_dev_queue_xmit()和netif_rx()中。

3.4調(diào)試

很多Linux的驅(qū)動程序都是編譯進(jìn)內(nèi)核的,形成一個大的內(nèi)核文件。但對調(diào)試來說,這是相當(dāng)麻煩的。調(diào)試驅(qū)動程序可以用module方式加載。支持模塊方式的驅(qū)動程序必須提供兩個函數(shù):intinit_module(void)和voidcleanup_module(void)。init_module()在加載此模塊時調(diào)用,在這個函數(shù)里可以register_netdev()注冊設(shè)備。init_module()返回0表示成功,返回負(fù)表示失敗。cleanup_module()在驅(qū)動程序被卸載時調(diào)用,清除占用的資源,調(diào)用unregister_netdev()。[!--empirenews.page--]

模塊可以動態(tài)地加載、卸載。在2.0.xx版本里,還有kerneld自動加載模塊,但是2.2.xx中已經(jīng)取消了kerneld。手工加載使用insmod命令,卸載用rmmod命令,看內(nèi)核中的模塊用lsmod命令。

編譯驅(qū)動程序用gcc,主要命令行參數(shù)-DKERNEL-DMODULE。并且作為模塊加載的驅(qū)動程序,只編譯成obj形式(加-c參數(shù))。編譯好的目標(biāo)文件放在/lib/modules/2.x.xx/misc下,在啟動文件里用insmod加載。

四.進(jìn)一步的閱讀

Linux程序設(shè)計資料可以從網(wǎng)上獲得。這就是開放源代碼的好處。并且沒有什么“未公開的秘密”。我編寫驅(qū)動程序時參閱的主要資料包括:

Linux內(nèi)核源代碼

< >byMichaelK.Johnson

< >byOriPomerantz

byollyinBBS水木清華站

 

可以選擇一個模板作為開始,內(nèi)核源代碼里有一個網(wǎng)絡(luò)驅(qū)動程序的模板,

drivers/net/skeleton.c。里面包含了驅(qū)動程序的基本內(nèi)容。但這個模板是以以太網(wǎng)設(shè)備為對象的,以太網(wǎng)的處理在Linux系統(tǒng)里有特殊“待遇”,所以如果不是以太網(wǎng)設(shè)備,有些細(xì)節(jié)上要注意,主要在初始化程序里。

最后,多參照別人寫的程序,聽聽其他開發(fā)者的經(jīng)驗(yàn)之談大概是最有效的幫助了。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉