1.DMA概述
DMA是外設(shè)與主存之間的一種數(shù)據(jù)傳輸機制。一般來說,外設(shè)與主存之間存在兩種數(shù)據(jù)傳輸方法:(1)Pragrammed I/O(PIO)方法,也即由CPU通過內(nèi)存讀寫指令或I/O指令來持續(xù)地讀寫外設(shè)的內(nèi)存單元(8位、16位或32位),直到整個數(shù)據(jù)傳輸過程完成。(2)DMA,即由DMA控制器(DMA Controller,簡稱DMAC)來完成整個數(shù)據(jù)傳輸過程。在此期間,CPU可以并發(fā)地執(zhí)行其他任務(wù),當DMA結(jié)束后,DMAC通過中斷通知CPU數(shù)據(jù)傳輸已經(jīng)結(jié)束,然后由CPU執(zhí)行相應(yīng)的ISR進行后處理。
DMA技術(shù)產(chǎn)生時正是ISA總線在PC中流行的時侯。因此,ISA卡的DMA數(shù)據(jù)傳輸是通過ISA總線控制芯片組中的兩個級聯(lián)8237 DMAC來實現(xiàn)的。這種DMA機制也稱為“標準DMA”(standard DMA)。標準DMA有時也稱為“第三方DMA”(third-part
y DMA),這是因為:系統(tǒng)DMAC完成實際的傳輸過程,所以它相對于傳輸過程的“前兩方”(傳輸?shù)陌l(fā)送者和接收者)來說是“第三方”。
標準DMA技術(shù)主要有兩個缺點:(1)8237 DMAC的數(shù)據(jù)傳輸速度太慢,不能與更高速的總線(如PCI)配合使用。(2)兩個8237 DMAC一起只提供了8個DMA通道,這也成為了限制系統(tǒng)I/O吞吐率提升的瓶頸。
鑒于上述兩個原因,PCI總線體系結(jié)構(gòu)設(shè)計一種成為“第一方DMA”(first-party DMA)的DMA機制,也稱為“Bus Mastering”(總線主控)。在這種情況下,進行傳輸?shù)腜CI卡必須取得系統(tǒng)總線的主控權(quán)后才能進行數(shù)據(jù)傳輸。實際的傳輸也不借助慢速的ISA DMAC來進行,而是由內(nèi)嵌在PCI卡中的DMA電路(比傳統(tǒng)的ISA DMAC要快)來完成。Bus Mastering方式的DMA可以讓PCI外設(shè)得到它們想要的傳輸帶寬,因此它比標準DMA功能滿足現(xiàn)代高性能外設(shè)的要求。
隨著計算機外設(shè)技術(shù)的不斷發(fā)展,現(xiàn)代能提供更快傳輸速率的Ultra DMA(UDMA)也已經(jīng)被廣泛使用了。本為隨后的篇幅只討論ISA總線的標準DMA技術(shù)在Linux中的實現(xiàn)。記?。篒SA卡幾乎不使用Bus Mastering模式的DMA;而PCI卡只使用Bus Mastering模式的DMA,它從不使用標準DMA。
2.Intel 8237 DMAC
最初的IBM PC/XT中只有一個8237 DMAC,它提供了4個8位的DMA通道(DMA channel 0-3)。從IBM AT開始,又增加了一個8237 DMAC(提供4個16位的DMA通道,DMA channel 4-7)。兩個8237 DMAC一起為系統(tǒng)提供8個DMA通道。與中斷控制器8259的級聯(lián)方式相反,第一個DMAC被級聯(lián)到第二個DMAC上,通道4被用于DMAC級聯(lián),因此它對外設(shè)來說是不可用的。第一個DMAC也稱為“slave DAMC”,第二個DMAC也稱為“Master DMAC”。
下面我們來詳細敘述一下Intel 8237這個DMAC的結(jié)構(gòu)。
每個8237 DMAC都提供4個DMA通道,每個DMA通道都有各自的寄存器,而8237本身也有一組控制寄存器,用以控制它所提供的所有DMA通道。
2.1 DMA通道的寄存器
8237 DMAC中的每個DMA通道都有5個寄存器,分別是:當前地址寄存器、當前計數(shù)寄存器、地址寄存器(也稱為偏移寄存器)、計數(shù)寄存器和頁寄存器。其中,前兩個是8237的內(nèi)部寄存器,對外部是不可見的。
(1)當前地址寄存器(Current Address Register):每個DMA通道都有一個16位的當前地址寄存器,表示一個DMA傳輸事務(wù)(Transfer Transaction)期間當前DMA傳輸操作的DMA物理內(nèi)存地址。在每個DMA傳輸開始前,8237都會自動地用該通道的Address Register中的值來初始化這個寄存器;在傳輸事務(wù)期間的每次DMA傳輸操作之后該寄存器的值都會被自動地增加或減小。
(2)當前計數(shù)寄存器(Current Count Register):每個每個DMA通道都有一個16位的當前計數(shù)寄存器,表示當前DMA傳輸事務(wù)還剩下多少未傳輸?shù)臄?shù)據(jù)。在每個DMA傳輸事務(wù)開始之前,8237都會自動地用該通道的Count Register中的值來初始化這個寄存器。在傳輸事務(wù)期間的每次DMA傳輸操作之后該寄存器的值都會被自動地增加或減小(步長為1)。
(3)地址寄存器(Address Register)或偏移寄存器(Offset Register):每個DMA通道都有一個16位的地址寄存器,表示系統(tǒng)RAM中的DMA緩沖區(qū)的起始位置在頁內(nèi)的偏移。
(4)計數(shù)寄存器(Count Register):每個DMA通道都有一個16位的計數(shù)寄存器,表示DMA緩沖區(qū)的大小。
(5)頁寄存器(Page Register):該寄存器定義了DMA緩沖區(qū)的起始位置所在物理頁的基地址,即頁號。頁寄存器有點類似于PC中的段基址寄存器。
2.2 8237 DAMC的控制寄存器
(1)命令寄存器(Command Register)
這個8位的寄存器用來控制8237芯片的操作。其各位的定義如下圖所示:
(2)模式寄存器(Mode Register)
用于控制各DMA通道的傳輸模式,如下所示:
(3)請求寄存器(Request Register)
用于向各DMA通道發(fā)出DMA請求。各位的定義如下:
(4)屏蔽寄存器(Mask Register)[!--empirenews.page--]用來屏蔽
某個DMA通道。當一個DMA通道被屏蔽后,它就不能在服務(wù)于DMA請求,直到通道的屏蔽碼被清除。各位的定義如下:
上述屏蔽寄存器也稱為“單通道屏蔽寄存器”(Single Channel Mask Register),因為它一次只能屏蔽一個通道。此外含有一個屏蔽寄存器,可以實現(xiàn)一次屏蔽所有4個DMA通道,如下:
(5)狀態(tài)寄存器(Status Register)
一個只讀的8位寄存器,表示各DMA通道的當前狀態(tài)。比如:DMA通道是否正服務(wù)于一個DMA請求,或者某個DMA通道上的DMA傳輸事務(wù)已經(jīng)完成。
2.3 8237 DMAC的I/O端口地址
主、從8237 DMAC的各個寄存器都是編址在I/O端口空間的。而且其中有些I/O端口地址對于I/O讀、寫操作有不同的表示含義。如下表示所示:
Slave DMAC’s I/O port Master DMAC’sI/O port read write
0x000 0x0c0 Channel 0/4 的Address Register
0x001 0x0c1 Channel 0/4的Count Register
0x002 0x0c2 Channel 1/5 的Address Register
0x003 0x0c3 Channel 1/5的Count Register
0x004 0x0c4 Channel 2/6的Address Register
0x005 0x0c5 Channel 2/6的Count Register
0x006 0x0c6 Channel 3/7的Address Register
0x007 0x0c7 Channel 3/7的Count Register
0x008 0x0d0 Status Register Command Register
0x009 0x0d2 Request Register
0x00a 0x0d4 Single Channel Mask Register
0x00b 0x0d6 Mode Register
0x00c 0x0d8 Clear Flip-Flop Register
0x00d 0x0da Temporary Register Reset DMA controller
0x00e 0x0dc Reset all channel masks
0x00f 0x0de all-channels Mask Register
各DMA通道的Page Register在I/O端口空間中的地址如下:
DMA channel Page Register’sI/O port address
0 0x087
1 0x083
2 0x081
3 0x082
4 0x08f
5 0x08b
6 0x089
7 0x08a
注意兩點:
1. 各DMA通道的Address Register是一個16位的寄存器,但其對應(yīng)的I/O端口是8位寬,因此對這個寄存器的讀寫就需要兩次連續(xù)的I/O端口讀寫操作,低8位首先被發(fā)送,然后緊接著發(fā)送高8位。
2. 各DMA通道的Count Register:這也是一個16位寬的寄存器(無論對于8位DMA還是16位DMA),但相對應(yīng)的I/O端口也是8位寬,因此讀寫這個寄存器同樣需要兩次連續(xù)的I/O端口讀寫操作,而且同樣是先發(fā)送低8位,再發(fā)送高8位。往這個寄存器中寫入的值應(yīng)該是實際要傳輸?shù)臄?shù)據(jù)長度減1后的值。在DMA傳輸事務(wù)期間,這個寄存器中的值在每次DMA傳輸操作后都會被減1,因此讀取這個寄存器所得到的值將是當前DMA事務(wù)所剩余的未傳輸數(shù)據(jù)長度減1后的值。當DMA傳輸事務(wù)結(jié)束時,該寄存器中的值應(yīng)該被置為0。
2.4 DMA通道的典型使用
在一個典型的PC機中,某些DMA通道通常被固定地用于一些PC機中的標準外設(shè),如下所示:
Channel Size Usage
0 8-bit Memory Refresh
1 8-bit Free
2 8-bit Floppy Disk Controller
3 8-bit Free
4 16-bit Cascading
5 16-bit Fr
ee
6 16-bit Free
7 16-bit Free
2.5 啟動一個DMA傳輸事務(wù)的步驟
要啟動一個DMA傳輸事務(wù)必須對8237進行編程,其典型步驟如下:
1.通過CLI指令關(guān)閉中斷。
2.Disable那個將被用于此次DMA傳輸事務(wù)的DMA通道。
3.向Flip-Flop寄存器中寫入0值,以重置它。
4.設(shè)置Mode Register。
5.設(shè)置Page Register。
6.設(shè)置Address Register。
7.設(shè)置Count Register。
8.Enable那個將被用于此次DMA傳輸事務(wù)的DMA通道。
9.用STI指令開中斷。
3.3 對DMAC的保護
DMAC是一種全局的共享資源,為了保證設(shè)備驅(qū)動程序?qū)λ莫氄荚L問,Linux在kernel/dma.c文件中定義了自旋鎖dma_spin_lock來保護它(實際上是保護DMAC的I/O端口資源)。任何想要訪問DMAC的設(shè)備驅(qū)動程序都首先必須先持有自旋鎖dma_spin_lock。如下:
static __inline__ unsigned long claim_dma_lock(void)
{
unsigned long flags;
spin_lock_irqsave(&dma_spin_lock, flags); /* 關(guān)中斷,加鎖*/
return flags;
}
static __inline__ void release_dma_lock(unsigned long flags)
{
spin_unlock_irqrestore(&dma_spin_lock, flags);/* 開中斷,開鎖*/
}[!--empirenews.page--]4 Linux對ISA DMA通道資源的管理
DMA通道是一種系統(tǒng)全局資源。任何ISA外設(shè)想要進行DMA傳輸,首先都必須取得某個DMA通道資源的使用權(quán),并在傳輸結(jié)束后釋放所使用DMA通道資源。從這個角度看,DMA通道資源是一種共享的獨占型資源。
Linux在kernel/Dma.c文件中實現(xiàn)了對DMA通道資源的管理。
4.1 對DMA通道資源的描述
Linux在kernel/Dma.c文件中定義了數(shù)據(jù)結(jié)構(gòu)dma_chan來描述DMA通道資源。該結(jié)構(gòu)類型的定義如下:
struct dma_chan {
int lock;
const char *device_id;
};
其中,如果成員lock!=0則表示DMA通道正被某個設(shè)備所使用;否則該DMA通道就處于free狀態(tài)。而成員device_id就指向使用該DMA通道的設(shè)備名字字符串。
基于上述結(jié)構(gòu)類型dma_chan,Linux定義了全局數(shù)組dma_chan_busy[],以分別描述8個DMA通道資源各自的使用狀態(tài)。如下:
static struct dma_chan dma_chan_busy[MAX_DMA_CHANNELS] = {
{ 0, 0 },
{ 0, 0 },
{ 0, 0 },
{ 0, 0 },
{ 1, "cascade" },
{ 0, 0 },
{ 0, 0 },
{ 0, 0 }
};
顯然,在初始狀態(tài)時除了DMA通道4外,其余DMA通道皆處于free狀態(tài)。
4.2 DMA通道資源的申請
任何ISA卡在使用某個DMA通道進行DMA傳輸之前,其設(shè)備驅(qū)動程序都必須向內(nèi)核提出DMA通道資源的申請。只有申請獲得成功后才能使用相應(yīng)的DMA通道。否則就會發(fā)生資源沖突。
函數(shù)request_dma()實現(xiàn)DMA通道資源的申請。其源碼如下:
int request_dma(unsigned int dmanr, const char * device_id)
{
if (dmanr >= MAX_DMA_CHANNELS)
return -EINVAL;
if (xchg(&dma_chan_busy[dmanr].lock, 1) != 0)
return -EBUSY;
dma_chan_busy[dmanr].device_id = device_id;
/* old flag was 0, now contains 1 to indicate busy */
return 0;
}
上述函數(shù)的核心實現(xiàn)就是用原子操作xchg()讓成員變量dma_chan_busy[dmanr].lock和值1進行交換操作,xchg()將返回lock成員在交換操作之前的值。因此:如果xchg()返回非0值,這說明dmanr所指定的DMA通道已被其他設(shè)備所占用,所以request_dma()函數(shù)返回錯誤值-EBUSY表示指定DMA通道正忙;否則,如果xchg()返回0值,說明dmanr所指定的DMA通道正處于free狀態(tài),于是xchg()將其lock成員設(shè)置為1,取得資源的使用權(quán)。
4.3 釋放DMA通道資源
DMA傳輸事務(wù)完成后,設(shè)備驅(qū)動程序一定要記得釋放所占用的DMA通道資源。否則別的外設(shè)將一直無法使用該DMA通道。
函數(shù)free_dma()釋放指定的DMA通道資源。如下:
void free_dma(unsigned int dmanr)
{
if (dmanr >= MAX_DMA_CHANNELS) {
printk("Trying to free DMA%d
", dmanr);
return;
}
if (xchg(&dma_chan_busy[dmanr].lock, 0) == 0) {
printk("Trying to free free DMA%d
", dmanr);
return;
}
} /* free_dma */
顯然,上述函數(shù)的核心實現(xiàn)就是用原子操作xchg()將lock成員清零。
4.4 對/proc/dma文件的實現(xiàn)
文件/proc/dma將列出當前8個DMA通道的使用狀況。Linux在kernel/Dma.c文件中實現(xiàn)了函數(shù)個get_dma_list()函數(shù)來至此/proc/dma文件的實現(xiàn)。函數(shù)get_dma_list()的實現(xiàn)比較簡單。主要就是遍歷數(shù)組dma_chan_busy[],并將那些lock成員為非零值的數(shù)組元素輸出到列表中即可。如下:
int get_dma_list(char *buf)
{
int i, len = 0;
for (i = 0 ; i < MAX_DMA_CHANNELS ; i++) {
if (dma_chan_busy.lock) {
len += sprintf(buf+len, "%2d: %s
",
i,
dma_chan_busy.device_id);
}
}
return len;
} /* get_dma_list */
5 使用DMA的ISA設(shè)備驅(qū)動程序
DMA雖然是一種硬件機制,但它離不開軟件(尤其是設(shè)備驅(qū)動程序)的配合。任何使用DMA進行數(shù)據(jù)傳輸?shù)腎SA設(shè)備驅(qū)動程序都必須遵循一定的框架。[!--empirenews.page--]5.1 DMA通道資源的申請與釋放
同I/O端口資源類似,設(shè)備驅(qū)動程序必須在一開始就調(diào)用request_dma()函數(shù)來向內(nèi)核申請DMA通道資源的使用權(quán)。而且,最好在設(shè)備驅(qū)動程序的open()方法中完成這個操作,而不是在模塊的初始化例程中調(diào)用這個函數(shù)。因為這在一定程度上可以讓多個設(shè)備共享DMA通道資源(只要多個設(shè)備不同時使用一個DMA通道)。這種共享有點類似于進程對CPU的分時共享。
設(shè)備使用完DMA通道后,其驅(qū)動程序應(yīng)該記得調(diào)用free_dma()函數(shù)來釋放所占用的DMA通道資源。通常,最好再驅(qū)動程序的release()方法中調(diào)用該函數(shù),而不是在模塊的卸載例程中進行調(diào)用。
還需要注意的一個問題是:資源的申請順序。為了避免死鎖(deadlock),驅(qū)動程序一定要在申請了中斷號資源后才申請DMA通道資源。釋放時則要先釋放DMA通道,然后再釋放中斷號資源。
使用DMA的ISA設(shè)備驅(qū)動程序的open()方法的如下:
int xxx_open(struct inode * inode, struct file * filp)
{
┆
if((err = request_irq(irq,xxx_ISR,SA_INTERRUPT,”YourDeviceName”,NULL))
return err;
if((err = request_dma(dmanr, “YourDeviceName”)){
free_irq(irq, NULL);
return err;
}
┆
return 0;
}
release()方法的范例代碼如下:
void xxx_release(struct inode * inode, struct file * filp)
{
┆
free_dma(dmanr);
free_irq(irq,NULL);
┆
}
5.2 申請DMA緩沖區(qū)
由于8237 DMAC只能尋址系統(tǒng)RAM中低16MB物理內(nèi)存,因此:ISA設(shè)備驅(qū)動程序在申請DMA緩沖區(qū)時,一定要以GFP_DMA標志來調(diào)用kmalloc()函數(shù)或get_free_pages()函數(shù),以便在系統(tǒng)內(nèi)存的DMA區(qū)中分配物理內(nèi)存。
5.3 編程DMAC
設(shè)備驅(qū)動程序可以在他的read()方法、write()方法或ISR中對DMAC進行編程,以便準備啟動一個DMA傳輸事務(wù)。一個DMA傳輸事務(wù)有兩種典型的過程:(1)用戶請求設(shè)備進行DMA傳輸;(2)硬件異步地將外部數(shù)據(jù)寫道系統(tǒng)中。
用戶通過I/O請求觸發(fā)設(shè)備進行DMA傳輸?shù)牟襟E如下:
1.用戶進程通過系統(tǒng)調(diào)用read()/write()來調(diào)用設(shè)備驅(qū)動程序的read()方法或write()方法,然后由設(shè)備驅(qū)動程序read/write方法負責申請DMA緩沖區(qū),對DMAC進行編程,以準備啟動一個DMA傳輸事務(wù),最后正確地設(shè)置設(shè)備(setup device),并將用戶進程投入睡眠。
2.DMAC負責在DMA緩沖區(qū)和I/O外設(shè)之間進行數(shù)據(jù)傳輸,并在結(jié)束后觸發(fā)一個中斷。
3.設(shè)備的ISR檢查DMA傳輸事務(wù)是否成功地結(jié)束,并將數(shù)據(jù)從DMA緩沖區(qū)中拷貝到驅(qū)動程序的其他內(nèi)核緩沖區(qū)中(對于I/O device to memory的情況)。然后喚醒睡眠的用戶進程。
硬件異步地將外部數(shù)據(jù)寫到系統(tǒng)中的步驟如下:
1.外設(shè)觸發(fā)一個中斷通知系統(tǒng)有新數(shù)據(jù)到達。
2.ISR申請一個DMA緩沖區(qū),并對DMAC進行編程,以準備啟動一個DMA傳輸事務(wù),最后正確地設(shè)置好外設(shè)。
3.硬件將外部數(shù)據(jù)寫到DMA緩沖區(qū)中,DMA傳輸事務(wù)結(jié)束后,觸發(fā)一個中斷。
4. ISR檢查DMA傳輸事務(wù)是否成功地結(jié)束,然后將DMA緩沖區(qū)中的數(shù)據(jù)拷貝驅(qū)動程序的其他內(nèi)核緩沖區(qū)中,最后喚醒相關(guān)的等待進程。
網(wǎng)卡就是上述過程的一個典型例子。
為準備一個DMA傳輸事務(wù)而對DMAC進行編程的典型代碼段如下:
unsigned long flags;
flags = claim_dma_lock();
disable_dma(dmanr);
clear_dma_ff(dmanr);
set_dma_mode(dmanr,mode);
set_dma_addr(dmanr, virt_to_bus(buf));
set_dma_count(dmanr, count);
enable_dma(dmanr);
release_dma_lock(flags);
檢查一個DMA傳輸事務(wù)是否成功地結(jié)束的代碼段如下:
int residue;
unsigned long flags = claim_dma_lock();
residue = get_dma_residue(dmanr);
release_dma_lock(flags);
ASSERT(residue == 0);