Linux設(shè)備驅(qū)動之I/O端口與I/O內(nèi)存
一、統(tǒng)一編址與獨立編址
從CPU連出來一把線:數(shù)據(jù)總線、地址總線、控制總線,這把線上掛著N個接口,有相同的,有不同的,名字叫做存儲器接口、中斷控制接口、DMA接口、并行接口、串行接口、AD接口……一個設(shè)備要想接入,就用自己的接口和總線上的某個匹配接口對接……于是總線上出現(xiàn)了各種設(shè)備:內(nèi)存、硬盤,鼠標、鍵盤,顯示器……
對于CPU而言,如果它要發(fā)數(shù)據(jù)到某個設(shè)備,其實是發(fā)到對應(yīng)的接口,接口電路里有多個寄存器(也稱為端口),訪問設(shè)備實際上是訪問相關(guān)的端口,所有的信息會由接口轉(zhuǎn)給它的設(shè)備。那么CPU會準備數(shù)據(jù)到數(shù)據(jù)總線,但是諸多接口,該發(fā)給誰呢?這時就須要為各接口分配一個地址,然后把地址放在地址總線上,需要的控制信息放到控制總線上,就可以和設(shè)備通信了。
對一個系統(tǒng)而言,通常會有多個外設(shè),每個外設(shè)的接口電路中,又會有多個端口,每個端口都需要一個地址,為他們標識一個具體的地址值,是系統(tǒng)必須解決的事,與此同時,你還有個內(nèi)存條,可能是512M或1G或更大的金士頓、現(xiàn)代DDR2之類,他們的每一個地址也都需要分配一個標識值,另外,很多外設(shè)有自己的內(nèi)存、緩沖區(qū),就像你的內(nèi)存條一樣,你同樣需要為它們分配內(nèi)存……你的CPU可能需要和它們的每一個字節(jié)都打交道,所以:別指望偷懶,它們的每一寸土地都要規(guī)劃好!這聽起來就很煩,做起來可能就直接導致腦細胞全部陣亡。但事情總是得有人去做,ARM可能會這樣做:他這次設(shè)計的CPU是32位的,最多也就能尋址2^32=4G空間,于是把這4GB空間丟給內(nèi)存和端口,讓他們瓜分。但英特爾或許有更好的分配方式……
1、地址的概念
1)物理地址:CPU地址總線傳來的地址,由硬件電路控制其具體含義。物理地址中很大一部分是留給內(nèi)存條中的內(nèi)存的,但也常被映射到其他存儲器上(如顯存、BIOS等)。在程序指令中的虛擬地址經(jīng)過段映射和頁面映射后,就生成了物理地址,這個物理地址被放到CPU的地址線上。
物理地址空間,一部分給物理RAM(內(nèi)存)用,一部分給總線用,這是由硬件設(shè)計來決定的,因此在32 bits地址線的x86處理器中,物理地址空間是2的32次方,即4GB,但物理RAM一般不能上到4GB,因為還有一部分要給總線用(總線上還掛著別的許多設(shè)備)。在PC機中,一般是把低端物理地址給RAM用,高端物理地址給總線用。
2)總線地址:總線的地址線或在地址周期上產(chǎn)生的信號。外設(shè)使用的是總線地址,CPU使用的是物理地址。
物理地址與總線地址之間的關(guān)系由系統(tǒng)的設(shè)計決定的。在x86平臺上,物理地址就是總線地址,這是因為它們共享相同的地址空間——這句話有點難理解,詳見下面的“獨立編址”。在其他平臺上,可能需要轉(zhuǎn)換/映射。比如:CPU需要訪問物理地址是0xfa000的單元,那么在x86平臺上,會產(chǎn)生一個PCI總線上對0xfa000地址的訪問。因為物理地址和總線地址相同,所以憑眼睛看是不能確定這個地址是用在哪兒的,它或者在內(nèi)存中,或者是某個卡上的存儲單元,甚至可能這個地址上沒有對應(yīng)的存儲器。
3)虛擬地址:現(xiàn)代操作系統(tǒng)普遍采用虛擬內(nèi)存管理(Virtual Memory Management)機制,這需要MMU(Memory Management Unit)的支持。MMU通常是CPU的一部分,如果處理器沒有MMU,或者有MMU但沒有啟用,CPU執(zhí)行單元發(fā)出的內(nèi)存地址將直接傳到芯片引腳上,被內(nèi)存芯片(物理內(nèi)存)接收,這稱為物理地址(Physical Address),如果處理器啟用了MMU,CPU執(zhí)行單元發(fā)出的內(nèi)存地址將被MMU截獲,從CPU到MMU的地址稱為虛擬地址(Virtual Address),而MMU將這個地址翻譯成另一個地址發(fā)到CPU芯片的外部地址引腳上,也就是將虛擬地址映射成物理地址。
Linux中,進程的4GB(虛擬)內(nèi)存分為用戶空間、內(nèi)核空間。用戶空間分布為0~3GB(即PAGE_OFFSET,在0X86中它等于0xC0000000),剩下的1G為內(nèi)核空間。程序員只能使用虛擬地址。系統(tǒng)中每個進程有各自的私有用戶空間(0~3G),這個空間對系統(tǒng)中的其他進程是不可見的。
CPU發(fā)出取指令請求時的地址是當前上下文的虛擬地址,MMU再從頁表中找到這個虛擬地址的物理地址,完成取指。同樣讀取數(shù)據(jù)的也是虛擬地址,比如mov ax, var. 編譯時var就是一個虛擬地址,也是通過MMU從也表中來找到物理地址,再產(chǎn)生總線時序,完成取數(shù)據(jù)的。
2、編址方式
1)外設(shè)都是通過讀寫設(shè)備上的寄存器來進行的,外設(shè)寄存器也稱為“I/O端口”,而IO端口有兩種編址方式:獨立編址和統(tǒng)一編制。
統(tǒng)一編址:外設(shè)接口中的IO寄存器(即IO端口)與主存單元一樣看待,每個端口占用一個存儲單元的地址,將主存的一部分劃出來用作IO地址空間,如,在PDP-11中,把最高的4K主存作為IO設(shè)備寄存器地址。端口占用了存儲器的地址空間,使存儲量容量減小。
統(tǒng)一編址也稱為“I/O內(nèi)存”方式,外設(shè)寄存器位于“內(nèi)存空間”(很多外設(shè)有自己的內(nèi)存、緩沖區(qū),外設(shè)的寄存器和內(nèi)存統(tǒng)稱“I/O空間”)。
如,Samsung的S3C2440,是32位ARM處理器,它的4GB地址空間被外設(shè)、RAM等瓜分:
0x8000 1000 LED 8*8點陣的地址
0x4800 0000 ~ 0x6000 0000 SFR(特殊暫存器)地址空間
0x3800 1002 鍵盤地址
0x3000 0000 ~ 0x3400 0000 SDRAM空間
0x2000 0020 ~ 0x2000 002e IDE
0x1900 0300 CS8900
獨立編址(單獨編址):IO地址與存儲地址分開獨立編址,I/O端口地址不占用存儲空間的地址范圍,這樣,在系統(tǒng)中就存在了另一種與存儲地址無關(guān)的IO地址,CPU也必須具有專用與輸入輸出操作的IO指令(IN、OUT等)和控制邏輯。獨立編址下,地址總線上過來一個地址,設(shè)備不知道是給IO端口的、還是給存儲器的,于是處理器通過MEMR/MEMW和IOR/IOW兩組控制信號來實現(xiàn)對I/O端口和存儲器的不同尋址。如,intel 80x86就采用單獨編址,CPU內(nèi)存和I/O是一起編址的,就是說內(nèi)存一部分的地址和I/O地址是重疊的。
獨立編址也稱為“I/O端口”方式,外設(shè)寄存器位于“I/O(地址)空間”。
對于x86架構(gòu)來說,通過IN/OUT指令訪問。PC架構(gòu)一共有65536個8bit的I/O端口,組成64K個I/O地址空間,編號從0~0xFFFF,有16位,80x86用低16位地址線A0-A15來尋址。連續(xù)兩個8bit的端口可以組成一個16bit的端口,連續(xù)4個組成一個32bit的端口。I/O地址空間和CPU的物理地址空間是兩個不同的概念,例如I/O地址空間為64K,一個32bit的CPU物理地址空間是4G。如,在Intel 8086+Redhat9.0 下用“more /proc/ioports”可看到:[!--empirenews.page--]
0000-001f : dma1
0020-003f : pic1
0040-005f : timer
0060-006f : keyboard
0070-007f : rtc
0080-008f : dma page reg
00a0-00bf : pic2
00c0-00df : dma2
00f0-00ff : fpu
0170-0177 : ide1
……
不過Intel x86平臺普通使用了名為內(nèi)存映射(MMIO)的技術(shù),該技術(shù)是PCI規(guī)范的一部分,IO設(shè)備端口被映射到內(nèi)存空間,映射后,CPU訪問IO端口就如同訪問內(nèi)存一樣??碔ntel TA 719文檔給出的x86/x64系統(tǒng)典型內(nèi)存地址分配表:
系統(tǒng)資源 占用
------------------------------------------------------------------------
BIOS 1M
本地APIC 4K
芯片組保留 2M
IO APIC 4K
PCI設(shè)備 256M
PCI Express設(shè)備 256M
PCI設(shè)備(可選) 256M
顯示幀緩存 16M
TSEG 1M
對于某一既定的系統(tǒng),它要么是獨立編址、要么是統(tǒng)一編址,具體采用哪一種則取決于CPU的體系結(jié)構(gòu)。 如,PowerPC、m68k等采用統(tǒng)一編址,而X86等則采用獨立編址,存在IO空間的概念。目前,大多數(shù)嵌入式微控制器如ARM、PowerPC等并不提供I/O空間,僅有內(nèi)存空間,可直接用地址、指針訪問。但對于Linux內(nèi)核而言,它可能用于不同的CPU,所以它必須都要考慮這兩種方式,于是它采用一種新的方法,將基于I/O映射方式的或內(nèi)存映射方式的I/O端口通稱為“I/O區(qū)域”(I/O region),不論你采用哪種方式,都要先申請IO區(qū)域:request_resource(),結(jié)束時釋放它:release_resource()。
二、linux I/O端口與I/O內(nèi)存
IO端口:當一個寄存器或者內(nèi)存位于IO空間時;
IO內(nèi)存:當一個內(nèi)存或者寄存器位于內(nèi)存空間時;
在一些CPU制造商在其芯片上實現(xiàn)了一個單地址空間(統(tǒng)一編址)的同時,其它的CPU制造商認為外設(shè)不同于內(nèi)存,應(yīng)該有一個獨立的地址空間給外設(shè)(單獨編址),其生產(chǎn)處理器(特別是x86家族)的I/O端口有自己的讀寫信號線和特殊的CPU指令來存取端口。因為外設(shè)要與外設(shè)總線相匹配,并且大部分流行的I/O總線都是以個人計算機(主要是x86家族)作為模型,所以即便那些沒有單獨地址空間給I/O端口的處理器,也必須在訪問外設(shè)時模擬成讀寫端口。這通常通過外部芯片組(PC中的南北橋)或者在CPU核中附加額外電路來實現(xiàn)(基于嵌入式應(yīng)用的處理器)。
由于同樣的理由,Linux在所有計算機平臺上都實現(xiàn)了I/O端口,甚至在那些單地址空間的CPU平臺上(模擬I/O端口)。但并不是所有的設(shè)備都會將其寄存器映射到I/O端口。雖然ISA設(shè)備普遍使用I/O端口,但大部分PCI設(shè)備將寄存器映射到某個內(nèi)存地址區(qū)。這種I/O內(nèi)存方法通常是首選的,因為它無需使用特殊的處理器指令,CPU存取內(nèi)存也更有效率,并且編譯器在存取內(nèi)存時在寄存器分配和尋址模式的選擇上有更多自由。
1.IO寄存器和常規(guī)內(nèi)存
I/O寄存器和RAM的主要不同是I/O操作有邊際效應(yīng)(side effect),而內(nèi)存操作沒有:訪問內(nèi)存只是在內(nèi)存某一位置存儲數(shù)值。因為內(nèi)存存取速度嚴重影響CPU的性能,編譯器可能會對源碼進行優(yōu)化,主要是:使用高速緩存和重排讀/寫指令的順序。對于傳統(tǒng)內(nèi)存(至少在單處理器系統(tǒng))這些優(yōu)化是透明有益的,但是對于I/O 寄存器,這可能是致命錯誤,因為它們干擾了那些"邊際效應(yīng)"(驅(qū)動程序存取I/O 寄存器就是為了獲取邊際效應(yīng))。因此,驅(qū)動程序必須確保在存取寄存器時,不能使用高速緩存并且不能重新編排讀寫指令的順序。
side effect 是指:訪問I/O寄存器時,不僅僅會像訪問普通內(nèi)存一樣影響存儲單元的值,更重要的是它可能改變CPU的I/O端口電平、輸出時序或CPU對I/O端口電平的反應(yīng)等等,從而實現(xiàn)CPU的控制功能。CPU在電路中的意義就是實現(xiàn)其side effect 。舉個例子,有些設(shè)備的中斷狀態(tài)寄存器只要一讀取,便自動清零。
硬件緩沖的問題是最易解決的:只要將底層硬件配置(或者自動地或者通過Linux 初始化代碼)為當存取I/O區(qū)時,禁止任何硬件緩沖(不管是I/O 內(nèi)存還是I/O 端口)。
編譯器優(yōu)化和硬件重編排讀寫指令順序的解決方法是:在硬件或處理器必須以一個特定順序執(zhí)行的操作之間安放一個內(nèi)存屏障(memory barrier)。
2.操作IO端口(申請,訪問,釋放):
I/O 端口是驅(qū)動用來和很多設(shè)備通訊的方法。
(1)申請I/O 端口:
在驅(qū)動還沒獨占設(shè)備之前,不應(yīng)對端口進行操作。內(nèi)核提供了一個注冊接口,以允許驅(qū)動聲明其需要的端口:
/* request_region告訴內(nèi)核:要使用first開始的n個端口。參數(shù)name為設(shè)備名。如果分配成功返回值是非NULL;否則無法使用需要的端口(/proc/ioports包含了系統(tǒng)當前所有端口的分配信息,若request_region分配失敗時,可以查看該文件,看誰先用了你要的端口) */struct resource *request_region(unsigned long first, unsigned long n, const char *name);
(2)訪問IO端口:
在驅(qū)動成功請求到I/O 端口后,就可以讀寫這些端口了。大部分硬件會將8位、16位和32位端口區(qū)分開,無法像訪問內(nèi)存那樣混淆使用。驅(qū)動程序必須調(diào)用不同的函數(shù)來訪問不同大小的端口。
Linux 內(nèi)核頭文件(體系依賴的頭文件
/* inb/outb:讀/寫字節(jié)端口(8位寬)。有些體系將port參數(shù)定義為unsigned long;而有些平臺則將它定義為unsigned short。inb的返回類型也是依賴體系的 */unsigned inb(unsigned port);void outb(unsigned char byte, unsigned port);/* inw/outw:讀/寫字端口(16位寬) */unsigned inw(unsigned port);void outw(unsigned short word, unsigned port);/* inl/outl:讀/寫32位端口。longword也是依賴體系的,有的體系為unsigned long;而有的為unsigned int */unsigned inl(unsigned port);void outl(unsigned longword, unsigned port);
(3)釋放IO端口:
/* 用完I/O端口后(可能在模塊卸載時),應(yīng)當調(diào)用release_region將I/O端口返還給系統(tǒng)。參數(shù)start和n應(yīng)與之前傳遞給request_region一致 */void release_region(unsigned long start, unsigned long n);[!--empirenews.page--]
3.操作IO內(nèi)存(申請,映射,訪問,釋放):
盡管 I/O 端口在x86世界中非常流行,但是用來和設(shè)備通訊的主要機制是通過內(nèi)存映射的寄存器和設(shè)備內(nèi)存,兩者都稱為I/O 內(nèi)存,因為寄存器和內(nèi)存之間的區(qū)別對軟件是透明的。
I/O 內(nèi)存僅僅是一個類似于RAM 的區(qū)域,處理器通過總線訪問該區(qū)域,以實現(xiàn)對設(shè)備的訪問。同樣,讀寫這個區(qū)域是有邊際效應(yīng)。
根據(jù)計算機體系和總線不同,I/O 內(nèi)存可分為可以或者不可以通過頁表來存取。若通過頁表存取,內(nèi)核必須先重新編排物理地址,使其對驅(qū)動程序可見,這就意味著在進行任何I/O操作之前,你必須調(diào)用ioremap;如果不需要頁表,I/O內(nèi)存區(qū)域就類似于I/O端口,你可以直接使用適當?shù)腎/O函數(shù)讀寫它們。
由于邊際效應(yīng)的緣故,不管是否需要 ioremap,都不鼓勵直接使用I/O內(nèi)存指針,而應(yīng)使用專門的I/O內(nèi)存操作函數(shù)。這些I/O內(nèi)存操作函數(shù)不僅在所有平臺上是安全,而且對直接使用指針操作 I/O 內(nèi)存的情況進行了優(yōu)化。
(1)申請I/O 內(nèi)存:
I/O 內(nèi)存區(qū)在使用前必須先分配。分配內(nèi)存區(qū)的函數(shù)接口在
/* request_mem_region分配一個開始于start,len字節(jié)的I/O內(nèi)存區(qū)。分配成功,返回一個非NULL指針;否則返回NULL。系統(tǒng)當前所有I/O內(nèi)存分配信息都在/proc/iomem文件中列出,你分配失敗時,可以看看該文件,看誰先占用了該內(nèi)存區(qū) */struct resource *request_mem_region(unsigned long start, unsigned long len, char *name);
(2)映射:
在訪問I/O內(nèi)存之前,分配I/O內(nèi)存并不是唯一要求的步驟,你還必須保證內(nèi)核可存取該I/O內(nèi)存。訪問I/O內(nèi)存并不只是簡單解引用指針,在許多體系中,I/O 內(nèi)存無法以這種方式直接存取。因此,還必須通過ioremap 函數(shù)設(shè)置一個映射。
/* ioremap用于將I/O內(nèi)存區(qū)映射到虛擬地址。參數(shù)phys_addr為要映射的I/O內(nèi)存起始地址,參數(shù)size為要映射的I/O內(nèi)存的大小,返回值為被映射到的虛擬地址 */void *ioremap(unsigned long phys_addr, unsigned long size);
(3)訪問IO內(nèi)存:
經(jīng)過 ioremap之后,設(shè)備驅(qū)動就可以存取任何I/O內(nèi)存地址。注意,ioremap返回的地址不可以直接解引用;相反,應(yīng)當使用內(nèi)核提供的訪問函數(shù)。訪問I/O內(nèi)存的正確方式是通過一系列專門用于實現(xiàn)此目的的函數(shù):
#include
(4)釋放IO內(nèi)存步驟:
void iounmap(void * addr); /* iounmap用于釋放不再需要的映射 */void release_mem_region(unsigned long start, unsigned long len); /* iounmap用于釋放不再需要的映射 */
4、像IO內(nèi)存一樣使用端口
一些硬件有一個有趣的特性: 有些版本使用 I/O 端口;而有些版本則使用 I/O 內(nèi)存。不管是I/O 端口還是I/O 內(nèi)存,處理器見到的設(shè)備寄存器都是相同的,只是訪問方法不同。為了統(tǒng)一編程接口,使驅(qū)動程序易于編寫,2.6 內(nèi)核提供了一個ioport_map函數(shù):
/* ioport_map重新映射count個I/O端口,使它們看起來I/O內(nèi)存。此后,驅(qū)動程序可以在ioport_map返回的地址上使用ioread8和同類函數(shù)。這樣,就可以在編程時,消除了I/O 端口和I/O 內(nèi)存的區(qū)別 */void *ioport_map(unsigned long port, unsigned int count);void ioport_unmap(void *addr);/* ioport_unmap用于釋放不再需要的映射 */
注意,I/O 端口在重新映射前必須使用request_region分配分配所需的I/O 端口。
5、ARM體系的IO操作接口
s3c24x0處理器使用的是I/O內(nèi)存,也就是說:s3c24x0處理器使用統(tǒng)一編址方式,I/O寄存器和內(nèi)存使用的是單一地址空間,并且讀寫I/O寄存器和讀寫內(nèi)存的指令是相同的。所以推薦使用I/O內(nèi)存的相關(guān)指令和函數(shù)。但這并不表示I/O端口的指令在s3c24x0中不可用。如果你注意過s3c24x0關(guān)于I/O方面的內(nèi)核源碼,你就會發(fā)現(xiàn):其實I/O端口的指令只是一個外殼,內(nèi)部還是使用和I/O內(nèi)存一樣的代碼。注意以下幾點:
1)所有的讀寫指令(I/O操作函數(shù))所賦的地址必須都是虛擬地址,你有兩種選擇:使用內(nèi)核已經(jīng)定義好的地址,如在include/asm-arm/arch-s3c2410/regs-xxx.h中定義了s3c2410處理器各外設(shè)寄存器地址(其他處理器芯片也可在類似路徑找到內(nèi)核定義好的外設(shè)寄存器的虛擬地址;另一種方法就是使用自己用ioremap映射的虛擬地址。絕對不能使用實際的物理地址,否則會因為內(nèi)核無法處理地址而出現(xiàn)oops。[!--empirenews.page--]
2)在使用I/O指令時,可以不使用request_region和request_mem_region,而直接使用outb、ioread等指令。因為request的功能只是告訴內(nèi)核端口被誰占用了,如再次request,內(nèi)核會制止(資源busy)。但是不推薦這么做,這樣的代碼也不規(guī)范,可能會引起并發(fā)問題(很多時候我們都需要獨占設(shè)備)。
3)在使用I/O指令時,所賦的地址數(shù)據(jù)有時必須通過強制類型轉(zhuǎn)換為 unsigned long ,不然會有警告。
4)在include\asm-arm\arch-s3c2410\hardware.h中定義了很多io口的操作函數(shù),有需要可以在驅(qū)動中直接使用,很方便。