Linux操作系統(tǒng)之快速內(nèi)存操作技術(shù)
掃描二維碼
隨時(shí)隨地手機(jī)看文章
我們總希望能在內(nèi)核空間和用戶(hù)空間自由交換數(shù)據(jù),傳統(tǒng)的方式是采用內(nèi)核提供的vma機(jī)制,通過(guò)copy_to/from_user之類(lèi)的方法來(lái)實(shí)現(xiàn)。這對(duì)于高速數(shù)據(jù)塊傳送是不可取的。 其實(shí)kswapd有時(shí)交換數(shù)據(jù)至外存時(shí),性能相當(dāng)差,一般而言,你的PC主存并不見(jiàn)得就用盡了,而且很多應(yīng)用并是你所關(guān)心的,但卻實(shí)實(shí)在在消耗你的計(jì)算資源,此時(shí),你可能會(huì)想到采用實(shí)地址操作你的應(yīng)用(盡管有MMU的支持),在uClinux中,當(dāng)沒(méi)有MMU時(shí),工作起來(lái)是挺爽的。
最方便的,最高效的,無(wú)非是實(shí)地址下,操作物理內(nèi)存,相當(dāng)于DMA.盡管Linux 2.6內(nèi)核在VMA方面的性能要優(yōu)于2.4,但swap機(jī)制有一定的缺限。在VxWorks中,對(duì)內(nèi)存的管理是很細(xì)致且精確的。如果你在Linux下申請(qǐng)大塊內(nèi)存操作時(shí),當(dāng)觸發(fā)kswap快速交換回主存時(shí),你會(huì)發(fā)現(xiàn)你的計(jì)算機(jī) 哪一段時(shí)間,幾乎要休息幾分鐘,盡管你看起來(lái)free輸出的頁(yè)面已經(jīng)很多了,但此時(shí)的外存幾乎一直忙著,且CPU負(fù)荷相當(dāng)重,這時(shí)也可能你根本就沒(méi)做任何操作。
有沒(méi)有辦法既在VMA機(jī)制下工作,又能直接處理主存數(shù)據(jù)呢?
回答是肯定的。內(nèi)核啟動(dòng)后,會(huì)將主存映射為/dev/mem,當(dāng)我們?cè)赩MA中申請(qǐng)一塊邏輯區(qū)間后,將轉(zhuǎn)換的物理地址傳與用戶(hù)空間,用戶(hù)空間就可以線性操作這段區(qū)間了,直接采用mmap就可以在物理主存中讀寫(xiě)。
還有更快的方式嗎?不采用mmap行嗎?
當(dāng)然有,當(dāng)VMA將物理區(qū)塊地址及大小傳與用戶(hù)空間后,用戶(hù)完全可以采用地址讀寫(xiě)模式,這幾近于機(jī)器指令操作了(可以獨(dú)立于OS之外)。 此種實(shí)現(xiàn)方式很簡(jiǎn)單,首先打開(kāi)/dev/mem,直接定位至VMA傳上來(lái)的地址就可以操作了,無(wú)需mmap.通知用戶(hù)空間,可以采用procfs/sysfs等。
強(qiáng)烈建議:在邊界控制上,一定要精確細(xì)致,不推薦初學(xué)者采用,一旦越界,可能引起“Kernel Panic”。 更有可能就DOWN了。 對(duì)于此實(shí)現(xiàn)方式,建議參考mapper(LDD3)程序。 同時(shí),也可以用mapper檢查讀寫(xiě)是否正確。
新的IA32中,PAGE_SIZE = 4K MAX_ORDER = 11 ,gfp最大申請(qǐng)4M線性邏輯空間,減去PAGE_OFFSET即可得到物理地址。 如果采用了HIMEM和NUMA,請(qǐng)參見(jiàn)Kernel關(guān)于內(nèi)存映射的算法。 當(dāng)主存達(dá)到1G或超過(guò)時(shí),請(qǐng)減小用戶(hù)空間大小。
隨著硬件技術(shù)的發(fā)展,VMA在主存相當(dāng)大時(shí),可以考慮進(jìn)行修正,完全可以集中采用物理映射方式。沒(méi)必要交換了。否則,反而影響性能。 32位平臺(tái),如果主存2G,采用SWAP會(huì)使得性能有較大下降。 而在大容量數(shù)據(jù)傳輸時(shí),也不可能采用SWAP方式的,不允許換出。 建議Linus在VMA中加入進(jìn)程分類(lèi),不平類(lèi)別的應(yīng)用,分配不同的內(nèi)存塊。 小數(shù)據(jù)PAGE_SIZE = 4K/大數(shù)據(jù)4M/128M. 地址模式全轉(zhuǎn)換為64位,兼容32位,當(dāng)應(yīng)用于Embedded系統(tǒng)時(shí),直接使用32位模式。
如將做成多個(gè)微系統(tǒng),不同微核,運(yùn)行不同應(yīng)用(不同的進(jìn)程管理,內(nèi)存管理,文件管理),只是接口可以統(tǒng)一,不同標(biāo)志而已。