當(dāng)前位置:首頁 > 公眾號精選 > 嵌入式客棧
[導(dǎo)讀]看了很多關(guān)于linux內(nèi)存管理的文章還是云里霧里,聽了很多關(guān)于linux內(nèi)存管理的課程還是一頭霧水。其實(shí)很多時(shí)候造成不懂的原因不是資料太少,恰恰是資料太多,而且各個(gè)內(nèi)核版本的差異,32位64位的不同,文章的胡編亂造等都給讀者帶來疑惑。本著對內(nèi)存深度剖析的

看了很多關(guān)于linux內(nèi)存管理的文章還是云里霧里,聽了很多關(guān)于linux內(nèi)存管理的課程還是一頭霧水。其實(shí)很多時(shí)候造成不懂的原因不是資料太少,恰恰是資料太多,而且各個(gè)內(nèi)核版本的差異,32位64位的不同,文章的胡編亂造等都給讀者帶來疑惑。本著對內(nèi)存深度剖析的態(tài)度,希望以版本kernel-4.14,架構(gòu)AARCH64為專題做個(gè)內(nèi)存管理的架構(gòu)性整理。

這篇文章我們先來看下linux在啟動(dòng)過程中的初始化。


創(chuàng)建啟動(dòng)頁表:

在匯編代碼階段的head.S文件中,負(fù)責(zé)創(chuàng)建映射關(guān)系的函數(shù)是create_page_tablescreate_page_tables函數(shù)負(fù)責(zé)identity mapping和kernel image mapping。

  • identity map:是指把idmap_text區(qū)域的物理地址映射到相等的虛擬地址上,這種映射完成后,其虛擬地址等于物理地址。idmap_text區(qū)域都是一些打開MMU相關(guān)的代碼。

  • kernel image map:將kernel運(yùn)行需要的地址(kernel txt、rodata、data、bss等等)進(jìn)行映射。

arch/arm64/kernel/head.S:ENTRY(stext) bl preserve_boot_args bl el2_setup // Drop to EL1, w0=cpu_boot_mode adrp x23, __PHYS_OFFSET and x23, x23, MIN_KIMG_ALIGN - 1 // KASLR offset, defaults to 0 bl set_cpu_boot_mode_flag bl __create_page_tables /* * The following calls CPU setup code, see arch/arm64/mm/proc.S for * details. * On return, the CPU will be ready for the MMU to be turned on and * the TCR will have been set. */ bl __cpu_setup // initialise processor b __primary_switchENDPROC(stext)

__create_page_tables主要執(zhí)行的就是identity map和kernel image map:

 __create_page_tables:...... create_pgd_entry x0, x3, x5, x6 mov x5, x3 // __pa(__idmap_text_start) adr_l x6, __idmap_text_end // __pa(__idmap_text_end) create_block_map x0, x7, x3, x5, x6
/* * Map the kernel image (starting with PHYS_OFFSET). */ adrp x0, swapper_pg_dir mov_q x5, KIMAGE_VADDR + TEXT_OFFSET // compile time __va(_text) add x5, x5, x23 // add KASLR displacement create_pgd_entry x0, x5, x3, x6 adrp x6, _end // runtime __pa(_end) adrp x3, _text // runtime __pa(_text) sub x6, x6, x3 // _end - _text add x6, x6, x5 // runtime __va(_end) create_block_map x0, x7, x3, x5, x6 ......

其中調(diào)用create_pgd_entry進(jìn)行PGD及所有中間level(PUD, PMD)頁表的創(chuàng)建,調(diào)用create_block_map進(jìn)行PTE頁表的映射。關(guān)于四級頁表的關(guān)系如下圖所示,這里就不進(jìn)一步解釋了。


匯編結(jié)束后的內(nèi)存映射關(guān)系如下圖所示:


當(dāng)執(zhí)行完上面的map之后,MMU就已經(jīng)打開了并且開始進(jìn)入C代碼運(yùn)行階段,那么下一步就要對dtb進(jìn)行映射了。


fixmap區(qū)之dtb map:

在執(zhí)行setup_arch中,會最先進(jìn)行early_fixmap_init(),這個(gè)函數(shù)就是用來map dtb的,但是它只會建立dtb對應(yīng)的這段物理地址中間level的頁表entry,而最后一個(gè)level的頁表映射則通過setup_machine_fdt函數(shù)里的fixmap_remap_fdt來創(chuàng)建。

void *__init fixmap_remap_fdt(phys_addr_t dt_phys){ void *dt_virt; int size;
dt_virt = __fixmap_remap_fdt(dt_phys, &size, PAGE_KERNEL_RO); if (!dt_virt) return NULL;
memblock_reserve(dt_phys, size); return dt_virt; }

fixmap_remap_fdt主要是為fdt建立地址映射,在該函數(shù)的最后,順便就調(diào)用memblock_reserve保留了該段內(nèi)存。

可以看出dtb的映射采用的是fixmap,所謂fixmap就是固定映射,它需要我們明確的知道想要映射的物理地址,并把這段地址映射到想要映射的虛擬地址上。當(dāng)然這里固定映射還有些片面,因?yàn)樵趂ixmap機(jī)制實(shí)現(xiàn)上,也有支持動(dòng)態(tài)分配虛擬地址的功能,這個(gè)功能主要用于臨時(shí)fixmap映射(這個(gè)臨時(shí)映射就是用來執(zhí)行early ioremap使用的。),而dtb的映射屬于永久映射。


fixmap區(qū)之early ioremap:

對于一些硬件需要在內(nèi)存管理系統(tǒng)起來之前就要工作的,我們就可以使用這種機(jī)制來映射內(nèi)存給這些硬件driver使用。各個(gè)模塊在使用完early ioremap的地址后,需要盡快把這段映射的虛擬地址釋放掉,這樣才能反復(fù)被其他模塊繼續(xù)申請使用。

early_ioremap_init會調(diào)用early_ioremap_setup:

可見它的實(shí)現(xiàn)是依賴fixmap的,所以它必須要在early_fixmap_init之后才能運(yùn)行。

注意:如果想要在伙伴系統(tǒng)初始化之前進(jìn)行設(shè)備寄存器的訪問,那么可以考慮early IO remap機(jī)制。

至此我們已經(jīng)知道dtb和early ioremap都是在fixmap區(qū)的,如下圖:


系統(tǒng)內(nèi)存的布局:

完成dtb的map之后,內(nèi)核可以訪問這一段的內(nèi)存了,通過解析dtb中的內(nèi)容,內(nèi)核可以勾勒出整個(gè)內(nèi)存布局的情況,為后續(xù)內(nèi)存管理初始化奠定基礎(chǔ)。這一步主要在setup_machine_fdt中完成。這里就不看代碼了,其調(diào)用流程是:setup_machine_fdt->early_init_dt_scan->early_init_dt_scan_nodes

就像注釋中所示內(nèi)核根據(jù)dtb的不同node勾勒出choosen node,root node,memory node相應(yīng)內(nèi)存區(qū)域。

除了這3個(gè)node,還有一個(gè)reserved-memory node,它是在上面講到dtb map的時(shí)候fixmap_remap_fdt函數(shù)做的。下面我們看下這4個(gè)node的具體實(shí)現(xiàn)。

  • choosen node

該節(jié)點(diǎn)有一個(gè)bootargs屬性,該屬性定義了內(nèi)核的啟動(dòng)參數(shù),比如mem= xx,此外,還處理initrd相關(guān)的property,并保存在initrd_start和initrd_end這兩個(gè)全局變量中。

  • root node

與內(nèi)存無關(guān),暫時(shí)不詳述,以后有機(jī)會講到device tree系列再詳述。

  • memory node

通過memblock_add加入到memblock.memory對應(yīng)的memblock_type鏈表中進(jìn)行管理。


接下來到arm64_memblock_init函數(shù):

void __init arm64_memblock_init(void){...... memblock_reserve(__pa_symbol(_text), _end - _text); 1.kernel image保留區(qū) #ifdef CONFIG_BLK_DEV_INITRD if (initrd_start) { memblock_reserve(initrd_start, initrd_end - initrd_start); 2.initrd保留區(qū) /* the generic initrd code expects virtual addresses */ initrd_start = __phys_to_virt(initrd_start); initrd_end = __phys_to_virt(initrd_end); } #endif early_init_fdt_scan_reserved_mem(); 3.dts中配置為保留的區(qū)域......}
  1. reserve內(nèi)核代碼、數(shù)據(jù)區(qū)等(_text到_end那一段,具體的內(nèi)容可以參考內(nèi)核鏈接腳本)

  2. 保留initital ramdisk image區(qū)域(從initrd_start到initrd_end區(qū)域)

  3. reserved-memory node 如下所示:


完成:

通過上面的一系列操作,需要?jiǎng)討B(tài)管理的內(nèi)存已經(jīng)被放到了memory type和reserved type這兩個(gè)region中了,現(xiàn)在內(nèi)存已經(jīng)被memblock模塊所管理了,這只是啟動(dòng)后的第一步,后續(xù)內(nèi)存才會加入到伙伴系統(tǒng)去管理。

END

往期精彩推薦,點(diǎn)擊即可閱讀




▲Linux內(nèi)核中I2C總線及設(shè)備長啥樣?  [墻裂推薦]
學(xué)習(xí)AI之機(jī)器學(xué)習(xí)概念篇
手把手教系列之IIR數(shù)字濾波器設(shè)計(jì)實(shí)現(xiàn)

麻煩給個(gè)好看!

免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺僅提供信息存儲服務(wù)。文章僅代表作者個(gè)人觀點(diǎn),不代表本平臺立場,如有問題,請聯(lián)系我們,謝謝!

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動(dòng)現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動(dòng)力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉