S3C2416帶有CP15協(xié)處理器,里面集成了16KB的I/D-Cache和MMU。MMU負責虛擬地址到物理地址的映射,并提供硬件機制的內存訪問權限檢查。筆者此處就MMU的使用作一個簡單的介紹。
1. MMU映射時存儲器訪問ARM CPU使用表格存儲虛擬地址對應的物理地址,這類表格稱為頁表,頁表由一個個條目組成,每個條目存儲了一段虛擬地址對應的物理地址及其訪問權限,或者下一級頁表的地址。
當ARM要訪問存儲器時,根據MMU設定的一級頁表基址(16KB對齊)以及虛擬地址一級頁表索引[31:20],產生一個第一級描述符地址。MMU先查找TLB(轉譯查找緩存)中的虛擬地址表,如果是取指,則用指令TLB,否則用數據TLB。TLB的作用就是緩存之前遍歷使用過的頁表條目,避免每一次地址轉換都去主存頁表查找對應的條目,不然性能無法忍受。如果TLB中有第一級描述符地址的入口,則可直接得到該虛擬地址對應的一級頁表描述符。描述符包括了訪問權限、域、高速緩存、轉換基址(二級頁表基地)等信息。如果TLB沒有第一級描述符地址的入口,則轉換表遍歷,硬件從主存儲器轉換表中獲取對應的條目,并放入到TLB中。
S3C2416最多會使用到兩級頁表。以段(1MB)的方式進行轉換時只用一級頁表,以頁方式進行轉換時用到兩級頁表。頁的大小有3種,分大頁(64KB)、小頁(4KB)、微頁(1KB)。
當從TLB得到的一級頁表描述符為段描述符時,從描述符中可以直接得到這段的段轉換基址(1MB對齊),域和權限訪問,高速緩存的信息。根據段轉換基址以及虛擬地址[19:0]可以得到對應要訪問的物理地址。
圖1-1 訪問段描述符
當從TLB得到的一級頁表描述符為粗頁描述符時,從描述符中直接得到粗頁表的基址(1KB對齊),域訪問信息。粗頁表每個條目表示4KB的物理地址空間。根據粗頁表基址以及虛擬地址粗頁表索引[19:12]可以得到第二級描述符地址,從而得到第二級頁表描述符。第二級頁表描述符可以直接得到大頁、小頁或微頁中三者之一的頁基址,訪問權限,高速緩存控制信息。根據頁基址以及虛擬地址[11:0]得到對應要訪問的物理地址。
圖1-2 訪問粗頁第二級描述符
當從TLB得到的一級頁表描述符為細頁描述符時,從描述符中直接得到細頁表的基址(4KB對齊),域訪問信息。細頁表每個條目表示1KB的物理地址空間。根據細頁表基址以及虛擬地址細頁表索引[19:10]可以得到第二級描述符地址,從而得到第二級頁表描述符。第二級頁表描述符可以直接得到大頁、小頁或微頁中三者之一的頁基址,訪問權限,高速緩存控制信息。根據頁基址以及虛擬地址[9:0]得到對應要訪問的物理地址。
圖1-3 訪問細頁第二級描述符
2. Cache一般而言,存儲器對于cpu來說都是慢速設備。如果每次取指或讀寫數據都去訪問主存儲器,則cpu必須等待主存儲器讀取完成才能進一步往下處理,性能無法忍受。筆者測試相同代碼開了Cache與不開Cache,性能有天壤之別。Cache就是在主存與cpu通用寄存器間設置的一個高速,但容量較小的存儲器。它能夠緩存部分之前執(zhí)行的代碼(或讀取的數據)以及目前正在執(zhí)行的這段代碼(或讀取的數據)。開啟了Cache后,當cpu需要取指(或讀取數據),如果Cache中有緩存,則直接從Cache中獲取返回,否則訪問主存儲器。由于程序訪問的局部性,Cache具有很高的命中率,對提高程序的運行性能有很大的作用。
3. MMU映射代碼實現(xiàn)在嵌入式設計中,一般為了提高性能,是需要開啟MMU的,對開D-Cache,是必須在MMU開啟后才能使用。S3C2416從IROM SD/MMC啟動時,ARM 0x0偏移處異常向量表位置是內部固化代碼地址。如果不對0x0處地址進行內存映射,則無法使用中斷。我們采用段方式進行映射,每個條目對應1MB的物理地址空間,32位地址空間共需4096條條目,即需16KB的頁表內存空間。我們實現(xiàn)的MMU模塊頭文件MMU.h內容如下:
#ifndef__MMU_H__
#define__MMU_H__
#ifdef__cplusplus
extern"C" {
#endif
// ICache使能控制位
#define R1_I (1<<12)
// DCache使能控制位
#define R1_C (1<<2)
// 地址對齊檢查使能控制位
#define R1_A (1<<1)
// MMU使能控制位
#defineR1_M (1<<0)
// 段標識符,以段(1MB)方式進行映射
#define DESC_SEC ((1<<1)"(1<<4))
// cache_on, write_back cache會出現(xiàn)命中的情況
#define CB (3<<2)
// cache_on, write_through
#define CNB (2<<2)
// cache_off,WR_BUF on cache不會出現(xiàn)命中的情況
#define NCB (1<<2)
// cache_off,WR_BUF off
#define NCNB (0<<2)
//supervisor=RW, user=RW
#define AP_RW (3<<10)
//supervisor=RW, user=RO
#define AP_RO (2<<10)
//supervisor=RW, user=No access
#define AP_NO (1<<10)
// 任何訪問都將導致"Domain fault"
#defineDOMAIN_FAULT (0x0)
// 使用描述符中的設置進行權限檢查
#defineDOMAIN_CHK (0x1)
// 不進行權限檢查,允許任何訪問
#define DOMAIN_NOTCHK (0x3)
// 在域0檢查權限
#define DOMAIN0 (0x0<<5)
// 在域1檢查權限
#define DOMAIN1 (0x1<<5)
// 域0屬性為用描述符權限進行權限檢查
#defineDOMAIN0_ATTR (DOMAIN_CHK<<0)
// 域1屬性為不可訪問
#defineDOMAIN1_ATTR (DOMAIN_FAULT<<2)
// 段描述符域0可讀寫,開cache 寫緩存
#define RW_CB (AP_RW|DOMAIN0|CB|DESC_SEC)
#defineRW_CNB (AP_RW|DOMAIN0|CNB|DESC_SEC)
#defineRW_NCB (AP_RW|DOMAIN0|NCB|DESC_SEC)
#defineRW_NCNB (AP_RW|DOMAIN0|NCNB|DESC_SEC)
// 段描述符域1不可訪問
#defineRW_FAULT (AP_RW|DOMAIN1|NCNB|DESC_SEC)
void MMU_EnableICache(void);// 使能ICache
voidMMU_DisableICache(void); // 禁止ICache
voidMMU_EnableDCache(void); // 使能DCache
voidMMU_DisableDCache(void); // 禁止DCache
voidMMU_EnableAlignFault(void); // 使能對齊檢查
voidMMU_EnableMMU(void); // 使能MMU
voidMMU_DisableMMU(void); // 禁止MMU
voidMMU_SetTTBase(int Base); // Set TTBase
voidMMU_SetDomain(int Domain); // Set Domain
voidMMU_InvalidateICache(void); // 無效ICache
voidMMU_InvalidateDCache(void); // 無效DCache
voidMMU_InvalidateTLB(void); // 無效TLB
voidMMU_SetProcessId(unsigned int pid); // Process ID
voidMMU_Init(void); // MMU頁表初始化
unsigned int*MMU_GetTableBase(void); // 獲取MMU頁表內存地址
voidMMU_SetMTT(unsigned int vaddrStart,unsigned int vaddrEnd,
unsigned int paddrStart,unsignedint attr);
#ifdef__cplusplus
}
#endif
#endif /*__MMU_H__*/
我們在MMU模塊MMU.c中實現(xiàn)對段映射的MMU頁表的設置初始化,對于寄存器空間,一般是1:1映射且段屬性不能開Cache和寫緩存,因為寄存器的值可能隨時都發(fā)生變化,每次讀寫均應從寄存器處讀寫。MMU映射除了異常向量表由0x0地址映射到用戶異常向量表地址處外,其它空間均1:1映射,對于內存空間,開Cache和寫緩存。模塊代碼實現(xiàn)如下:
#include "MMU.h"
// MMU頁表在編譯器初始化代碼之前調用,分配一個16k對齊16k大小MMU內存段,
// 這里讓編譯器分配這個全局內存塊,一定不能讓編譯器初始化這部分內存
// 用__attribute__限制為未初始化段,不要讓編譯器初始化
__align(0x4000) static unsigned char MMU_PageTable[0x4000]
__attribute__((section("MMU_Mem"),zero_init));
unsigned int*MMU_GetTableBase(void)
{
return (unsigned int *)MMU_PageTable;
}
voidMMU_Init(void)
{
// 引入用戶代碼運行基址,0x0處向量表重映射到用戶代碼向量表位置處
extern unsigned int __CodeAddr__;
MMU_DisableDCache(); // 禁用DCache
MMU_DisableICache(); // 禁用ICache
MMU_InvalidateDCache(); // 使16K DCache無效
MMU_InvalidateICache(); // 使16K ICache無效
MMU_EnableICache(); // 加快執(zhí)行MMU_Init
MMU_DisableMMU(); // 禁用MMU
MMU_InvalidateTLB(); // 使無效轉換表
//MMU_SetMTT(int vaddrStart,int vaddrEnd,intpaddrStart,int attr)
// 0處異常向量表映射到__CodeAddr__處,代碼搬移時己復制用戶向量表
// 0地址中斷向量表重新映射到代碼運行RAM基址,其余默認1:1映射
// 寄存器空間不能開啟cache,寫緩存,寄存器應為volatile變量
//steppingstone(Nand Boot)
MMU_SetMTT(0x00000000, 0x00000000,__CodeAddr__, RW_CB);
//SROM Bank0 Reserve
MMU_SetMTT(0x00100000, 0x07f00000,0x00100000, RW_NCNB);
//SROM Bank1 Reserve
MMU_SetMTT(0x08000000, 0x0ff00000,0x08000000, RW_NCNB);
//SROM Bank2 Reserve
MMU_SetMTT(0x10000000, 0x17f00000,0x10000000, RW_NCNB);
//SROM Bank3 Reserve
MMU_SetMTT(0x18