汽車信息娛樂系統(tǒng)中閃存設備的管理設計
汽車信息娛樂和遠程電子信息處理系統(tǒng)需要從閃存器件中讀寫海量數(shù)據(jù),因此這些器件必須能長期可靠、無錯地保存數(shù)據(jù)。例如,嵌入到汽車導航系統(tǒng)中的閃存芯片必須在若干年的頻繁使用條件下可靠工作。用戶不希望丟失數(shù)據(jù)以及很長的啟動時間,或者忍受很長的數(shù)據(jù)恢復時間。這些都對控制閃存芯片中數(shù)據(jù)的文件系統(tǒng)技術提出了非常嚴格的要求。
使問題更加復雜的是,汽車嵌入式設計必須使成本絕對最低。材料清單中通常不能增加管理電源波動或不受控關斷的硬件,而這兩種情況中的任何一種都會導致閃存損壞,并導致業(yè)務丟失。因此,閃存文件系統(tǒng)技術不能簡單地提供高吞吐量的讀/寫功能;它還必須具有自恢復功能,并且在啟動之后的若干毫秒之內(nèi)能被完全訪問。
基于事務的文件系統(tǒng)
解決這些需求的方法之一是采用基于純事務的模型。例如QNX嵌入式事務文件系統(tǒng)(ETFS)就遵循這種模型,完全是由事務組成。無論是文件系統(tǒng)的元數(shù)據(jù)還是用戶數(shù)據(jù)的每一次寫操作都是由一個“原子”事務組成。一個事務要么獲得成功,要么就當成什么事也沒有發(fā)生。
這種方法可以確保文件系統(tǒng)在電源故障的條件下也能完好無損,即使電源故障發(fā)生在閃存寫入或塊刪除期間。為避免文件破壞,事務從來不會覆蓋現(xiàn)有的“有效”數(shù)據(jù)。在文件升級中間的寫入操作總是會寫入到一個新的未用區(qū)域。因此如果這次操作因為突發(fā)事故或電源故障不能完成,現(xiàn)有的數(shù)據(jù)將保持不變。重新啟動后,文件系統(tǒng)可以重新執(zhí)行和正確完成寫操作,這樣就可以從可能損壞傳統(tǒng)文件系統(tǒng)的狀態(tài)中恢復過來。
事務文件系統(tǒng)可以通過處理設備中的事務日志來動態(tài)建立文件系統(tǒng)的層次結構。這種操作發(fā)生在系統(tǒng)啟動之時,應設計成只有很少部分的數(shù)據(jù)需要讀取和CRC校驗。這樣一來,文件系統(tǒng)可以獲得高的數(shù)據(jù)完整性和快速的重啟時間。例如QNX ETFS可以在數(shù)十毫秒內(nèi)恢復,而傳統(tǒng)的文件系統(tǒng)需要數(shù)百毫秒。
圖1:這種車載導航系統(tǒng)是要求大容量可靠閃存文件系統(tǒng)(用于三維映射、動態(tài)路由等)的一個實例。
如圖2所示,在純粹基于事務的文件系統(tǒng)中,每個事務由頭和用戶數(shù)據(jù)組成。事務頭被放在閃存陣列的空閑字節(jié)中。例如,一個具有2112字節(jié)頁的NAND器件可以由64字節(jié)的頭和2048字節(jié)的用戶數(shù)據(jù)組成。事務頭標識數(shù)據(jù)所屬的文件以及其邏輯偏移,并包含一個序列號來確定事務的順序。頭部還包括CRC和 ECC字段,用于誤碼檢測和糾正。
圖2:這張器件圖表明了它相對于純事務文件系統(tǒng)中物理媒介的獨立性。
在系統(tǒng)啟動時,文件系統(tǒng)掃描這些事務頭來快速重構存儲器中的文件系統(tǒng)結構。除了確保高的數(shù)據(jù)完整性和快速的重新啟動時間,一個閃存文件系統(tǒng)還必須具有可以延長閃存壽命的特性,進而增加整個嵌入式系統(tǒng)的長期可靠性。這些特性包括讀取性能劣化監(jiān)測、動態(tài)和靜態(tài)損耗平衡以及避免文件碎片的技術。
恢復丟失的比特
在NAND閃存塊內(nèi)的每一次讀操作都會使保持數(shù)據(jù)位的電荷減弱。因而,在大約10萬次讀操作后閃存塊就會丟失數(shù)據(jù)。為了解決這個問題,一個設計完善的文件系統(tǒng)會跟蹤讀操作,并在塊的讀次數(shù)達到極限之前標記出弱電荷塊以便進行刷新。文件系統(tǒng)隨后執(zhí)行一次刷新操作,該操作將數(shù)據(jù)拷貝到一個新的閃存塊,并擦除該弱塊。這種擦除實現(xiàn)了對閃存塊的再充電。
文件系統(tǒng)還應該對所有的讀寫操作執(zhí)行ECC運算,以便從可能發(fā)生的任何單比特差錯中恢復。然而,盡管ECC對于那些本身丟失了單個比特的閃存效果很好,但是對于在寫操作期間因為電源故障而導致的很多比特損壞則無能為力。因此,文件系統(tǒng)應該對每個事務執(zhí)行一次CRC檢驗,以快速檢測出損壞的數(shù)據(jù)。如果CRC 檢測到一個錯誤,文件 系統(tǒng)就可以使用ECC糾錯功能將數(shù)據(jù)恢復到一個新塊上,然后標記出弱電荷塊以便擦除。
動態(tài)和靜態(tài)損耗平衡
每個閃存塊在其失效之前的擦除次數(shù)是有限的。在某些器件中,這個數(shù)字可以低到10萬次擦除。為了解決這個問題,文件系統(tǒng)必須實現(xiàn)動態(tài)損耗平衡,它通過將擦除次數(shù)均勻地分散到設備中來延長閃存壽命。
差異可能很大:從沒有損耗平衡幾天就產(chǎn)生故障的使用情形到利用損耗平衡超過40年的情形。為實現(xiàn)動態(tài)損耗平衡,文件系統(tǒng)會跟蹤每個塊的擦除次數(shù),然后優(yōu)先使用那些較少使用的塊。
通常,閃速存儲器包含大量的靜態(tài)文件,這些文件經(jīng)常被讀取,但不會再寫入。這些文件占用的閃存塊沒有理由被擦除。如果閃存中大部分文件是靜態(tài)的,剩余部分包含動態(tài)數(shù)據(jù)的塊的損耗將戲劇性地加快。對于NAND存儲器來說這方面的問題更大,因為NAND每個塊的讀次數(shù)相當有限。
因此,一個設計優(yōu)秀的文件系統(tǒng)應提供靜態(tài)損耗平衡功能,它將較少使用的靜態(tài)塊中的數(shù)據(jù)拷貝到過量使用的塊中,從而實現(xiàn)塊的平衡使用。這種方法可以讓過量使用的塊休息,因為它們現(xiàn)在存儲的是靜態(tài)數(shù)據(jù),并將使用較少的靜態(tài)塊移動到動態(tài)塊組中。
盡量減少文件碎片
文件碎片也是閃存器件的一個問題。然而,支持去碎片技術只是解決方案的一部分。因為NAND閃存具有有限的寫次數(shù),文件系統(tǒng)必須盡可能避免碎片產(chǎn)生,以延長閃存的壽命。
基于日志的文件系統(tǒng)經(jīng)常受碎片的影響,因為對已有的文件進行刷新或?qū)懭霑a(chǎn)生一個新的事務。為減少很多小事務產(chǎn)生的碎片,QNX ETFS使用寫緩沖來將小的寫入合并成大的寫入事務。文件系統(tǒng)還能監(jiān)視每個文件的碎片水平,并對那些已經(jīng)嚴重碎片化的文件進行后臺去碎片處理。這種后臺活動應該總是能被用戶活動占先,以便確保對正在進行去碎片處理的文件進行立刻訪問。
正確的組合
完全可能構建一個能提供高吞吐量、高可靠性和快速啟動時間的閃存文件系統(tǒng)。通過整合事務級的設計、成熟的糾錯以及損耗平衡方法,閃存文件系統(tǒng)完全可以解決當前嵌入式汽車信息娛樂設備提出的復雜要求。