汽車信息娛樂系統(tǒng)中閃存設(shè)備的管理設(shè)計
汽車信息娛樂和遠程電子信息處理系統(tǒng)需要從閃存器件中讀寫海量數(shù)據(jù),因此這些器件必須能長期可靠、無錯地保存數(shù)據(jù)。例如,嵌入到汽車導(dǎo)航系統(tǒng)中的閃存芯片必須在若干年的頻繁使用條件下可靠工作。用戶不希望丟失數(shù)據(jù)以及很長的啟動時間,或者忍受很長的數(shù)據(jù)恢復(fù)時間。這些都對控制閃存芯片中數(shù)據(jù)的文件系統(tǒng)技術(shù)提出了非常嚴格的要求。
使問題更加復(fù)雜的是,汽車嵌入式設(shè)計必須使成本絕對最低。材料清單中通常不能增加管理電源波動或不受控關(guān)斷的硬件,而這兩種情況中的任何一種都會導(dǎo)致閃存損壞,并導(dǎo)致業(yè)務(wù)丟失。因此,閃存文件系統(tǒng)技術(shù)不能簡單地提供高吞吐量的讀/寫功能;它還必須具有自恢復(fù)功能,并且在啟動之后的若干毫秒之內(nèi)能被完全訪問。
基于事務(wù)的文件系統(tǒng)
解決這些需求的方法之一是采用基于純事務(wù)的模型。例如QNX嵌入式事務(wù)文件系統(tǒng)(ETFS)就遵循這種模型,完全是由事務(wù)組成。無論是文件系統(tǒng)的元數(shù)據(jù)還是用戶數(shù)據(jù)的每一次寫操作都是由一個“原子”事務(wù)組成。一個事務(wù)要么獲得成功,要么就當成什么事也沒有發(fā)生。
這種方法可以確保文件系統(tǒng)在電源故障的條件下也能完好無損,即使電源故障發(fā)生在閃存寫入或塊刪除期間。為避免文件破壞,事務(wù)從來不會覆蓋現(xiàn)有的“有效”數(shù)據(jù)。在文件升級中間的寫入操作總是會寫入到一個新的未用區(qū)域。因此如果這次操作因為突發(fā)事故或電源故障不能完成,現(xiàn)有的數(shù)據(jù)將保持不變。重新啟動后,文件系統(tǒng)可以重新執(zhí)行和正確完成寫操作,這樣就可以從可能損壞傳統(tǒng)文件系統(tǒng)的狀態(tài)中恢復(fù)過來。
事務(wù)文件系統(tǒng)可以通過處理設(shè)備中的事務(wù)日志來動態(tài)建立文件系統(tǒng)的層次結(jié)構(gòu)。這種操作發(fā)生在系統(tǒng)啟動之時,應(yīng)設(shè)計成只有很少部分的數(shù)據(jù)需要讀取和CRC校驗。這樣一來,文件系統(tǒng)可以獲得高的數(shù)據(jù)完整性和快速的重啟時間。例如QNX ETFS可以在數(shù)十毫秒內(nèi)恢復(fù),而傳統(tǒng)的文件系統(tǒng)需要數(shù)百毫秒。
圖1:這種車載導(dǎo)航系統(tǒng)是要求大容量可靠閃存文件系統(tǒng)(用于三維映射、動態(tài)路由等)的一個實例。
如圖2所示,在純粹基于事務(wù)的文件系統(tǒng)中,每個事務(wù)由頭和用戶數(shù)據(jù)組成。事務(wù)頭被放在閃存陣列的空閑字節(jié)中。例如,一個具有2112字節(jié)頁的NAND器件可以由64字節(jié)的頭和2048字節(jié)的用戶數(shù)據(jù)組成。事務(wù)頭標識數(shù)據(jù)所屬的文件以及其邏輯偏移,并包含一個序列號來確定事務(wù)的順序。頭部還包括CRC和 ECC字段,用于誤碼檢測和糾正。
圖2:這張器件圖表明了它相對于純事務(wù)文件系統(tǒng)中物理媒介的獨立性。
在系統(tǒng)啟動時,文件系統(tǒng)掃描這些事務(wù)頭來快速重構(gòu)存儲器中的文件系統(tǒng)結(jié)構(gòu)。除了確保高的數(shù)據(jù)完整性和快速的重新啟動時間,一個閃存文件系統(tǒng)還必須具有可以延長閃存壽命的特性,進而增加整個嵌入式系統(tǒng)的長期可靠性。這些特性包括讀取性能劣化監(jiān)測、動態(tài)和靜態(tài)損耗平衡以及避免文件碎片的技術(shù)。
恢復(fù)丟失的比特
在NAND閃存塊內(nèi)的每一次讀操作都會使保持數(shù)據(jù)位的電荷減弱。因而,在大約10萬次讀操作后閃存塊就會丟失數(shù)據(jù)。為了解決這個問題,一個設(shè)計完善的文件系統(tǒng)會跟蹤讀操作,并在塊的讀次數(shù)達到極限之前標記出弱電荷塊以便進行刷新。文件系統(tǒng)隨后執(zhí)行一次刷新操作,該操作將數(shù)據(jù)拷貝到一個新的閃存塊,并擦除該弱塊。這種擦除實現(xiàn)了對閃存塊的再充電。
文件系統(tǒng)還應(yīng)該對所有的讀寫操作執(zhí)行ECC運算,以便從可能發(fā)生的任何單比特差錯中恢復(fù)。然而,盡管ECC對于那些本身丟失了單個比特的閃存效果很好,但是對于在寫操作期間因為電源故障而導(dǎo)致的很多比特損壞則無能為力。因此,文件系統(tǒng)應(yīng)該對每個事務(wù)執(zhí)行一次CRC檢驗,以快速檢測出損壞的數(shù)據(jù)。如果CRC 檢測到一個錯誤,文件 系統(tǒng)就可以使用ECC糾錯功能將數(shù)據(jù)恢復(fù)到一個新塊上,然后標記出弱電荷塊以便擦除。
動態(tài)和靜態(tài)損耗平衡
每個閃存塊在其失效之前的擦除次數(shù)是有限的。在某些器件中,這個數(shù)字可以低到10萬次擦除。為了解決這個問題,文件系統(tǒng)必須實現(xiàn)動態(tài)損耗平衡,它通過將擦除次數(shù)均勻地分散到設(shè)備中來延長閃存壽命。
差異可能很大:從沒有損耗平衡幾天就產(chǎn)生故障的使用情形到利用損耗平衡超過40年的情形。為實現(xiàn)動態(tài)損耗平衡,文件系統(tǒng)會跟蹤每個塊的擦除次數(shù),然后優(yōu)先使用那些較少使用的塊。
通常,閃速存儲器包含大量的靜態(tài)文件,這些文件經(jīng)常被讀取,但不會再寫入。這些文件占用的閃存塊沒有理由被擦除。如果閃存中大部分文件是靜態(tài)的,剩余部分包含動態(tài)數(shù)據(jù)的塊的損耗將戲劇性地加快。對于NAND存儲器來說這方面的問題更大,因為NAND每個塊的讀次數(shù)相當有限。
因此,一個設(shè)計優(yōu)秀的文件系統(tǒng)應(yīng)提供靜態(tài)損耗平衡功能,它將較少使用的靜態(tài)塊中的數(shù)據(jù)拷貝到過量使用的塊中,從而實現(xiàn)塊的平衡使用。這種方法可以讓過量使用的塊休息,因為它們現(xiàn)在存儲的是靜態(tài)數(shù)據(jù),并將使用較少的靜態(tài)塊移動到動態(tài)塊組中。
盡量減少文件碎片
文件碎片也是閃存器件的一個問題。然而,支持去碎片技術(shù)只是解決方案的一部分。因為NAND閃存具有有限的寫次數(shù),文件系統(tǒng)必須盡可能避免碎片產(chǎn)生,以延長閃存的壽命。
基于日志的文件系統(tǒng)經(jīng)常受碎片的影響,因為對已有的文件進行刷新或?qū)懭霑a(chǎn)生一個新的事務(wù)。為減少很多小事務(wù)產(chǎn)生的碎片,QNX ETFS使用寫緩沖來將小的寫入合并成大的寫入事務(wù)。文件系統(tǒng)還能監(jiān)視每個文件的碎片水平,并對那些已經(jīng)嚴重碎片化的文件進行后臺去碎片處理。這種后臺活動應(yīng)該總是能被用戶活動占先,以便確保對正在進行去碎片處理的文件進行立刻訪問。
正確的組合
完全可能構(gòu)建一個能提供高吞吐量、高可靠性和快速啟動時間的閃存文件系統(tǒng)。通過整合事務(wù)級的設(shè)計、成熟的糾錯以及損耗平衡方法,閃存文件系統(tǒng)完全可以解決當前嵌入式汽車信息娛樂設(shè)備提出的復(fù)雜要求。