當(dāng)前位置:首頁(yè) > 嵌入式 > 嵌入式軟件
[導(dǎo)讀]介紹 Linux® 的 flash 文件系統(tǒng),并探索它們?nèi)绾瓮ㄟ^(guò)平均讀寫(xiě)(wear leveling)處理底層的可消耗設(shè)備(flash 部件),并鑒別各種不同的 flash 文件系統(tǒng)以及它們的基本設(shè)計(jì)。

您之前可能聽(tīng)說(shuō)過(guò) Journaling Flash File System(JFFS)和 Yet Another Flash File System(YAFFS),但是您知道使用底層 flash 設(shè)備的文件系統(tǒng)意味著什么嗎?本文將向您介紹 Linux® 的 flash 文件系統(tǒng),并探索它們?nèi)绾瓮ㄟ^(guò)平均讀寫(xiě)(wear leveling)處理底層的可消耗設(shè)備(flash 部件),并鑒別各種不同的 flash 文件系統(tǒng)以及它們的基本設(shè)計(jì)。

固態(tài)驅(qū)動(dòng)器當(dāng)前非常流行,但是嵌入式系統(tǒng)很久以前就開(kāi)始使用固態(tài)驅(qū)動(dòng)器進(jìn)行存儲(chǔ)。您可以看到 flash 系統(tǒng)被用于個(gè)人數(shù)字助理(PDA)、手機(jī)、MP3 播放器、數(shù)碼相機(jī)、USB flash 驅(qū)動(dòng)(UFD),甚至筆記本電腦。很多情況下,商業(yè)設(shè)備的文件系統(tǒng)可以進(jìn)行定制并且是專(zhuān)有的,但是它們會(huì)遇到以下挑戰(zhàn)。

基于 Flash 的文件系統(tǒng)形式多種多樣。本文將探討幾種只讀文件系統(tǒng),并回顧目前可用的各種讀/寫(xiě)文件系統(tǒng)及其工作原理。但是,讓我們先看看 flash 設(shè)備及其所面對(duì)的挑戰(zhàn)。


Flash 內(nèi)存技術(shù)

Flash 內(nèi)存(可以通過(guò)幾種不同的技術(shù)實(shí)現(xiàn))是一種非揮發(fā)性?xún)?nèi)存,這意味著斷開(kāi)電源之后其內(nèi)容仍然保持下來(lái)。

兩種最常見(jiàn)的 flash 設(shè)備類(lèi)型為:NOR 和 NAND?;?NOR 的 flash 技術(shù)比較早,它支持較高的讀性能,但以降低容量為代價(jià)。NAND flash 提供更大容量的同時(shí)實(shí)現(xiàn)快速的寫(xiě)擦性能。NAND 還需要更復(fù)雜的輸入/輸出(I/O)接口。

Flash 部件通常分為多個(gè)分區(qū),允許同時(shí)進(jìn)行多個(gè)操作(擦除某個(gè)分區(qū)的同時(shí)讀取另一個(gè)分區(qū))。分區(qū)再劃分為塊(通常大小為 64KB 或 128KB)。使用分區(qū)的固件可以進(jìn)一步對(duì)塊進(jìn)行獨(dú)特的分段 — 例如,一個(gè)塊中有 512 字節(jié)的分段,但不包括元數(shù)據(jù)。

Flash 設(shè)備有一個(gè)常見(jiàn)的限制,即與其他存儲(chǔ)設(shè)備(如 RAM 磁盤(pán))相比,它需要進(jìn)行設(shè)備管理。flash 內(nèi)存設(shè)備中惟一允許的 Write 操作是將 1 修改為 0。如果需要撤銷(xiāo)操作,那么必須擦除整個(gè)塊(將所有數(shù)據(jù)重置回狀態(tài) 1)。這意味著必須刪除該塊中的其他有效數(shù)據(jù)來(lái)實(shí)現(xiàn)持久化。NOR flash 內(nèi)存通常一次可以編寫(xiě)一個(gè)字節(jié),而 NAND flash 內(nèi)存必須編寫(xiě)多個(gè)字節(jié)(通常為 512 字節(jié))。

這兩種內(nèi)存類(lèi)型在擦除塊方面有所不同。每種類(lèi)型都需要一個(gè)特殊的 Erase 操作,該操作可以涵蓋 flash 內(nèi)存中的一個(gè)整塊。NOR 技術(shù)需要通過(guò)一個(gè)準(zhǔn)備步驟將所有值清零,然后再開(kāi)始 Erase 操作。Erase 是針對(duì) flash 設(shè)備的特殊操作,非常耗費(fèi)時(shí)間。擦除操作與電有關(guān),它將整個(gè)塊的所有單元中的電子放掉。

NOR flash 設(shè)備通常需要花費(fèi)幾秒時(shí)間來(lái)執(zhí)行 Erase 操作,而 NAND 設(shè)備只需要幾毫秒。flash 設(shè)備的一個(gè)關(guān)鍵特性是可執(zhí)行的 Erase 操作的數(shù)量。在 NOR 設(shè)備中,flash 內(nèi)存中的每個(gè)塊可被擦除 100,000 次,而在 NAND flash 內(nèi)存中可達(dá)到一百萬(wàn)次。


Flash 內(nèi)存面臨的挑戰(zhàn)

除了前面提到的一些限制以外,管理 flash 設(shè)備還面臨很多挑戰(zhàn)。三個(gè)最重大的挑戰(zhàn)分別是垃圾收集、管理壞塊和平均讀寫(xiě)。

垃圾收集

垃圾收集 是一個(gè)回收無(wú)效塊的過(guò)程(無(wú)效塊中包含了一些無(wú)效數(shù)據(jù))。回收過(guò)程包括將有效數(shù)據(jù)移動(dòng)到新塊,然后擦除無(wú)效塊從而使它變?yōu)榭捎?。如果文件系統(tǒng)的可用空間較少,那么通常將在后臺(tái)執(zhí)行這一過(guò)程(或者根據(jù)需要執(zhí)行)。

管理壞塊

用的時(shí)間長(zhǎng)了,flash 設(shè)備就會(huì)出現(xiàn)壞塊,甚至在出廠時(shí)就會(huì)因出現(xiàn)壞塊而不能使用。如果 flash 操作(例如 Erase)失敗,或者 Write 操作無(wú)效(通過(guò)無(wú)效的錯(cuò)誤校正代碼發(fā)現(xiàn),Error Correction Code,ECC),那么說(shuō)明出現(xiàn)了壞塊。

識(shí)別出壞塊后,將在 flash 內(nèi)部將這些壞塊標(biāo)記到一個(gè)壞塊表中。具體操作取決于設(shè)備,但是可以通過(guò)一組獨(dú)立的預(yù)留塊來(lái)(不同于普通數(shù)據(jù)塊管理)實(shí)現(xiàn)。對(duì)壞塊進(jìn)行處理的過(guò)程 — 不管是出廠時(shí)就有還是在使用過(guò)程中出現(xiàn) — 稱(chēng)為壞塊管理。在某些情況下,可以通過(guò)一個(gè)內(nèi)部微控制器在硬件中實(shí)現(xiàn),因此對(duì)于上層文件系統(tǒng)是透明的。

平均讀寫(xiě)

前面提到 flash 設(shè)備屬于耗損品:在變成壞塊以前,可以執(zhí)行有限次數(shù)的反復(fù)的 Erase 操作(因此必須由壞塊管理進(jìn)行標(biāo)記)。平均讀寫(xiě)算法能夠最大化 flash 的壽命。平均讀寫(xiě)有兩種形式:動(dòng)態(tài)平均讀寫(xiě) 和靜態(tài)平均讀寫(xiě) 。

動(dòng)態(tài)平均讀寫(xiě)解決了塊的 Erase 周期的次數(shù)限制。動(dòng)態(tài)平均讀寫(xiě)算法并不是隨機(jī)使用可用的塊,而是平均使用塊,因此,每個(gè)塊都獲得了相同的使用機(jī)會(huì)。靜態(tài)平均讀寫(xiě)算法解決了一個(gè)更有趣的問(wèn)題。除了最大化 Erase 周期的次數(shù)外,某些 flash 設(shè)備在兩個(gè) Erase 周期之間還受到最大化 Read 周期的影響。這意味著如果數(shù)據(jù)在塊中存儲(chǔ)的時(shí)間太長(zhǎng)并且被讀了很多次,數(shù)據(jù)會(huì)逐漸消耗直至丟失。靜態(tài)平均讀寫(xiě)算法解決了這一問(wèn)題,因?yàn)樗梢远ㄆ趯?shù)據(jù)移動(dòng)到新塊。


系統(tǒng)架構(gòu)

到目前為止,我已經(jīng)討論了 flash 設(shè)備及其面臨的基本挑戰(zhàn)。現(xiàn)在,讓我們看看這些設(shè)備如何組合成為一個(gè)分層架構(gòu)的一部分(參加圖 1)。架構(gòu)的頂層是虛擬文件系統(tǒng)(VFS),它為高級(jí)應(yīng)用程序提供通用接口。VFS 下面是 flash 文件系統(tǒng)(將在下節(jié)介紹)。接下來(lái)是 Flash 轉(zhuǎn)換層(Flash Translation Layer,F(xiàn)TL),它整體管理 flash 設(shè)備,包括從底層 flash 設(shè)備分配塊、地址轉(zhuǎn)換、動(dòng)態(tài)平均讀寫(xiě)和垃圾收集。在某些 flash 設(shè)備中,可以在硬件中實(shí)現(xiàn)一部分 FTL 。


圖 1. flash 系統(tǒng)的基本架構(gòu)

Linux 內(nèi)核使用內(nèi)存技術(shù)設(shè)備(Memory Technology Device,MTD)接口,這是針對(duì) flash 系統(tǒng)的通用接口。MTD 可以自動(dòng)檢測(cè) flash 設(shè)備總線(xiàn)的寬度以及實(shí)現(xiàn)總線(xiàn)寬度所需設(shè)備的數(shù)量。


Flash 文件系統(tǒng)

Linux 可以使用多種 flash 文件系統(tǒng)。下一小節(jié)將解釋每種文件系統(tǒng)的設(shè)計(jì)和優(yōu)點(diǎn)。

Journaling Flash File System

Journaling Flash File System 是針對(duì) Linux 的最早 flash 文件系統(tǒng)之一。 JFFS 是一種專(zhuān)門(mén)為 NOR flash 設(shè)備設(shè)計(jì)的日志結(jié)構(gòu)文件系統(tǒng)。它非常獨(dú)特,能夠解決許多 flash 設(shè)備問(wèn)題,但同時(shí)也導(dǎo)致一些新問(wèn)題。

JFFS 將 flash 設(shè)備視為一種循環(huán)的塊日志。寫(xiě)入 flash 的數(shù)據(jù)被寫(xiě)到了空間的末尾,開(kāi)始部分的塊則被收回,而兩者之間的空間是空閑的;當(dāng)空間變少時(shí),將執(zhí)行垃圾收集。垃圾收集器將有效塊移動(dòng)到日志的尾部,跳過(guò)無(wú)效或廢棄塊,并擦除它們(參見(jiàn)圖 2)。因此這種文件系統(tǒng)可以自動(dòng)實(shí)現(xiàn)靜態(tài)和動(dòng)態(tài)平均讀寫(xiě)。這種架構(gòu)的主要缺點(diǎn)是過(guò)于頻繁地執(zhí)行擦除操作(而沒(méi)有使用最佳擦除策略),從而使設(shè)備迅速磨損。

圖 2. 在垃圾收集之前和之后循環(huán)日志

掛載 JFFS 時(shí)結(jié)構(gòu)細(xì)節(jié)將讀取到內(nèi)存中,這將延緩掛載時(shí)間并消耗更多的內(nèi)存。

Journaling Flash File System 2

盡管 JFFS 在早期非常有用,但是它的平均讀寫(xiě)算法容易縮短 NOR flash 設(shè)備的壽命。因此重新設(shè)計(jì)了底層算法,去掉了循環(huán)日志。JFFS2 算法專(zhuān)門(mén)為 NAND flash 設(shè)備設(shè)計(jì),并且改善壓縮性能。

在 JFFS2 中,flash 中的每個(gè)塊都是單獨(dú)處理的。JFFS2 通過(guò)維護(hù)塊列表來(lái)充分地對(duì)設(shè)備執(zhí)行平均讀寫(xiě)。clean 列表表示設(shè)備中的塊全部為有效節(jié)點(diǎn)。dirty 列表中的塊至少包含有一個(gè)廢棄節(jié)點(diǎn)。最后,free 列表包含曾經(jīng)執(zhí)行過(guò)擦除操作并且可以使用的塊。

垃圾收集算法通過(guò)合理的方法智能地判斷應(yīng)該回收的塊。目前,這個(gè)算法根據(jù)概率從 clean 或 dirty 列表中選擇。dirty 列表的選擇概率為 99%(將有效內(nèi)容移到另一個(gè)塊),而 clean 列表的選擇概率為 1%(將內(nèi)容移到新的塊)。在這兩種情況中,對(duì)選擇的塊執(zhí)行擦除操作,然后將其置于 free 列表(參見(jiàn)圖 3)。這允許垃圾收集器重用廢棄的塊,但是仍然圍繞 flash 移動(dòng)數(shù)據(jù),以支持靜態(tài)平均讀寫(xiě)。


圖 3. JFFS2 中的塊管理和垃圾收集

Yet Another Flash File System

YAFFS 是針對(duì) NAND flash 開(kāi)發(fā)的另一種 flash 文件系統(tǒng)。最早的版本(YAFFS)支持 512 字節(jié)頁(yè)面的 flash 設(shè)備,但是較新的版本(YAFFS2)支持頁(yè)面更大的新設(shè)備以及更大的 Write 限制。

大多數(shù) flash 文件系統(tǒng)會(huì)對(duì)廢棄塊進(jìn)行標(biāo)記,但是 YAFFS2 使用單調(diào)遞增數(shù)字序列號(hào)額外地標(biāo)記塊。在掛載期間掃描文件系統(tǒng)時(shí),可以快速標(biāo)識(shí)有效的 inode。YAFFS 保留在 RAM 中的樹(shù)以表示 flash 設(shè)備的塊結(jié)構(gòu),包括通過(guò)檢查點(diǎn)(checkpointing)實(shí)現(xiàn)快速掛載 — 這個(gè)過(guò)程將在正常卸載時(shí)將 RAM 樹(shù)結(jié)構(gòu)保存到 flash 設(shè)備,以在掛載時(shí)快速讀取和恢復(fù)到 RAM(參見(jiàn)圖 4)。與其他 flash 文件系統(tǒng)相比,YAFFS2 的掛載時(shí)性能是它的最大優(yōu)勢(shì)。

圖 4. YAFFS2 中的塊管理和垃圾收集

只讀式壓縮文件系統(tǒng)

在某些嵌入式系統(tǒng)中,沒(méi)有必要提供可更改的文件系統(tǒng):一個(gè)不可更改(immutable)的文件系統(tǒng)已經(jīng)足夠。Linux 支持多種只讀文件系統(tǒng),最有用的兩種是 cramfs 和 SquashFS。


Cramfs

cramfs 文件系統(tǒng)是一種可用于 flash 設(shè)備的壓縮式 Linux 只讀文件系統(tǒng)。cramfs 的主要特點(diǎn)是簡(jiǎn)單和較高的空間利用率。這種文件系統(tǒng)用于內(nèi)存占用較小的嵌入式設(shè)計(jì)。

雖然 cramfs 元數(shù)據(jù)沒(méi)有經(jīng)過(guò)壓縮,但是 cramfs 針對(duì)每個(gè)頁(yè)面使用 zlib 壓縮,從而允許隨機(jī)的頁(yè)面訪問(wèn)(訪問(wèn)時(shí)對(duì)頁(yè)面進(jìn)行解壓縮)。

您可以通過(guò) mkcramfs 實(shí)用工具和 loopback 設(shè)備嘗試使用 cramfs。

SquashFS

SquashFS 是另一種可用于 flash 設(shè)備的壓縮式 Linux 只讀文件系統(tǒng)。您可以在很多 Live CD Linux 發(fā)行版中找到 SquashFS。除了支持 zlib 壓縮外,SquashFS 還使用 Lembel-Ziv-Markov chain Algorithm (LZMA) 改善壓縮并提高速度。

和 cramfs 一樣,您可以通過(guò) mksquashfs 和 loopback 設(shè)備在標(biāo)準(zhǔn) Linux 系統(tǒng)上使用 SquashFS。


結(jié)束語(yǔ)

和大多數(shù)開(kāi)放源碼一樣,軟件在不斷演變,并且新的 flash 文件系統(tǒng)正在開(kāi)發(fā)之中。一種還處于開(kāi)發(fā)階段的有趣的備選文件系統(tǒng)是 LogFS,它包含了一些非常新穎的想法。例如,LogFS 在 flash 設(shè)備中保持了一個(gè)樹(shù)結(jié)構(gòu),因此掛載時(shí)間和傳統(tǒng)的文件系統(tǒng)差不多(比如 ext2)。它還使用一種復(fù)雜的樹(shù)實(shí)現(xiàn)垃圾收集(一種 B+樹(shù)形式)。然而,LogFS 最有趣的地方是它具有出色的可伸縮性并且支持大型 flash 部件。

隨著 flash 文件系統(tǒng)的日益流行,您將看到針對(duì)它們的大量研究。LogFS 就是一個(gè)例子,但是其他類(lèi)似于 UbiFS 的文件系統(tǒng)也在不斷發(fā)展。Flash 文件系統(tǒng)的架構(gòu)非常有趣,并在還將是未來(lái)技術(shù)創(chuàng)新的源泉。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專(zhuān)欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車(chē)的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車(chē)技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車(chē)工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車(chē)。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車(chē) 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶(hù)希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱(chēng),數(shù)字世界的話(huà)語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱(chēng)"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉