當前位置:首頁 > 嵌入式 > 嵌入式軟件
[導讀] 日志文件系統(tǒng)可以在系統(tǒng)發(fā)生斷電或者其它系統(tǒng)故障時保證整體數(shù)據(jù)的完整性,Linux是目前支持日志文件系統(tǒng)最多的操作系統(tǒng)之一,本文重點研究了Linux常用的日志文件系統(tǒng):EXT

 日志文件系統(tǒng)可以在系統(tǒng)發(fā)生斷電或者其它系統(tǒng)故障時保證整體數(shù)據(jù)的完整性,Linux是目前支持日志文件系統(tǒng)最多的操作系統(tǒng)之一,本文重點研究了Linux常用的日志文件系統(tǒng):EXT3、ReiserFS、XFS和JFS日志技術,并采用標準的測試工具PostMark和 Bonnie++對它們進行了測試,給出了詳細的性能分析,對Linux服務器應用具有重要的參考價值。

一、概述

所謂日志文件系統(tǒng)是在傳統(tǒng)文件系統(tǒng)的基礎上,加入文件系統(tǒng)更改的日志記錄,它的設計思想是:跟蹤記錄文件系統(tǒng)的變化,并將變化內容記錄入日志。日志文件系統(tǒng)在磁盤分區(qū)中保存有日志記錄,寫操作首先是對記錄文件進行操作,若整個寫操作由于某種原因(如系統(tǒng)掉電)而中斷,系統(tǒng)重啟時,會根據(jù)日志記錄來恢復中斷前的寫操作。在日志文件系統(tǒng)中,所有的文件系統(tǒng)的變化都被記錄到日志,每隔一定時間,文件系統(tǒng)會將更新后的元數(shù)據(jù)及文件內容寫入磁盤。在對元數(shù)據(jù)做任何改變以前,文件系統(tǒng)驅動程序會向日志中寫入一個條目,這個條目描述了它將要做些什么,然后它修改元數(shù)據(jù)。目前Linux的日志文件系統(tǒng)主要有:在Ext2基礎上開發(fā)的Ext3,根據(jù)面向對象思想設計的ReiserFS,由SGI IRIX系統(tǒng)移植過來的XFS,由IBM AIX系統(tǒng)移植過來的JFS,其中EXT3完全兼容EXT2,其磁盤結構和EXT2完全一樣,只是加入日志技術;而后三種文件系統(tǒng)廣泛使用了B樹以提高文件系統(tǒng)的效率。

二、Ext3

Ext3 文件系統(tǒng)是直接從Ext2文件系統(tǒng)發(fā)展而來,目前Ext3文件系統(tǒng)已經(jīng)非常穩(wěn)定可靠,它完全兼容Ext2文件系統(tǒng),用戶可以平滑地過渡到一個日志功能健全的文件系統(tǒng)。Ext3日志文件系統(tǒng)的思想就是對文件系統(tǒng)進行的任何高級修改都分兩步進行。首先,把待寫塊的一個副本存放在日志中;其次,當發(fā)往日志的 I/O 數(shù)據(jù)傳送完成時(即數(shù)據(jù)提交到日志),塊就寫入文件系統(tǒng)。當發(fā)往文件系統(tǒng)的I/O 數(shù)據(jù)傳送終止時(即數(shù)據(jù)提交給文件系統(tǒng)),日志中的塊副本就被丟棄。

2.1 Ext3日志模式

Ext3既可以只對元數(shù)據(jù)做日志,也可以同時對文件數(shù)據(jù)塊做日志。具體來說,Ext3提供以下三種日志模式:

日志(Journal )

文件系統(tǒng)所有數(shù)據(jù)和元數(shù)據(jù)的改變都記入日志。這種模式減少了丟失每個文件所作修改的機會,但是它需要很多額外的磁盤訪問。例如,當一個新文件被創(chuàng)建時,它的所有數(shù)據(jù)塊都必須復制一份作為日志記錄。這是最安全和最慢的Ext3日志模式。

預定(Ordered )

只有對文件系統(tǒng)元數(shù)據(jù)的改變才記入日志。然而,Ext3文件系統(tǒng)把元數(shù)據(jù)和相關的數(shù)據(jù)塊進行分組,以便把元數(shù)據(jù)寫入磁盤之前寫入數(shù)據(jù)塊。這樣,就可以減少文件內數(shù)據(jù)損壞的機會;例如,確保增大文件的任何寫訪問都完全受日志的保護。這是缺省的Ext3 日志模式。

寫回(Writeback )

只有對文件系統(tǒng)元數(shù)據(jù)的改變才記入日志;這是在其他日志文件系統(tǒng)發(fā)現(xiàn)的方法,也是最快的模式。

2.2 日志塊設備(JBD)

Ext3 文件系統(tǒng)本身不處理日志,而是利用日志塊設備(Journaling Block Device)或叫JBD 的通用內核層。Ext3文件系統(tǒng)調用JDB例程以確保在系統(tǒng)萬一出現(xiàn)故障時它的后續(xù)操作不會損壞磁盤數(shù)據(jù)結構。Ext3 與JDB 之間的交互本質上基于三個基本單元:日志記錄,原子操作和事務。

日志記錄本質上是文件系統(tǒng)將要發(fā)出的低級操作的描述。在某些日志文件系統(tǒng)中,日志記錄只包括操作所修改的字節(jié)范圍及字節(jié)在文件系統(tǒng)中的起始位置。然而,JDB 層使用的日志記錄由低級操作所修改的整個緩沖區(qū)組成。這種方式可能浪費很多日志空間(例如,當?shù)图壊僮鲀H僅改變位圖的一個位時),但是,它還是相當快的,因為JBD 層直接對緩沖區(qū)和緩沖區(qū)首部進行操作。

修改文件系統(tǒng)的任一系統(tǒng)調用都通常劃分為操縱磁盤數(shù)據(jù)結構的一系列低級操作。如果這些低級操作還沒有全部完成系統(tǒng)就意外宕機,就會損壞磁盤數(shù)據(jù)。為了防止數(shù)據(jù)損壞,Ext3文件系統(tǒng)必須確保每個系統(tǒng)調用以原子的方式進行處理。原子操作是對磁盤數(shù)據(jù)結構的一組低級操作,這組低級操作對應一個單獨的高級操作。

出于效率的原因,JBD 層對日志的處理采用分組的方法,即把屬于幾個原子操作處理的日志記錄分組放在一個單獨的事務中。此外,與一個處理相關的所有日志記錄都必須包含在同一個事務中。一個事務的所有日志記錄都存放在日志的連續(xù)塊中。JBD層把每個事務作為整體來處理。例如,只有當包含在一個事務的日志記錄中的所有數(shù)據(jù)提交給文件系統(tǒng)時才回收該事務所使用的塊。

三、ReiserFS

ReiserFS 是一個非常優(yōu)秀的文件系統(tǒng),其開發(fā)者非常有魄力,整個文件系統(tǒng)完全是從頭設計的。目前,ReiserFS可輕松管理上百G的文件系統(tǒng),這在企業(yè)級應用中非常重要。ReiserFS 是根據(jù)面向對象的思想設計的,由語義層(semantic layer)和存儲層(storage layer)組成。語義層主要是對對象命名空間的管理及對象接口的定義,以確定對象的功能。存儲層主要是對磁盤空間的管理。語義層與存儲層是通過鍵(key)聯(lián)系的。語義層通過對對象名進行解析生成鍵,存儲層通過鍵找到對象在磁盤上存儲空間,鍵值是全局唯一的。

3.1 語義層主要接口

1) 文件接口 每個文件擁有一個接口ID,此ID標識一個方法集,此方法集包含訪問ReiserFS 文件的所有接口。

2) 屬性接口 ReiserFS實現(xiàn)了一種新接口,把文件的每一種屬性當做一個文件,屬性的值就是此文件的內容,以實現(xiàn)對文件屬性的目錄式訪問。

3) hash接口 目錄是文件名到文件的映射表,ReiserFS是通過B+樹來實現(xiàn)這張映射表。由于文件名是變長的,而且有時文件名會很長,所以文件名不適合作為鍵值,故引入了Hash函數(shù)來產(chǎn)生鍵值。

4) 安全接口 安全接口處理所有的安全性檢查,通常是由文件接口觸發(fā)的。下面以讀文件為例:文件接口的read 方法在讀入文件數(shù)據(jù)之前會調用安全接口的read chech 方法來來進行安全性檢查,而后者又會調用屬性文件的read方法把文件屬性讀入以便檢查。

5) 項(Item)接口 項接口主要是一些對項進行平衡處理的方法,包括:項的拆分,項的評估,項的覆寫,項的追加,項的刪除,插入及查找。[!--empirenews.page--]

6) 鍵分配(key Assignment)接口 當把一個鍵分配給一個項時,鍵分配接口就會被觸發(fā)。每一種項都有一個與其對應的鍵分配方法。

3.2 存儲層

ReiserFS是以B+樹來存儲數(shù)據(jù)的,其結構如圖:

圖1:ReiserFS B+ 樹

[upload=1]

在B+樹中的各個結點中有一個稱為項(Item)的數(shù)據(jù)結構。項是一個數(shù)據(jù)容器,一個項只屬于一個結點,是結點管理空間的基本單位。如圖所示,一個項包括以下內容:

1) Item_body:項的數(shù)據(jù)域

2) Item_key: 項的鍵值

3) Item_offset:數(shù)據(jù)域的起點在結點中的偏移量

4) Item_length: 數(shù)據(jù)域的長度

5) Item_Plugin_id:項接口ID。

圖2: ReiserFS 項結構

[upload=2]

ReiserFS設計了多種不同的項以存儲不同的數(shù)據(jù),主要有以下幾種:

1) static_stat_data: 靜態(tài)統(tǒng)計數(shù)據(jù),包括文件的所有者,訪問權限,創(chuàng)建時間,最近修改時間,鏈接數(shù)等

2) cmpnd_dir_item: 包含各個目錄項

3) extend_pointers: 指向一個盤區(qū)(extend)

4) node_pointers: 指向一個結點

5) bodies: 包含的是文件的小部分數(shù)據(jù)

3.3 ReiserFS日志

與ext3 一樣,ReiserFS也有三種日志模式,即journal,ordered,writeback。同時,ReiserFS引入了兩種日志優(yōu)化方法: copy-on-capture和steal-on-capture。copy-on-capture:當一個事務要修改的塊在另一個未提交的事務中時,就把這個塊復制一份,這樣這兩個事務就可以并發(fā)進行了。steal-on-capture:當一個塊被多個事務修改時,只有最晚提交的那個事務才把這個塊實際寫入文件系統(tǒng),其他事務都不寫這個塊。

四、XFS

XFS 是一種高性能的64 位文件系統(tǒng),由SGI 公司為了替代原有的EFS 文件系統(tǒng)而開發(fā)的。XFS 通過保持cache 的一致性、定位數(shù)據(jù)和分布處理磁盤請求來提供對文件系統(tǒng)數(shù)據(jù)的低延遲、高帶寬的訪問。目前SGI已經(jīng)將XFS文件系統(tǒng)從IRIX移植到Linux。

4.1 分配組(allocation groups)

當創(chuàng)建 XFS 文件系統(tǒng)時,底層塊設備被分割成八個或更多個大小相等的線性區(qū)域(region),用戶可以將它們想象成"塊"(chunk)或者"線性范圍(range)",在 XFS 中,每個區(qū)域稱為一個"分配組"。分配組是唯一的,因為每個分配組管理自己的索引節(jié)點(inode)和空閑空間,實際上是將這些分配組轉化為一種文件子系統(tǒng),這些子系統(tǒng)透明地存在于 XFS 文件系統(tǒng)內。有了分配組,XFS 代碼將允許多個線程和進程持續(xù)以并行方式運行,即使它們中的許多線程和進程正在同一文件系統(tǒng)上執(zhí)行大規(guī)模 IO 操作。因此,將 XFS 與某些高端硬件相結合,將獲得高性能而不會使文件系統(tǒng)成為瓶頸。分配組在內部使用高效的 B+樹來跟蹤主要數(shù)據(jù),具有優(yōu)越性能和極大的可擴展性。

4.2 日志記錄

XFS 也是一種日志記錄文件系統(tǒng),它允許意外重新引導后的快速恢復。象 ReiserFS 一樣,XFS 使用邏輯日志;它不象 ext3 那樣將文字文件系統(tǒng)塊記錄到日志,而是使用一種高效的磁盤格式來記錄元數(shù)據(jù)的變動。就 XFS 而言,邏輯日志記錄是很適合的;在高端硬件上,日志經(jīng)常是整個文件系統(tǒng)中爭用

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內容真實性等。需要轉載請聯(lián)系該專欄作者,如若文章內容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或將催生出更大的獨角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉型技術解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術學會聯(lián)合牽頭組建的NVI技術創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術創(chuàng)新聯(lián)...

關鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術
關閉
關閉