當(dāng)前位置:首頁 > 公眾號精選 > 程序喵大人
[導(dǎo)讀]今天我們來思考一個(gè)簡單的問題。在Linux下你用touch命令新建一個(gè)空文件: touch empty_file.txt 當(dāng)操作完成后,是否要消耗掉我們的一些磁盤空間?需要的話,大概能消耗多少?嗯,是的,這個(gè)問題簡單的超乎你的想象,但是不知道你否能給你自己一個(gè)滿意的答案。

今天我們來思考一個(gè)簡單的問題。在Linux下你用touch命令新建一個(gè)空文件:

touch empty_file.txt

操作完成后,是否要消耗掉我們的一些磁盤空間?需要的話,大概能消耗多少?嗯,是的,這個(gè)問題簡單的超乎你的想象,但是不知道你否能給你自己一個(gè)滿意的答案。

我前面的幾篇文章都是介紹的磁盤物理層面的構(gòu)成,但這對于理解文件相關(guān)的問題幫助可能還不夠。從今天開始讓我們從物理層往上走,到Linux文件系統(tǒng)原理里去尋找答案。

1
實(shí)踐出真知

我覺得可能先丟開內(nèi)核原理,直接動(dòng)手操作來實(shí)驗(yàn)更有意思一些。你一定知道ls這個(gè)命令你可以查看文件大小,那么讓我們就用它來看一下。

# touch abcdefghigklmn.txt ?
# ls -l ?
total 0 ?
-rw-r--r-- 1 root root 0 Aug 17 17:49 empty.file

額,ls命令告訴我這個(gè)空文件占用的是0。文件的大小確實(shí)是0,因?yàn)槲覀冞€沒有為該文件寫入任何內(nèi)容。但是我們現(xiàn)在要思考的是,一個(gè)空文件是否占用磁盤空間。所以直覺告訴我們這絕對不可能,磁盤上多出來一個(gè)文件,怎么可能一點(diǎn)空間開銷都沒有!

為了解開這個(gè)謎底,還需要借助df命令。輸入df –i

# df -i
Filesystem ? ? ? ? ? ?Inodes ? IUsed ? IFree IUse% Mounted on
......
/dev/sdb1 ? ? ? ? ? ?2147361984 12785019 2134576965 ? ?1% /search

這個(gè)輸出幫我們展示了我們文件系統(tǒng)中inode的使用情況。注意IUsed是12785019。我們繼續(xù)新建一個(gè)空文件:

# touch empty_file2.txt
df -i
Filesystem ? ? ? ? ? ?Inodes ? IUsed ? IFree IUse% Mounted on
......
/dev/sdb1 ? ? ? ? ? ?2147361984 12785020 2134576964 ? ?1% /search

這下注意IUsed變成了12785020。

哈哈,我們的一個(gè)結(jié)論就出來了。新建一個(gè)空文件會(huì)占用一個(gè)Inode。

2
細(xì)說Inode

那么inode里都存了哪些和文件相關(guān)的信息呢?我們再稍微看一下內(nèi)核的源代碼。大家可以下載一份linux的源代碼。以ext2文件系統(tǒng)為例,在我下載的linux-2.6里的文件fs/ext2/ext2.h中,可以找到內(nèi)核對于inode結(jié)構(gòu)體的定義。該結(jié)構(gòu)體較為復(fù)雜,主要存儲(chǔ)除了文件內(nèi)容以外的一些其他數(shù)據(jù),我們選一些比較關(guān)鍵的截取出來:

struct ext2_inode {
? ? ? ?__le16 ?i_mode; ? ? ? ? # 文件權(quán)限
? ? ? ?__le16 ?i_uid; ? ? ? ? ?# 文件所有者ID
? ? ? ?__le32 ?i_size; ? ? ? ? # 文件字節(jié)數(shù)大小
? ? ? ?__le32 ?i_atime; ? ? ? ?# 文件上次被訪問的時(shí)間
? ? ? ?__le32 ?i_ctime; ? ? ? ?# 文件創(chuàng)建時(shí)間
? ? ? ?__le32 ?i_mtime; ? ? ? ?# 文件被修改的時(shí)間
? ? ? ?__le32 ?i_dtime; ? ? ? ?# 文件被刪除的時(shí)間
? ? ? ?__le16 ?i_gid; ? ? ? ? ?# 文件所屬組ID
? ? ? ?__le16 ?i_links_count; ?# 此文件的inode被連接的次數(shù)
? ? ? ?__le32 ?i_blocks; ? ? ? # 文件的block數(shù)量
? ? ? ?......
? ? ? ?__le32 ?i_block[EXT2_N_BLOCKS]; # 指向存儲(chǔ)文件數(shù)據(jù)的塊的數(shù)組
? ? ? ?......

可以看到和文件相關(guān)的所屬用戶、訪問時(shí)間等都是存在inode中的。另外在include/linux/fs.h中,還有個(gè)VFS層面的inode的定義,這里咱就不發(fā)散了。使用stat命令就可以直接看到文件inode中數(shù)據(jù)。

# stat test
?File: `test'
?Size: 0 ? ? ? ? ? ? ? Blocks: 0 ? ? ? ? ?IO Block: 1024 ? regular empty file
Device: 801h/2049d ? ? ?Inode: 26 ? ? ? ? ?Links: 1
Access: (0644/-rw-r--r--) ?Uid: ( ? ?0/ ? ?root) ? Gid: ( ? ?0/ ? ?root)
Access: 2020-03-01 12:14:31.000000000 +0800
Modify: 2020-03-01 12:14:31.000000000 +0800
Change: 2020-03-01 12:14:31.000000000 +0800

每個(gè)inode到底是多大呢?dumpe2fs可以告訴你(XFS的話使用xfs_info)。

# dumpe2fs -h /dev/mapper/vgroot-lvroot
dumpe2fs 1.41.12 (17-May-2010)
......
Inode size: ? ? ? ? ? ? ? 256

Inode size表示每個(gè)Inode的大小。我的這臺(tái)機(jī)器上,每個(gè)inode都是256字節(jié)。兩個(gè)inode的大小正好對齊到磁盤扇區(qū)的512字節(jié)。

3
文件名存到哪里了

Inode結(jié)構(gòu)體都看完了,搞了半天不知道有沒有發(fā)現(xiàn)一個(gè)問題,inode里并沒有存儲(chǔ)文件名??!那么,文件名到底跑哪兒去了?

fs/ext2/ext2.h中,我找到了如下文件夾相關(guān)的結(jié)構(gòu)體

struct ext2_dir_entry {
? ? ? ? __le32 ?inode; ? ? ? ? ? ? ? ? ?/* Inode number */
? ? ? ? __le16 ?rec_len; ? ? ? ? ? ? ? ?/* Directory entry length */
? ? ? ? __le16 ?name_len; ? ? ? ? ? ? ? /* Name length */
? ? ? ? char ? ?name[]; ? ? ? ? ? ? ? ? /* File name, up to EXT2_NAME_LEN */
};

這個(gè)結(jié)構(gòu)體就是我們司空見慣的文件夾所使用的數(shù)據(jù)結(jié)構(gòu)。沒錯(cuò),文件名是存在其所屬的文件夾中的,就是其中的char name[]字段。和文件名一起,文件夾里還記錄了該文件的inode號等信息。

4
結(jié)論
  • 1. 新建一個(gè)空文件需要消耗掉一個(gè)inode,用來保存用戶、創(chuàng)建時(shí)間等元數(shù)據(jù)。

  • 2. 新建一個(gè)空文件還需要消耗掉其所在目錄的block中一定的空間,這些空間用來保存文件名,inode號等信息。

所以,看起來新建一個(gè)空文件而已,只要你想挖,真的能挖出很多知識的。最后分享一個(gè)我們團(tuán)隊(duì)里同學(xué)遇到的一個(gè)故障。我們的一臺(tái)離線任務(wù)機(jī)直接歇菜了,重啟后排查原因是inode被消耗光了。再追查發(fā)現(xiàn)一個(gè)進(jìn)程創(chuàng)建了太多的空日志文件。雖然文件都是空文件,但是inode卻被浪費(fèi)光了。后來讓負(fù)責(zé)的同學(xué)修改了創(chuàng)建日志文件的邏輯,刪掉了多出來的空文件,該機(jī)器恢復(fù)正常。

往期推薦




免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。文章僅代表作者個(gè)人觀點(diǎn),不代表本平臺(tái)立場,如有問題,請聯(lián)系我們,謝謝!

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動(dòng)力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉