當(dāng)前位置:首頁 > 公眾號(hào)精選 > 小林coding
[導(dǎo)讀]什么是文件?程序員使用I/O最終都逃不過文件這個(gè)概念

什么是文件

程序員使用I/O最終都逃不過文件這個(gè)概念。

在Linux世界中文件是一個(gè)很簡單的概念,作為程序員我們只需要將其理解為一個(gè)N byte的序列就可以了:

b1, b2, b3, b4, ....... bN

實(shí)際上所有的I/O設(shè)備都被抽象為了文件這個(gè)概念,一切皆文件,Everything is File,磁盤、網(wǎng)絡(luò)數(shù)據(jù)、終端,甚至進(jìn)程間通信工具管道pipe等都被當(dāng)做文件對(duì)待。

所有的I/O操作也都可以通過文件讀寫來實(shí)現(xiàn),這一非常優(yōu)雅的抽象可以讓程序員使用一套接口就能對(duì)所有外設(shè)I/O操作。

常用的I/O操作接口一般有以下幾類:

  • 打開文件,open

  • 改變讀寫位置,seek

  • 文件讀寫,read、write

  • 關(guān)閉文件,close

程序員通過這幾個(gè)接口幾乎可以實(shí)現(xiàn)所有I/O操作,這就是文件這個(gè)概念的強(qiáng)大之處。


文件描述符

要想進(jìn)行I/O讀操作,像磁盤數(shù)據(jù),我們需要指定一個(gè)buff用來裝入數(shù)據(jù),一般都是這樣寫的:

read(buff);
但是這里我們忽略了一個(gè)關(guān)鍵問題,那就是雖然我們指定了往哪里寫數(shù)據(jù),但是我們該從哪里讀數(shù)據(jù)呢?
從上一節(jié)中我們知道,通過文件這個(gè)概念我們能實(shí)現(xiàn)幾乎所有I/O操作, 因此這里少的一個(gè)主角就是文件

那么我們一般都怎樣使用文件呢?

如果周末你去比較火的餐廳吃飯應(yīng)該會(huì)有體會(huì),一般周末人氣高的餐廳都會(huì)排隊(duì),然后服務(wù)員會(huì)給你一個(gè)排隊(duì)序號(hào),通過這個(gè)序號(hào)服務(wù)員就能找到你,這里的好處就是服務(wù)員無需記住你是誰、你的名字是什么、來自哪里、喜好是什么、是不是保護(hù)環(huán)境愛護(hù)小動(dòng)物等等,這里的關(guān)鍵點(diǎn)就是服務(wù)員對(duì)你一無所知,但依然可以通過一個(gè)號(hào)碼就能找到你。

同樣的,在Linux世界要想使用文件,我們也需要借助一個(gè)號(hào)碼,根據(jù)“弄不懂原則”,這個(gè)號(hào)碼就被稱為了文件描述符,file descriptors,在Linux世界中鼎鼎大名,其道理和上面那個(gè)排隊(duì)號(hào)碼一樣。

因此,文件描述僅僅就是一個(gè)數(shù)字而已,但是通過這個(gè)數(shù)字我們可以操作一個(gè)打開的文件,這一點(diǎn)要記住。

有了文件描述符,進(jìn)程可以對(duì)文件一無所知,比如文件在磁盤的什么位置、加載到內(nèi)存中又是怎樣管理的等等,這些信息統(tǒng)統(tǒng)交由操作系統(tǒng)打理,進(jìn)程無需關(guān)心,操作系統(tǒng)只需要給進(jìn)程一個(gè)文件描述符就足夠了。

因此我們來完善上述程序:

int?fd?=?open(file_name);?//?獲取文件描述符read(fd,?buff);

怎么樣,是不是非常簡單。


文件描述符太多了怎么辦

經(jīng)過了這么多的鋪墊,終于要到高性能、高并發(fā)這一主題了。

從前幾節(jié)我們知道,所有I/O操作都可以通過文件樣的概念來進(jìn)行,這當(dāng)然包括網(wǎng)絡(luò)通信。

如果你有一個(gè)web服務(wù)器,當(dāng)三次握手成功以后,我們會(huì)調(diào)用accept來獲取一個(gè)鏈接,調(diào)用該函數(shù)我們同樣會(huì)得到一個(gè)文件描述符,通過這個(gè)文件描述符就可以處理客戶端發(fā)送的請(qǐng)求并且把處理結(jié)果發(fā)送回去。也就是說通過這個(gè)描述符我們就可以和客戶端進(jìn)行通信了。

// 通過accept獲取客戶端的文件描述符int conn_fd = accept(...);

server的處理邏輯通常是讀取客戶端請(qǐng)求數(shù)據(jù),然后執(zhí)行某些特定邏輯:

if(read(conn_fd, request_buff) > 0) { do_something(request_buff);}

是不是非常簡單,然而世界終歸是復(fù)雜的,當(dāng)然也不是這么簡單的。

接下來就是比較復(fù)雜的了。

既然我們的主題是高并發(fā),那么server就不可能只和一個(gè)客戶端通信,而是可能會(huì)同時(shí)和成千上萬個(gè)客戶端進(jìn)行通信。這時(shí)你需要處理不再是一個(gè)描述符這么簡單,而是有可能要處理成千上萬個(gè)描述符。

為了不讓問題一上來就過于復(fù)雜,我們先簡單化,假設(shè)只同時(shí)處理兩個(gè)客戶端的請(qǐng)求。

有的同學(xué)可能會(huì)說,這還不簡單,這樣寫不就行了:

if(read(socket_fd1, buff) > 0) { // 處理第一個(gè) do_something();}if(read(socket_fd2, buff) > 0) { // 處理第二個(gè) do_something();

在上一篇《讀取文件時(shí),程序都經(jīng)歷了什么》中我們討論過這是非常典型的阻塞式I/O,如果此時(shí)沒有數(shù)據(jù)可讀那么進(jìn)程會(huì)被阻塞而暫停運(yùn)行,這時(shí)我們就無法處理第二個(gè)請(qǐng)求了,即使第二個(gè)請(qǐng)求的數(shù)據(jù)已經(jīng)就位,這也就意味著處理某一個(gè)客戶端時(shí)由于進(jìn)程被阻塞導(dǎo)致剩下的所有其它客戶端必須等待,在同時(shí)處理幾萬客戶端的server上,這顯然是不能容忍的。

聰明的你一定會(huì)想到使用多線程,為每個(gè)客戶端請(qǐng)求開啟一個(gè)線程,這樣一個(gè)客戶端被阻塞就不會(huì)影響到處理其它客戶端的線程了,注意,既然是高并發(fā),那么我們要為成千上萬個(gè)請(qǐng)求開啟成千上萬個(gè)線程嗎,大量創(chuàng)建銷毀線程會(huì)嚴(yán)重影響系統(tǒng)性能。

那么這個(gè)問題該怎么解決呢?

這里的關(guān)鍵點(diǎn)在于,我們事先并不知道一個(gè)文件描述對(duì)應(yīng)的I/O設(shè)備是否是可讀的、是否是可寫的,在外設(shè)的不可讀或不可寫的狀態(tài)下進(jìn)行I/O只會(huì)導(dǎo)致進(jìn)程阻塞被暫停運(yùn)行。

因此要優(yōu)雅的解決這個(gè)問題,就要從其它角度來思考這個(gè)問題了。


不要打電話給我,有需要我會(huì)打給你

大家生活中肯定會(huì)接到過推銷電話,而且不止一個(gè),一天下來接上十個(gè)八個(gè)推銷電話你的身體會(huì)被掏空的。

這個(gè)場景的關(guān)鍵點(diǎn)在于打電話的人并不知道你是不是要買東西,只能來一遍遍問你,因此一種更好的策略是不要讓他們打電話給你,記下他們的電話,有需要的話打給他們,這樣推銷員就不會(huì)一遍一遍的來煩你了(雖然現(xiàn)實(shí)生活中這并不可能)。

在這個(gè)例子中,你,就好比內(nèi)核,推銷者就好比應(yīng)用程序,電話號(hào)碼就好比文件描述符,和你用電話溝通就好比I/O。

現(xiàn)在你應(yīng)該明白了吧,處理多個(gè)文件描述符的更好方法其實(shí)就存在于推銷電話中。

因此相比上一節(jié)中我們通過I/O接口主動(dòng)問內(nèi)核這些文件描述符對(duì)應(yīng)的外設(shè)是不是已經(jīng)就緒了,一種更好的方法是,我們把這些感興趣的文件描述符一股腦扔給內(nèi)核,并霸氣的告訴內(nèi)核:“我這里有1萬個(gè)文件描述符,你替我監(jiān)視著它們,有可以讀寫的文件描述符時(shí)你就告訴我,我好處理”。而不是弱弱的問內(nèi)核:“第一個(gè)文件描述可以讀寫了嗎?第二個(gè)文件描述符可以讀寫嗎?第三個(gè)文件描述符可以讀寫了嗎?。。?!?/p>

這樣應(yīng)用程序就從“繁忙”的主動(dòng)變?yōu)榱饲彘e的被動(dòng),反正文件描述可讀可寫了內(nèi)核會(huì)通知我,能偷懶我才不要那么勤奮。

這是一種更加高效的I/O處理機(jī)制,現(xiàn)在我們可以一次處理多路I/O了,為這種機(jī)制起一個(gè)名字吧,再次祭出“弄不懂原則”,就叫I/O多路復(fù)用吧,這就是 I/O multiplexing。


I/O多路復(fù)用,I/O multiplexing

multiplexing一詞其實(shí)多用于通信領(lǐng)域,為了充分利用通信線路,希望在一個(gè)信道中傳輸多路信號(hào),要想在一個(gè)信道中傳輸多路信號(hào)就需要把這多路信號(hào)結(jié)合為一路,將多路信號(hào)組合成一個(gè)信號(hào)的設(shè)備被稱為multiplexer,顯然接收方接收到這一路組合后的信號(hào)后要恢復(fù)原先的多路信號(hào),這個(gè)設(shè)備被稱為demultiplexer,如圖所示:

回到我們的主題。

所謂I/O多路復(fù)用指的是這樣一個(gè)過程:

1. 我們拿到了一堆文件描述符(不管是網(wǎng)絡(luò)相關(guān)的、還是磁盤文件相關(guān)等等,任何文件描述符都可以)

2. 通過調(diào)用某個(gè)函數(shù)告訴內(nèi)核:“這個(gè)函數(shù)你先不要返回,你替我監(jiān)視著這些描述符,當(dāng)這堆文件描述符中有可以進(jìn)行I/O讀寫操作的時(shí)候你再返回

3. 當(dāng)調(diào)用的這個(gè)函數(shù)返回后我們就能知道哪些文件描述符可以進(jìn)行I/O操作了。

也就是說通過I/O多路復(fù)用我們可以同時(shí)處理多路I/O。那么有哪些函數(shù)可以用來進(jìn)行I/O多路復(fù)用呢?

在Linux世界中有這樣三種機(jī)制可以用來進(jìn)行I/O多路復(fù)用:

  • select

  • poll

  • epoll

接下來我們就來介紹一下牛掰的I/O多路復(fù)用三劍客。


I/O多路復(fù)用三劍客

本質(zhì)上select、poll、epoll都是阻塞式I/O,也就是我們常說的同步I/O,原因在于調(diào)用這些I/O多路復(fù)用函數(shù)時(shí)如果任何一個(gè)需要監(jiān)視的文件描述符都不可讀或者可寫那么進(jìn)程會(huì)被阻塞暫停執(zhí)行,直到有文件描述符可讀或者可寫才繼續(xù)運(yùn)行。

1,select:初出茅廬

在select這種I/O多路復(fù)用機(jī)制下,我們需要把想監(jiān)控的文件描述集合通過函數(shù)參數(shù)的形式告訴select,然后select會(huì)將這些文件描述符集合拷貝到內(nèi)核中,我們知道數(shù)據(jù)拷貝是有性能損耗的,因此為了減少這種數(shù)據(jù)拷貝帶來的性能損耗,Linux內(nèi)核對(duì)集合的大小做了限制,并規(guī)定用戶監(jiān)控的文件描述集合不能超過1024個(gè),同時(shí)當(dāng)select返回后我們僅僅能知道有些文件描述符可以讀寫了,但是我們不知道是哪一個(gè),因此程序員必須再遍歷一邊找到具體是哪個(gè)文件描述符可以讀寫了。

因此,總結(jié)下來select有這樣幾個(gè)特點(diǎn):

  • 我能照看的文件描述符數(shù)量有限,不能超過1024個(gè)

  • 用戶給我的文件描述符需要拷貝的內(nèi)核中

  • 我只能告訴你有文件描述符滿足要求了,但是我不知道是哪個(gè),你自己一個(gè)一個(gè)去找吧(遍歷)

因此我們可以看到,select機(jī)制的這些特性在高并發(fā)網(wǎng)絡(luò)服務(wù)器動(dòng)輒幾萬幾十萬并發(fā)鏈接的場景下無疑是低效的。


2,poll:小有所成

poll和select是非常相似的,poll相對(duì)于select的優(yōu)化僅僅在于解決了文件描述符不能超過1024個(gè)的限制,select和poll都會(huì)隨著監(jiān)控的文件描述數(shù)量增加而性能下降,因此不適合高并發(fā)場景。

3,epoll:獨(dú)步天下

在select面臨的三個(gè)問題中,文件描述數(shù)量限制已經(jīng)在poll中解決了,剩下的兩個(gè)問題呢?

針對(duì)拷貝問題,epoll使用的策略是各個(gè)擊破共享內(nèi)存。

實(shí)際上文件描述符集合的變化頻率比較低,select和poll頻繁的拷貝整個(gè)集合,內(nèi)核都快被煩死了,epoll通過引入epoll_ctl很體貼的做到了只操作那些有變化的文件描述符,同時(shí)epoll和內(nèi)核還成為了好朋友,共享了同一塊內(nèi)存,這塊內(nèi)存中保存的就是那些已經(jīng)可讀或者可寫的的文件描述符集合,這樣就減少了內(nèi)核和程序的拷貝開銷。

針對(duì)需要遍歷文件描述符才能知道哪個(gè)可讀可寫這一問題,epoll使用的策略是“當(dāng)小弟”。

在select和poll機(jī)制下,進(jìn)程要親自下場去各個(gè)文件描述符上等待,任何一個(gè)文件描述可讀或者可寫就喚醒進(jìn)程,但是進(jìn)程被喚醒后也是一臉懵逼并不知道到底是哪個(gè)文件描述符可讀或可寫,還要再從頭到尾檢查一遍。

但epoll就懂事多了,主動(dòng)找到進(jìn)程要當(dāng)小弟替大哥出頭。

在這種機(jī)制下,進(jìn)程不需要親自下場了,進(jìn)程只要等待在epoll上,epoll代替進(jìn)程去各個(gè)文件描述符上等待,當(dāng)哪個(gè)文件描述符可讀或者可寫的時(shí)候就告訴epoll,epoll用小本本認(rèn)真記錄下來然后喚醒大哥:“進(jìn)程大哥,快醒醒,你要處理的文件描述符我都記下來了”,這樣進(jìn)程被喚醒后就無需自己從頭到尾檢查一遍,因?yàn)閑poll小弟都已經(jīng)記下來了。

因此我們可以看到,在epoll這種機(jī)制下,實(shí)際上利用的就是“不要打電話給我,有需要我會(huì)打給你”這種策略,進(jìn)程不需要一遍一遍麻煩的問各個(gè)文件描述符,而是翻身做主人了,“你們這些文件描述符有哪個(gè)可讀或者可寫了主動(dòng)報(bào)上來”,這種機(jī)制實(shí)際上就是大名鼎鼎的事件驅(qū)動(dòng),Event-driven,這也是我們下一篇的主題。

實(shí)際上在Linux平臺(tái),epoll基本上就是高并發(fā)的代名詞。


總結(jié)

基于一切皆文件的設(shè)計(jì)哲學(xué),I/O也可以通過文件的形式實(shí)現(xiàn),高并發(fā)場景下要與多個(gè)文件交互,這就離不開高效的I/O多路復(fù)用技術(shù),本文我們詳細(xì)講解了什么是I/O多路復(fù)用以及使用方法,這其中以epoll為代表的I/O多路復(fù)用(基于事件驅(qū)動(dòng))技術(shù)使用非常廣泛,實(shí)際上你會(huì)發(fā)現(xiàn)但凡涉及到高并發(fā)、高性能的場景基本上都能見到事件驅(qū)動(dòng)的編程方法,當(dāng)然這也是下一篇我們要重點(diǎn)講解的主題,敬請(qǐng)期待。



哈嘍,我是小林,就愛圖解計(jì)算機(jī)基礎(chǔ)。如果覺得文章對(duì)你有幫助,歡迎分享給你的朋友,也給小林點(diǎn)個(gè)「在看」,這對(duì)小林非常重要。


謝謝你們,給各位小姐姐小哥哥們抱拳了,我們下次見!


推薦閱讀
讀者問:小林你能分享做公眾號(hào)的經(jīng)驗(yàn)嗎?
CPU 執(zhí)行程序的秘密,藏在了這 15 張圖里
知道硬盤很慢,但沒想到比 CPU Cache 慢 10000000 倍
如何寫出讓 CPU 跑得更快的代碼?
10 張圖打開 CPU 緩存一致性的大門

免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。文章僅代表作者個(gè)人觀點(diǎn),不代表本平臺(tái)立場,如有問題,請(qǐng)聯(lián)系我們,謝謝!

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動(dòng)力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉