1. 落寞的小黑
上周北京很冷,周五晚上大白下班奔地鐵站,收到了好基友小黑的微信:
于是大白掉頭掃了個單車奔五道口了,小黑靠譜地選了個不錯的位置。
大白: 就咱這覺悟,心里有工作,哪里都是辦公桌,不要拘泥于形式嘛。
明顯能感覺得到小黑哥最近好像比較累,之前眼里bulingbuling閃的光是看不到了。
小黑: 是一家做自動駕駛的創(chuàng)業(yè)公司,網(wǎng)站是看團隊介紹還不錯,就去看看了,這次沒咋準(zhǔn)備,很多問題其實都熟悉,但是回答的不到位。
大白: 哦,明白了,那就是當(dāng)時理解的不到位,稀里糊涂過去了,現(xiàn)在忽然問起來,想不起重點。
小黑: 差不多吧,問我都做過哪些高性能的網(wǎng)絡(luò)框架模型,也就是IO和事件驅(qū)動那一套。
話說完,小黑喝了一大口啤酒,大白看出了小黑心里有一些落寞。
畢竟在帝都這個地方競爭和工作壓力,以及生活瑣事都一直圍繞著我們,但是金錢和好運都巧妙地避開了自己...
想到這里,大白也深深喝了一大口,我命由我不由天,開整!
大白:黑哥,你說這個問題確實不好回答,全是術(shù)語和略帶歧義的東西,我覺得我們抓住本質(zhì)去闡述就好。
小黑:來,請開始你的表演,我學(xué)習(xí)學(xué)習(xí)。
大白決定和小黑好好聊聊,Linux開發(fā)中常用的高性能網(wǎng)絡(luò)框架中的一些事兒,火鍋的映襯下讓夜色和天氣都不那么寒冷了。
2. IO事件和IO復(fù)用
2.1 什么是IO事件
IO指的是輸入Input/輸出Output,但是從漢語角度來說,出和入是相對的,所以我們需要個參照物。
這里我們的參照物選擇為程序運行時的主存儲空間,外部通常包括網(wǎng)卡、磁盤等。
有了上述的設(shè)定理解起來就方便多了,我們來一起看下:
IO的本質(zhì)是數(shù)據(jù)的流動,數(shù)據(jù)可以從網(wǎng)卡到程序內(nèi)存,也可以從程序內(nèi)存寫到網(wǎng)卡,磁盤操作也是如此。
-
網(wǎng)絡(luò)IO:內(nèi)存和網(wǎng)卡的數(shù)據(jù)交互
-
文件IO:內(nèi)存和磁盤的數(shù)據(jù)交互
事件可以理解為一種狀態(tài)或者動作,也就是狀態(tài)的遷移會觸發(fā)一種相應(yīng)的動作。
理解可讀可寫事件是非常有必要的,一般來說一個socket大部分時候是可寫的,但是并不是都可讀。
可讀一般代表是一個新連接或者原有連接有新數(shù)據(jù)交互,對于服務(wù)端程序來說也是重點關(guān)注的事件。
2.2 什么是IO復(fù)用
設(shè)想假如有幾萬個IO事件,那么應(yīng)用程序該如何管理呢?這就要提到IO復(fù)用了。
IO復(fù)用從本質(zhì)上來說就是應(yīng)用程序借助于IO復(fù)用函數(shù)向內(nèi)核注冊很多類型的IO事件,當(dāng)這些注冊的IO事件發(fā)生變化時內(nèi)核就通過IO復(fù)用函數(shù)來通知應(yīng)用程序。
從圖中可以看到,IO復(fù)用中復(fù)用的就是一個負責(zé)監(jiān)聽管理這些IO事件的線程。
之所以可以實現(xiàn)一個線程管理成百上千個IO事件,是因為大部分時間里某個時刻只有少量IO事件被觸發(fā)。
大概就像這樣:
草原上的一只大狗可以看管幾十只綿羊,因為大部分時候只有個別綿羊不守規(guī)矩亂跑,其他的都是乖乖吃草。
3. 網(wǎng)絡(luò)框架設(shè)計要素
要理解網(wǎng)絡(luò)框架有哪些,必須要清楚網(wǎng)絡(luò)框架完成了哪些事情。
-
遠端的機器A發(fā)送了一個HTTP請求到服務(wù)器B,此時服務(wù)器B網(wǎng)卡接收到數(shù)據(jù)并產(chǎn)生一個IO可讀事件;
-
我們以同步IO為例,此時內(nèi)核將該可讀事件通知到應(yīng)用程序的Listen線程;
-
Listen線程將任務(wù)甩給Handler線程,由Handler將數(shù)據(jù)從內(nèi)核讀緩沖區(qū)拷貝到用戶空間讀緩沖區(qū);
-
請求數(shù)據(jù)包在應(yīng)用程序內(nèi)部進行計算和處理并封裝響應(yīng)包;
-
-
當(dāng)這個連接可寫時將數(shù)據(jù)從用戶態(tài)寫緩沖區(qū)拷貝到內(nèi)核緩沖區(qū),并通過網(wǎng)卡發(fā)送出去;
備注:上述例子是以同步IO為例,并且將線程中的角色分為Listen線程、Handler線程、Worker線程,分別完成不同的工作,后續(xù)會詳細展開。
所以我們可以知道,要完成一個數(shù)據(jù)交互,涉及了幾大塊內(nèi)容:
大白認為,這三大塊內(nèi)容,不論什么形式的框架都繞不開,也是理解網(wǎng)絡(luò)架構(gòu)的關(guān)鍵所在。
4. 高性能網(wǎng)絡(luò)框架實踐
4.1 基于線程模型
在早期并發(fā)數(shù)不多的場景中,有一種One Request One Thread的架構(gòu)模式。
該模式下每次接收一個新請求就創(chuàng)建一個處理線程,線程雖然消耗資源并不多,但是成千上萬請求打過來,性能也是扛不住的。
這是一種比較原始的架構(gòu),思路也非常清晰,創(chuàng)建多個線程來提供處理能力,但在高并發(fā)生產(chǎn)環(huán)境中幾乎沒有應(yīng)用,本文不再展開。
4.2 基于事件驅(qū)動模型
當(dāng)前流行的是基于事件驅(qū)動的IO復(fù)用模型,相比多線程模型優(yōu)勢很明顯。
在此我們先理解一下什么是事件驅(qū)動Event-Drive-Model。
事件驅(qū)動編程是一種編程范式,程序的執(zhí)行流由外部事件來決定,它的特點是包含一個事件循環(huán),當(dāng)外部事件發(fā)生時使用回調(diào)機制來觸發(fā)相應(yīng)的處理。
通俗來說就是:
有一個循環(huán)裝置在一直等待各種事件的到來,并將到達的事件放到隊列中,再由一個分揀裝置來調(diào)用對應(yīng)的處理裝置來響應(yīng)。
4.3 Reactor反應(yīng)堆模式
第一次聽到這個模式的時候很困惑,究竟反應(yīng)堆是個啥?
研究了一下發(fā)現(xiàn),反應(yīng)堆是個核物理的概念,大致是這個樣子的:
核反應(yīng)堆是核電站的心臟 ,它的工作原理是這樣的:原子由原子核與核外電子組成,原子核由質(zhì)子與中子組成。
當(dāng)鈾235的原子核受到外來中子轟擊時,一個原子核會吸收一個中子分裂成兩個質(zhì)量較小的原子核,同時放出2-3個中子。
這裂變產(chǎn)生的中子又去轟擊另外的鈾235原子核,引起新的裂變,
如此持續(xù)進行就是裂變的鏈?zhǔn)椒磻?yīng)。
結(jié)合這種核裂變的圖,好像
是一個請求打過來,服務(wù)器內(nèi)部瞬間延伸出很多分支來完成響應(yīng),一變二,二變四,甚至更多,確實有種反應(yīng)堆的感覺。
接下來我們看看究竟反應(yīng)堆模式是如何構(gòu)建高性能網(wǎng)絡(luò)框架的。
5.反應(yīng)堆模式詳解
反應(yīng)堆模式是一種思想,形式卻有很多種。
5.1 反應(yīng)堆模式的本質(zhì)是什么
從本質(zhì)上理解,無論什么網(wǎng)絡(luò)框架都要完成兩部分操作:
-
-
CPU操作:數(shù)據(jù)請求的處理和封裝
所以上述這些問題
由誰來做以及多少線程來做,就衍生出了很多形式,所以不要被表面現(xiàn)象迷惑,出現(xiàn)必有原因,追溯之后我們才能真正掌握它。
反應(yīng)堆模式根據(jù)處理IO環(huán)節(jié)和處理數(shù)據(jù)環(huán)節(jié)的數(shù)量差異分為如下幾種:
我們來看看這三種常見模式的特點、原理、優(yōu)缺點、應(yīng)用場景等。
5.2 單Reactor線程模式
這種模式最為簡潔,一個線程完成了連接的監(jiān)聽、接收新連接、處理連接、讀取數(shù)據(jù)、寫入數(shù)據(jù)全套工作。
由于只使用了一個線程,對于多核利用率偏低,但是編程簡單。
是不是覺得這個種單線程的模式?jīng)]有市場?那可未必,不信你看Redis。
在這種模式種IO操作和CPU操作是沒有分開的,都是由1個線程來完成的,顯然如果在Handler處理某個請求超時了將會阻塞客戶端的正常連接。
在Redis中由于都是內(nèi)存操作,速度很快,這種瓶頸雖然存在但是不夠明顯。
5.3 單Reactor線程和線程池模式
為了解決IO操作和CPU操作的不匹配,也就是IO操作和CPU操作是在一個線程內(nèi)部串行執(zhí)行的,這樣就拉低了CPU操作效率。
一種解決方法就是將IO操作和CPU操作分別由單獨的線程來完成,各玩各的互不影響。
單Reactor線程完成IO操作、復(fù)用工作線程池來完成CPU操作就是一種解決思路。
在這種模式種由Reactor線程完成連接的管理和數(shù)據(jù)讀取&寫回,完全掌管IO操作。
工作線程池處理來自上游分發(fā)的任務(wù),對其中的數(shù)據(jù)進行解碼、計算、編碼再返回給Reactor線程和客戶端完成交互。
這種模式有效利用了多核,但是單Reactor線程來完成IO操作在高并發(fā)場景中仍然會出現(xiàn)瓶頸。
換句話說,連接實在太多了,一個Reactor線程忙不過來建立新連接和響應(yīng)舊連接這些事情,因此Reactor線程也需要幾個幫手。
5.4 多Reactor線程和線程池模式
我們將Reactor線程進行擴展,一個Reactor線程負責(zé)處理新連接,多個Reactor線程負責(zé)處理連接成功的IO數(shù)據(jù)讀寫。
也就是進一步將監(jiān)聽&創(chuàng)建連接 和 處理連接 分別由兩個及以上的線程來完成,進一步提高了IO操作部分的效率。
這種模式算是比較高配的版本了,在實際生產(chǎn)環(huán)境也有使用。
5.5 拓展:同步IO和異步IO
我們可以輕易區(qū)分什么是阻塞IO和非阻塞IO,那么什么是同步IO和異步IO呢?
前面提到Reactor模式其中非常重要的一環(huán)就是調(diào)用read/write函數(shù)來完成數(shù)據(jù)拷貝,這部分是應(yīng)用程序自己完成的,內(nèi)核只負責(zé)通知監(jiān)控的事件到來了,所以本質(zhì)上Reactor模式屬于非阻塞同步IO。
還有一種Preactor模式,借助于系統(tǒng)本身的異步IO特性,由操作系統(tǒng)進行數(shù)據(jù)拷貝,在完成之后來通知應(yīng)用程序來取就可以,效率更高一些,但是底層需要借助于內(nèi)核的異步IO機制來實現(xiàn)。
底層的異步IO機制可能借助于DMA和Zero-Copy技術(shù)來實現(xiàn),理論上性能更高。
當(dāng)前Windows系統(tǒng)通過IOCP實現(xiàn)了真正的異步I/O,而在Linux 系統(tǒng)的異步I/O還不完善,比如Linux中的boost.asio模塊就是異步IO的支持,但是目前Linux系統(tǒng)還是以基于Reactor模式的非阻塞同步IO為主。
6. 小結(jié)
本文從IO事件和IO復(fù)用出發(fā),闡述了網(wǎng)絡(luò)架構(gòu)最底層的組成。
繼續(xù)展開了基于線程模型和基于事件驅(qū)動模型的網(wǎng)絡(luò)框架特點及其設(shè)計要素。
之后重點描述了反應(yīng)堆模式的核心本質(zhì),以及生產(chǎn)環(huán)境中的多種形式。
最后簡單介紹了同步IO和異步IO的區(qū)別,以及Preactor模式的優(yōu)勢。
希望讀者朋友可以摒棄專業(yè)術(shù)語和表述,抓住問題的本質(zhì)和重點,找到一個適合自己思維方法去理解和掌握高性能網(wǎng)絡(luò)架構(gòu)的設(shè)計之道。
或許,高性能網(wǎng)絡(luò)框架只是一個紙老虎。
最后依然感謝各位的傾情閱讀,如果有問題,歡迎添加大白微信進行討論交流:
往期精彩文章
圖解|為什么HTTP3.0使用UDP協(xié)議
圖解|通用搜索引擎背后的技術(shù)點
圖解什么是一致性哈希算法
圖解|什么是缺頁錯誤Page Fault
圖解|什么是緩存系統(tǒng)三座大山
深入理解快速排序和STL的sort算法
Linux服務(wù)端最大并發(fā)數(shù)是多少?
免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺僅提供信息存儲服務(wù)。文章僅代表作者個人觀點,不代表本平臺立場,如有問題,請聯(lián)系我們,謝謝!