確定性網(wǎng)絡(luò):打造網(wǎng)絡(luò)里的超級高鐵
本文來源:SDNLAB
確定性網(wǎng)絡(luò)是指能保證業(yè)務(wù)的確定性帶寬、時延、抖動、丟包率指標(biāo)的網(wǎng)絡(luò);確定性網(wǎng)絡(luò)技術(shù)是一種新型的服務(wù)質(zhì)量(QoS)保障技術(shù)。本文面向小白科普入門,將盡量用通俗易懂的語言,深入淺出的分析確定性網(wǎng)絡(luò)的需求由來、技術(shù)實現(xiàn)和未來展望。
一、需求由來
業(yè)務(wù)形態(tài)和需求的改變是網(wǎng)絡(luò)技術(shù)變革的主要動力。
傳統(tǒng)電話網(wǎng)采用面向連接的電路交換技術(shù),其在通信前建立連接,為通信雙方分配具有固定帶寬的通信電路,直到通信結(jié)束再釋放連接;比如早期單一的64Kbps話音業(yè)務(wù),可以采用固定比特率進(jìn)行傳輸,一根電話線連兩頭,想打多久打多久。電路交換具有實時、低速率、高質(zhì)量的話音傳送的優(yōu)勢,但缺點是帶寬利用率不高。
而后一方面互聯(lián)網(wǎng)繁榮,圖片、視頻、搜索等業(yè)務(wù)形態(tài)變得復(fù)雜,采用分組交換后網(wǎng)絡(luò)就像大馬路的交通,路上自行車、小汽車、公交車、大貨車啥車都有,上下班高峰期容易排隊和擁堵,時延和抖動等需求沒有保障;
另一方面車載網(wǎng)絡(luò)、航空航天、金融交易、電力傳輸和石油勘探等垂直領(lǐng)域,出現(xiàn)了大量的專用總線和實時以太網(wǎng)技術(shù),其保證了流量的低時延低抖動傳輸,但礙于專線成本高,而各類實時以太網(wǎng)標(biāo)準(zhǔn)又互不兼容、且不與標(biāo)準(zhǔn)以太網(wǎng)兼容,所以技術(shù)封閉,沒法鋪到互聯(lián)網(wǎng)大馬路上。
因此,確定性網(wǎng)絡(luò)的需求主要來自兩方面:
-
兼容以太網(wǎng)標(biāo)準(zhǔn):在工業(yè)自動化、智能制造等傳統(tǒng)場景,需要用以太網(wǎng)統(tǒng)一替代幾十種現(xiàn)場總線和實時以太網(wǎng)標(biāo)準(zhǔn),融合IT網(wǎng)絡(luò)和OT網(wǎng)絡(luò),實現(xiàn)盡力而為流與工業(yè)時延敏感流的共網(wǎng)傳輸,降低成本。
-
承載確定性業(yè)務(wù):隨著機(jī)器與機(jī)器間通信流量激增,需要在自動駕駛、遠(yuǎn)程手術(shù)、全息通信等新興場景,結(jié)合5G等技術(shù),打造網(wǎng)絡(luò)里的超級高鐵,實現(xiàn)確定性業(yè)務(wù)的端到端傳輸。
二、技術(shù)實現(xiàn)
在講確定性網(wǎng)絡(luò)的技術(shù)挑戰(zhàn)前,首先要聊一下現(xiàn)有的互聯(lián)網(wǎng)和工業(yè)網(wǎng)絡(luò)是怎么做QoS服務(wù)質(zhì)量保障的。
互聯(lián)網(wǎng)怎么做QoS?
互聯(lián)網(wǎng)主要有四種方法保證QoS:擴(kuò)容/輕載、流量整形、隊列調(diào)度和擁塞控制。
-
擴(kuò)容/輕載:擴(kuò)容就是擴(kuò)帶寬,兩車道不夠用就改四車道、八車道,讓網(wǎng)絡(luò)處于輕載的狀態(tài)?,F(xiàn)在以太網(wǎng)已經(jīng)能做到單端口400G,當(dāng)然,比較費(fèi)錢。
-
流量整形:通過令牌桶、信用整形等技術(shù),對特定端口或者流量進(jìn)行限速。比如上游節(jié)點出端口帶寬8Gbps,下游節(jié)點空余帶寬只有2 Gbps,就要限制上游傳輸帶寬小于2Gbps,以免下游節(jié)點擁塞。好比兩車道不能八輛大卡車并排開。
-
隊列調(diào)度:隊列調(diào)度就是在交換機(jī)的出端口對流量進(jìn)行調(diào)度,好比紅綠燈。首先把包標(biāo)記上不同的優(yōu)先級,然后包進(jìn)入對應(yīng)的優(yōu)先級隊列,最后采用不同的隊列調(diào)度算法對包進(jìn)行處理。比如嚴(yán)格優(yōu)先級算法(SP),會讓高優(yōu)先級的流量有就一直轉(zhuǎn)發(fā);比如加權(quán)循環(huán)調(diào)度算法(WRR),會給每個隊列一個權(quán)重,按權(quán)重的比例依次進(jìn)行轉(zhuǎn)發(fā),以免低優(yōu)先級的流量長時間等待。
-
擁塞控制:當(dāng)流量過多,緩沖隊列都不夠用了,網(wǎng)絡(luò)出現(xiàn)擁塞丟包,就需要擁塞控制??刹捎肊CN、DCTCP等基于顯式擁塞標(biāo)記或者Timely、Swift等基于RTT往返時延的方法探測擁塞,讓上游節(jié)點直至發(fā)送端降低發(fā)包速率。好比沿著擁塞地點讓交警往回控制其他車輛停止通行或者繞道而行。
互聯(lián)網(wǎng)做QoS有兩大核心問題:缺少有界時延抖動的保證,以及難以應(yīng)對聚播和突發(fā)流量。
-
缺少有界時延抖動保證:由于是統(tǒng)計復(fù)用出端口帶寬資源,缺少時延維度的QoS保障機(jī)制,盡力而為轉(zhuǎn)發(fā)總是會存在排隊等待和擁塞的情況,業(yè)務(wù)時延在50ms-1s的量級,并存在長尾時延。
-
難以應(yīng)對聚播和突發(fā)流量:由于發(fā)端流量的大小和發(fā)包時間不可控,網(wǎng)絡(luò)中存在多條流在下游節(jié)點匯聚(Incast,聚播)以及某時刻流量激增(Burst,突發(fā))的現(xiàn)象,導(dǎo)致網(wǎng)絡(luò)擁塞丟包。
工業(yè)網(wǎng)絡(luò)怎么做QoS?
工業(yè)網(wǎng)絡(luò)對時延抖動的要求非常嚴(yán)格,往往要求端到端時延在幾毫秒甚至幾百微妙以內(nèi),以及微秒級甚至零抖動。比如離散自動化中的運(yùn)動控制,要求端到端時延控制在1ms以內(nèi),抖動在1us以內(nèi),且具有99.9999%的可靠性。
要達(dá)到如此高精度的傳輸控制,以時間觸發(fā)以太網(wǎng)為例,主要需要時鐘同步和時隙規(guī)劃這兩種技術(shù)。更多時隙規(guī)劃的技術(shù)細(xì)節(jié)可參考文章(一文讀懂時延敏感網(wǎng)絡(luò)的調(diào)度整形機(jī)制)
-
時鐘同步:即全網(wǎng)時鐘同步,終端設(shè)備、交換機(jī)的時鐘都相同,網(wǎng)卡也要給包打上硬時間戳。目前有兩種時鐘同步方式,一種是主從模式,選出一個最精準(zhǔn)的時鐘作為主時鐘,其他從時鐘都聽主時鐘的;一種是投票模式,比如一個域內(nèi)有9臺設(shè)備,5臺現(xiàn)在時鐘是1:00,4臺是1:01,少數(shù)服從多數(shù),就都調(diào)整為1:00。
-
時隙規(guī)劃:時隙一般是指交換機(jī)出端口的時間維度的傳輸資源。比如某交換機(jī)出端口帶寬1Gbps,也就是1s可以傳1G個bit,假設(shè)一個包有1500Byte,也就是12000bit, 那它的傳輸就占用出端口某一段12us的時隙資源。而占用哪一段,由它的傳輸開始時間決定。由于工業(yè)流量大多是周期性發(fā)送的小于MTU的包,所以可以控制終端的發(fā)包開始時間,通過全局時隙規(guī)劃(時分復(fù)用),讓各個包只在提前算好的時刻被“觸發(fā)”發(fā)送,保證其在每跳的出端口傳輸時占用的時隙互不沖突,從而避免了聚播和突發(fā)的產(chǎn)生,實現(xiàn)“準(zhǔn)時準(zhǔn)確”傳輸。
確定性網(wǎng)絡(luò)怎么實現(xiàn)?
確定性網(wǎng)絡(luò)技術(shù)不是單一技術(shù),而是一系列協(xié)議和機(jī)制的合集,通過網(wǎng)絡(luò)切片、顯性路由、資源預(yù)留、時鐘/頻率同步、周期映射、門控優(yōu)先級隊列調(diào)度、幀搶占、流量過濾和整形、多發(fā)選收等技術(shù)分別保障確定性帶寬、低時延、低抖動、高可靠等QoS指標(biāo)。
簡單的說,它既兼容了以太網(wǎng)這條大馬路,又借鑒了工業(yè)網(wǎng)絡(luò)里全網(wǎng)同步、時隙規(guī)劃、控制發(fā)包/邊緣的思想,就像網(wǎng)絡(luò)里的超級高鐵,首先定點發(fā)車,然后長距傳輸,專道不堵車,通過周期映射和周期規(guī)劃確定到站時間,并且每站定長??浚罱K保證端到端時延可預(yù)期。具體技術(shù)實現(xiàn)和挑戰(zhàn)留作下回分解。
三、未來展望
由于現(xiàn)網(wǎng)缺乏嚴(yán)格的有界時延抖動保障機(jī)制,建筑網(wǎng)絡(luò)高鐵是未來網(wǎng)絡(luò)發(fā)展的必然趨勢。舉個例子,若想在現(xiàn)網(wǎng)中獲得一條從北京到南京10ms時延的線路,首先測一下有3條路可以走,時延分別是50ms、100ms和200ms,達(dá)不到要求,再需要測沿路徑的鏈路帶寬使用情況、每跳的隊列長度和擁塞情況,然后通過一行行命令和ACL規(guī)則,去做優(yōu)先級映射、限速整形、隊列調(diào)度、擁塞控制、重路由,這當(dāng)中還可能存在規(guī)則錯配、影響其他業(yè)務(wù)QoS等問題,而當(dāng)終于配置好滿足10ms時延后,又有可能突然出現(xiàn)莫名的流聚合和突發(fā),時延陡然暴增至500ms,令網(wǎng)絡(luò)工程師通宵達(dá)旦、徹夜難眠。
而在不遠(yuǎn)的將來,可以預(yù)見確定性網(wǎng)絡(luò)技術(shù)趨于成熟,只需要幾分鐘的配置時間,便可以擁有一條從北京到南京、穩(wěn)定可靠的、端到端時延10ms的超級高鐵線路。
~END~
免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺僅提供信息存儲服務(wù)。文章僅代表作者個人觀點,不代表本平臺立場,如有問題,請聯(lián)系我們,謝謝!