你知道什么是容災嗎?
時間:2021-11-12 14:14:55
手機看文章
掃描二維碼
隨時隨地手機看文章
[導讀]你有沒有好奇過,如果發(fā)生地震或其他自然災害,你在某家銀行的賬戶信息是否會丟失?你存在銀行的錢還在嗎?其實,這并不用我們操心。銀行的用戶信息是非常重要的數(shù)據(jù),因此銀行開設之前必須擁有一套完整的容災解決方案來解決這類問題,即建立容災系統(tǒng)。所謂容災系統(tǒng),字面理解就是指容忍災難的系統(tǒng)。有...
你有沒有好奇過,如果發(fā)生地震或其他自然災害,你在某家銀行的賬戶信息是否會丟失?你存在銀行的錢還在嗎?
其實,這并不用我們操心。銀行的用戶信息是非常重要的數(shù)據(jù),因此銀行開設之前必須擁有一套完整的容災解決方案來解決這類問題,即建立容災系統(tǒng)。
所謂容災系統(tǒng),字面理解就是指容忍災難的系統(tǒng)。有了這個系統(tǒng),哪怕是災難來襲,銀行里的用戶數(shù)據(jù)也可以安然自若。這個災難,大到自然災害,小到物理故障。為了保證數(shù)據(jù)的安全性和業(yè)務的可靠性,每家銀行會在國內(nèi)多個地區(qū)建立一個或幾個容災站點,互相之間備份數(shù)據(jù),相當于創(chuàng)造幾個“副本”。
當主用站點遭遇災難破壞,導致數(shù)據(jù)發(fā)生永久性丟失時,就可憑借容災站點的“副本”,實現(xiàn)數(shù)據(jù)恢復。如果沒有容災站點的數(shù)據(jù)備份,將會造成不可估量的經(jīng)濟損失和惡劣的社會影響。
銀行有容災系統(tǒng),通信有沒有容災系統(tǒng)呢?答案是肯定的。每個運營商都制定了一套完整嚴密的容災解決方案,來保障所有用戶的通信數(shù)據(jù),包括你的話費余額!
無論是3G、4G還是5G,每個運營商都為本地區(qū)的通信業(yè)務建立了容災局點。容災局點除了能保證各類數(shù)據(jù)的可靠,更能夠保證業(yè)務的可用性。這才是建立容災系統(tǒng)最重要的意義。
以5GC為例,與金融系統(tǒng)類似,5GC也采用跨地域的異地容災部署方式。在兩個不同的地區(qū)分別部署數(shù)據(jù)中心(DC,Data Center),當某地DC中的網(wǎng)絡設備由于某種原因不可用時,由另一地DC迅速接管業(yè)務,從而保障5G業(yè)務的可用性。這就是雙DC部署。雙DC部署是實現(xiàn)部署可靠性的一種方式。
除了雙DC部署,5GC容災解決方案還提供哪些措施實現(xiàn)容災呢?部署可靠性
5GC容災解決方案支持雙DC部署、互斥部署、NF(Network Function?網(wǎng)絡功能)分域部署、網(wǎng)絡雙平面等方式實現(xiàn)部署可靠性。??互斥部署是指將虛機部署在不同的物理機上,從而保證當某個物理機出現(xiàn)異常時,其他虛機仍能夠提供服務。簡而言之就是“雞蛋不要放在一個籃子里”。??NF分域部署是指NF部署采用管理域、業(yè)務域、轉(zhuǎn)發(fā)域分離的方式進行。??網(wǎng)絡雙平面是指5GC NF所有邏輯網(wǎng)絡接口,都至少有2個不同的物理網(wǎng)絡平面互為備份。當其中一個網(wǎng)絡平面發(fā)生故障時,另一個網(wǎng)絡平面能夠接管所有的網(wǎng)絡流量,保證業(yè)務不中斷。
架構(gòu)可靠性? ?5GC容災解決方案支持負荷分擔和無狀態(tài)特性等方式,從而實現(xiàn)架構(gòu)可靠性。??負荷分擔是指,所有運行實例共同分擔處理業(yè)務。當部分運行實例異常宕機時,由其余運行正常的實例共同分擔處理業(yè)務,從而保證業(yè)務正常運行。負荷分擔采用N M冗余方式,即當N個實例可以滿足系統(tǒng)容量的業(yè)務處理時,再提供M個實例用于冗余。??
上圖是典型的3 1冗余方式,當3個實例可以滿足系統(tǒng)容量的業(yè)務處理時,再提供1個實例用于冗余。當任何1個運行實例故障時,其他3個運行實例繼續(xù)工作,從而保證系統(tǒng)容量及業(yè)務處理不受影響。
無狀態(tài)是指微服務的無狀態(tài)設計。3GPP 定義了UDSF(Unstructured Data Storage Function,非結(jié)構(gòu)化數(shù)據(jù)存儲功能)用于統(tǒng)一存儲NF的狀態(tài)數(shù)據(jù)(又稱為非結(jié)構(gòu)化數(shù)據(jù),例如移動數(shù)據(jù)等等)。
業(yè)務邏輯APP隨時可以執(zhí)行彈性、擴容、銷毀、重生、遷移操作,這便是計算與存儲分離。無狀態(tài)設計在實現(xiàn)架構(gòu)可靠性的同時,也保障了數(shù)據(jù)可靠性。數(shù)據(jù)可靠性綠樹成蔭5GC的NF按無狀態(tài)設計,在當前處理流程完成后,將用戶及會話上下文等狀態(tài)數(shù)據(jù)保存在UDSF中,由UDSF對數(shù)據(jù)進行多副本保存。UDSF支持1 1冗余、雙DC部署的容災方式,從而保證數(shù)據(jù)可靠性。??資源可靠性
5GC容災解決方案支持鏈路檢測、自愈等機制實現(xiàn)資源可靠性。??自愈是指:對于持續(xù)出現(xiàn)故障的業(yè)務處理節(jié)點,系統(tǒng)會進行節(jié)點的多級自愈。根據(jù)用戶的自愈策略配置,系統(tǒng)依次采用重啟容器、重推容器、重啟虛機、重建虛機逐級上升的策略進行自愈,從而盡快恢復業(yè)務。
鏈路檢測是指:業(yè)務節(jié)點會定時發(fā)送心跳保活報文給管理節(jié)點,管理節(jié)點檢測出長時間未發(fā)心跳的節(jié)點,則判定為故障節(jié)點,從而觸發(fā)業(yè)務遷移流程,把故障節(jié)點的業(yè)務遷移到其他正常節(jié)點,從而保證業(yè)務的可靠性。
好了,話說到這里,你再也不用擔心你的話費余額了吧,更不用擔心存在銀行的money了吧!你也知道什么是容災了吧。
我們是一群平均從業(yè)年限5 的通信專業(yè)工程師。關(guān)注我們,帶你了解通信世界的精彩!
其實,這并不用我們操心。銀行的用戶信息是非常重要的數(shù)據(jù),因此銀行開設之前必須擁有一套完整的容災解決方案來解決這類問題,即建立容災系統(tǒng)。
所謂容災系統(tǒng),字面理解就是指容忍災難的系統(tǒng)。有了這個系統(tǒng),哪怕是災難來襲,銀行里的用戶數(shù)據(jù)也可以安然自若。這個災難,大到自然災害,小到物理故障。為了保證數(shù)據(jù)的安全性和業(yè)務的可靠性,每家銀行會在國內(nèi)多個地區(qū)建立一個或幾個容災站點,互相之間備份數(shù)據(jù),相當于創(chuàng)造幾個“副本”。
當主用站點遭遇災難破壞,導致數(shù)據(jù)發(fā)生永久性丟失時,就可憑借容災站點的“副本”,實現(xiàn)數(shù)據(jù)恢復。如果沒有容災站點的數(shù)據(jù)備份,將會造成不可估量的經(jīng)濟損失和惡劣的社會影響。
銀行有容災系統(tǒng),通信有沒有容災系統(tǒng)呢?答案是肯定的。每個運營商都制定了一套完整嚴密的容災解決方案,來保障所有用戶的通信數(shù)據(jù),包括你的話費余額!
無論是3G、4G還是5G,每個運營商都為本地區(qū)的通信業(yè)務建立了容災局點。容災局點除了能保證各類數(shù)據(jù)的可靠,更能夠保證業(yè)務的可用性。這才是建立容災系統(tǒng)最重要的意義。
以5GC為例,與金融系統(tǒng)類似,5GC也采用跨地域的異地容災部署方式。在兩個不同的地區(qū)分別部署數(shù)據(jù)中心(DC,Data Center),當某地DC中的網(wǎng)絡設備由于某種原因不可用時,由另一地DC迅速接管業(yè)務,從而保障5G業(yè)務的可用性。這就是雙DC部署。雙DC部署是實現(xiàn)部署可靠性的一種方式。
除了雙DC部署,5GC容災解決方案還提供哪些措施實現(xiàn)容災呢?部署可靠性
5GC容災解決方案支持雙DC部署、互斥部署、NF(Network Function?網(wǎng)絡功能)分域部署、網(wǎng)絡雙平面等方式實現(xiàn)部署可靠性。??互斥部署是指將虛機部署在不同的物理機上,從而保證當某個物理機出現(xiàn)異常時,其他虛機仍能夠提供服務。簡而言之就是“雞蛋不要放在一個籃子里”。??NF分域部署是指NF部署采用管理域、業(yè)務域、轉(zhuǎn)發(fā)域分離的方式進行。??網(wǎng)絡雙平面是指5GC NF所有邏輯網(wǎng)絡接口,都至少有2個不同的物理網(wǎng)絡平面互為備份。當其中一個網(wǎng)絡平面發(fā)生故障時,另一個網(wǎng)絡平面能夠接管所有的網(wǎng)絡流量,保證業(yè)務不中斷。
架構(gòu)可靠性? ?5GC容災解決方案支持負荷分擔和無狀態(tài)特性等方式,從而實現(xiàn)架構(gòu)可靠性。??負荷分擔是指,所有運行實例共同分擔處理業(yè)務。當部分運行實例異常宕機時,由其余運行正常的實例共同分擔處理業(yè)務,從而保證業(yè)務正常運行。負荷分擔采用N M冗余方式,即當N個實例可以滿足系統(tǒng)容量的業(yè)務處理時,再提供M個實例用于冗余。??
上圖是典型的3 1冗余方式,當3個實例可以滿足系統(tǒng)容量的業(yè)務處理時,再提供1個實例用于冗余。當任何1個運行實例故障時,其他3個運行實例繼續(xù)工作,從而保證系統(tǒng)容量及業(yè)務處理不受影響。
無狀態(tài)是指微服務的無狀態(tài)設計。3GPP 定義了UDSF(Unstructured Data Storage Function,非結(jié)構(gòu)化數(shù)據(jù)存儲功能)用于統(tǒng)一存儲NF的狀態(tài)數(shù)據(jù)(又稱為非結(jié)構(gòu)化數(shù)據(jù),例如移動數(shù)據(jù)等等)。
業(yè)務邏輯APP隨時可以執(zhí)行彈性、擴容、銷毀、重生、遷移操作,這便是計算與存儲分離。無狀態(tài)設計在實現(xiàn)架構(gòu)可靠性的同時,也保障了數(shù)據(jù)可靠性。數(shù)據(jù)可靠性綠樹成蔭5GC的NF按無狀態(tài)設計,在當前處理流程完成后,將用戶及會話上下文等狀態(tài)數(shù)據(jù)保存在UDSF中,由UDSF對數(shù)據(jù)進行多副本保存。UDSF支持1 1冗余、雙DC部署的容災方式,從而保證數(shù)據(jù)可靠性。??資源可靠性
5GC容災解決方案支持鏈路檢測、自愈等機制實現(xiàn)資源可靠性。??自愈是指:對于持續(xù)出現(xiàn)故障的業(yè)務處理節(jié)點,系統(tǒng)會進行節(jié)點的多級自愈。根據(jù)用戶的自愈策略配置,系統(tǒng)依次采用重啟容器、重推容器、重啟虛機、重建虛機逐級上升的策略進行自愈,從而盡快恢復業(yè)務。
鏈路檢測是指:業(yè)務節(jié)點會定時發(fā)送心跳保活報文給管理節(jié)點,管理節(jié)點檢測出長時間未發(fā)心跳的節(jié)點,則判定為故障節(jié)點,從而觸發(fā)業(yè)務遷移流程,把故障節(jié)點的業(yè)務遷移到其他正常節(jié)點,從而保證業(yè)務的可靠性。
好了,話說到這里,你再也不用擔心你的話費余額了吧,更不用擔心存在銀行的money了吧!你也知道什么是容災了吧。
我們是一群平均從業(yè)年限5 的通信專業(yè)工程師。關(guān)注我們,帶你了解通信世界的精彩!