面試官:說一下限流、熔斷、高可用?好多人一臉懵!
限流思路
對系統(tǒng)服務(wù)進(jìn)行限流,一般有如下幾個(gè)模式:
熔斷
系統(tǒng)在設(shè)計(jì)之初就把熔斷措施考慮進(jìn)去。當(dāng)系統(tǒng)出現(xiàn)問題時(shí),如果短時(shí)間內(nèi)無法修復(fù),系統(tǒng)要自動做出判斷,開啟熔斷開關(guān),拒絕流量訪問,避免大流量對后端的過載請求。
服務(wù)降級
將系統(tǒng)的所有功能服務(wù)進(jìn)行一個(gè)分級,當(dāng)系統(tǒng)出現(xiàn)問題需要緊急限流時(shí),可將不是那么重要的功能進(jìn)行降級處理,停止服務(wù),這樣可以釋放出更多的資源供給核心功能的去用。
延遲處理
這個(gè)模式需要在系統(tǒng)的前端設(shè)置一個(gè)流量緩沖池,將所有的請求全部緩沖進(jìn)這個(gè)池子,不立即處理。然后后端真正的業(yè)務(wù)處理程序從這個(gè)池子中取出請求依次處理,常見的可以用隊(duì)列模式來實(shí)現(xiàn)。這就相當(dāng)于用異步的方式去減少了后端的處理壓力,但是當(dāng)流量較大時(shí),后端的處理能力有限,緩沖池里的請求可能處理不及時(shí),會有一定程度延遲。后面具體的漏桶算法以及令牌桶算法就是這個(gè)思路。
特權(quán)處理
這個(gè)模式需要將用戶進(jìn)行分類,通過預(yù)設(shè)的分類,讓系統(tǒng)優(yōu)先處理需要高保障的用戶群體,其它用戶群的請求就會延遲處理或者直接不處理。
緩存、降級、限流區(qū)別
緩存,是用來增加系統(tǒng)吞吐量,提升訪問速度提供高并發(fā)。
限流的算法
限流算法很多,常見的有三類,分別是計(jì)數(shù)器算法、漏桶算法、令牌桶算法,下面逐一講解。
計(jì)數(shù)器算法
簡單粗暴,比如指定線程池大小,指定數(shù)據(jù)庫連接池大小、nginx連接數(shù)等,這都屬于計(jì)數(shù)器算法。
漏桶算法
漏桶算法思路很簡單,水(請求)先進(jìn)入到漏桶里,漏桶以一定的速度出水,當(dāng)水流入速度過大會超過桶可接納的容量時(shí)直接溢出,可以看出漏桶算法能強(qiáng)行限制數(shù)據(jù)的傳輸速率。
削峰:有大量流量進(jìn)入時(shí),會發(fā)生溢出,從而限流保護(hù)服務(wù)可用
令牌桶算法
令牌桶與漏桶相似,不同的是令牌桶桶中放了一些令牌,服務(wù)請求到達(dá)后,要獲取令牌之后才會得到服務(wù),舉個(gè)例子,我們平時(shí)去食堂吃飯,都是在食堂內(nèi)窗口前排隊(duì)的,這就好比是漏桶算法,大量的人員聚集在食堂內(nèi)窗口外,以一定的速度享受服務(wù),如果涌進(jìn)來的人太多,食堂裝不下了,可能就有一部分人站到食堂外了,這就沒有享受到食堂的服務(wù),稱之為溢出,溢出可以繼續(xù)請求,也就是繼續(xù)排隊(duì),那么這樣有什么問題呢?
并發(fā)限流
簡單來說就是設(shè)置系統(tǒng)閾值總的QPS個(gè)數(shù),這些也挺常見的,就拿Tomcat來說,很多參數(shù)就是出于這個(gè)考慮,例如
- 限制總并發(fā)數(shù)(如數(shù)據(jù)庫連接池、線程池)
- 限制瞬時(shí)并發(fā)數(shù)(nginx的limit_conn模塊,用來限制瞬時(shí)并發(fā)連接數(shù))
- 限制時(shí)間窗口內(nèi)的平均速率(如Guava的RateLimiter、nginx的limit_req模塊,限制每秒的平均速率)
- 其他的還有限制遠(yuǎn)程接口調(diào)用速率、限制MQ的消費(fèi)速率。
- 另外還可以根據(jù)網(wǎng)絡(luò)連接數(shù)、網(wǎng)絡(luò)流量、CPU或內(nèi)存負(fù)載等來限流。
接口限流
接口限流分為兩個(gè)部分,一是限制一段時(shí)間內(nèi)接口調(diào)用次數(shù),參照前面限流算法的計(jì)數(shù)器算法, 二是設(shè)置滑動時(shí)間窗口算法。
接口總數(shù)
控制一段時(shí)間內(nèi)接口被調(diào)用的總數(shù)量,可以參考前面的計(jì)數(shù)器算法,不再贅述。
接口時(shí)間窗口
固定時(shí)間窗口算法(也就是前面提到的計(jì)數(shù)器算法)的問題是統(tǒng)計(jì)區(qū)間太大,限流不夠精確,而且在第二個(gè)統(tǒng)計(jì)區(qū)間 時(shí)沒有考慮與前一個(gè)統(tǒng)計(jì)區(qū)間的關(guān)系與影響(第一個(gè)區(qū)間后半段 第二個(gè)區(qū)間前半段也是一分鐘)。為了解決上面我們提到的臨界問題,我們試圖把每個(gè)統(tǒng)計(jì)區(qū)間分為更小的統(tǒng)計(jì)區(qū)間,更精確的統(tǒng)計(jì)計(jì)數(shù)。
在上面的例子中,假設(shè)QPS可以接受100次查詢/秒, 前一分鐘前40秒訪問很低,后20秒突增,并且這個(gè)持續(xù)了一段時(shí)間,直到第二分鐘的第40秒才開始降下來,根據(jù)前面的計(jì)數(shù)方法,前一秒的QPS為94,后一秒的QPS為92,那么沒有超過設(shè)定參數(shù),但是!但是在中間區(qū)域,QPS達(dá)到了142,這明顯超過了我們的允許的服務(wù)請求數(shù)目,所以固定窗口計(jì)數(shù)器不太可靠,需要滑動窗口計(jì)數(shù)器。
限流實(shí)現(xiàn)
這一部分是限流的具體實(shí)現(xiàn),簡單說說,畢竟長篇代碼沒人愿意看。
guava實(shí)現(xiàn)
引入包
<dependency>
<groupId>com.google.guava