當(dāng)前位置:首頁 > 技術(shù)學(xué)院 > 技術(shù)前線
[導(dǎo)讀]系統(tǒng)過載保護機制

最近我們組自己開發(fā)了一個過載保護服務(wù),用來解決服務(wù)或者站點過載導(dǎo)致系統(tǒng)雪崩的問題,最近看了下底層實現(xiàn),還是很有參考意義的,接下來介紹下過載保護的功能和原理。

一.過載保護的作用

我們這里開發(fā)的過載保護的主要目的是:避免服務(wù)中的某個接口調(diào)用堆積導(dǎo)致的整個服務(wù)不可用,這里調(diào)用堆積的原因可能有兩個

1.某個接口的訪問量突然增大,達到了平時高峰調(diào)用量的幾倍乃至幾十倍。產(chǎn)生的原因可能為產(chǎn)品加了個類似于秒殺活動的需求,在秒殺的一瞬間接口調(diào)用量激增。

2.由于某次上線對接口進行了改動,導(dǎo)致接口的執(zhí)行時間從之前的10ms變成了50ms,雖然50ms的執(zhí)行時間也算正常,但是如果某個調(diào)用方訪問當(dāng)前接口的量達到50次/秒,就會導(dǎo)致請求的堆積,因為當(dāng)前服務(wù)接口只能支持20次/秒的調(diào)用。

我們知道,接口的每次調(diào)用一般都會是一個線程來處理,如果某個接口的調(diào)用激增或者因耗時較長導(dǎo)致阻塞,就會產(chǎn)生堆積,導(dǎo)致其他接口的請求也會隨著堆積,影響了其他接口的正常調(diào)用,最后導(dǎo)致整個服務(wù)掛掉,這種情況是不可接受的。

舉個例子,現(xiàn)在有一個接口A在調(diào)用別人的服務(wù)A,這個服務(wù)A由于自身原因訪問全部超時了,那么這個接口A就會響應(yīng)超時,如果調(diào)用方大量調(diào)用這個接口A,就會產(chǎn)生請求堆積,這時即使我們接口B(調(diào)用了服務(wù)B)的狀態(tài)是正常的,也會受接口A超時的影響,最后導(dǎo)致整個服務(wù)不可用。

綜上,我們的過載保護系統(tǒng)就是為了防止某個服務(wù)掛掉或者大量超時產(chǎn)生請求堆積,影響整個系統(tǒng)的產(chǎn)物。這在我們的代理服務(wù)(封裝了大量別人的服務(wù))里顯得格外重要,因為代理服務(wù)里封裝了大量別人的服務(wù),不能因為某一個服務(wù)異常導(dǎo)致整個代理服務(wù)掛掉,影響了我們整個系統(tǒng)。

二.過載保護的實現(xiàn)原理

實現(xiàn)一個過載保護,主要是限制下當(dāng)前接口的調(diào)用次數(shù),即同一時刻,當(dāng)前接口最大調(diào)用次數(shù)為N(N為我們自己設(shè)置的值),保證接口在同一時刻最大調(diào)用次數(shù)不超過N來實現(xiàn)過載保護。比如接口A大量超時導(dǎo)致請求堆積,但是由于我們加了過載保護,那么同一時刻最多只會有N個請求調(diào)用接口A,其他的請求我們將它拋棄掉,從而達到保護整個系統(tǒng)的作用。下面簡單介紹下過載保護的實現(xiàn)原理

我們對加上了過載保護的接口都使用一個唯一標(biāo)識作為key,可以簡單理解為類名+方法名作為key(重載的先不考慮),這樣每個接口都有一個唯一的標(biāo)識,我們使用一個變量count記錄每個接口當(dāng)前調(diào)用次數(shù),和方法的唯一標(biāo)識存到Map中。每次調(diào)用這個接口的時候,我們執(zhí)行count+1,接口執(zhí)行完之后執(zhí)行count-1操作,以此來限制同一時刻當(dāng)前接口的最大調(diào)用次數(shù)。這里我們可以使用一個代理或者攔截器來實現(xiàn)過載保護的功能,我們組開發(fā)的過載保護使用的是攔截器方式(并不一定是最好的),在每個需要過載保護的接口調(diào)用前后加上一個攔截器,前置攔截器負(fù)責(zé)對當(dāng)前接口key的count+1,后置攔截器對count-1,實現(xiàn)原理其實就這么簡單。

如果當(dāng)前接口的調(diào)用次數(shù)超過最大調(diào)用次數(shù)(擴容之后的),那么在前置攔截器里直接拋出異常,超過過載保護限制,請求被拒絕。

具體實現(xiàn)上,我們使用了一個隊列來實現(xiàn)過載保護,每次前置攔截的時候,我們?nèi)腙犚粋€對象,對象包括當(dāng)前時間(用來做一些超時判斷),線程id等數(shù)據(jù),后置攔截的時候執(zhí)行出隊操作,以此來實現(xiàn)count+1,-1的功能。

三.需要關(guān)注的問題

1.需要支持自動擴容,加入當(dāng)前系統(tǒng)負(fù)載正常,各方面指標(biāo)也正常,由于重啟服務(wù)導(dǎo)致小量接口請求的堆積,而不是大量出現(xiàn)超時堆積的時候,我們應(yīng)該支持這部分小量堆積的調(diào)用,而不是超過一點就拋棄,這里可以使用自動擴容機制,當(dāng)發(fā)現(xiàn)請求數(shù)量達到最大限制N時,我們對N進行擴容,例如N*2,就可以處理那小部分對接的請求了,但是擴容需要有個上線,我們開發(fā)的是不能超過初始設(shè)置N的4倍,目前來看沒有攔截掉正常堆積的請求,當(dāng)出現(xiàn)大量超時時仍能起到過載保護的限制作用。

2.需要保證每個接口調(diào)用前"接口調(diào)用次數(shù)"+1,接口調(diào)用后"接口調(diào)用次數(shù)"-1的操作正確執(zhí)行,否則會導(dǎo)致資源被浪費,即當(dāng)前系統(tǒng)狀態(tài)應(yīng)該允許接口被執(zhí)行卻誤觸了過載保護機制,同時還要在丟棄前對count進行校驗,比如當(dāng)前count是否準(zhǔn)確,是否存在接口已經(jīng)執(zhí)行結(jié)束,但是count沒有-1的情況。

這就是我們?yōu)槭裁词褂藐犃械囊粋€原因之一,我們在每次丟棄請求之前,會校驗下隊列的頭節(jié)點是否有效,是否超時等操作,如果頭結(jié)點有異常,我們會丟棄頭結(jié)點,請求繼續(xù)入隊,這樣解決了如果有接口執(zhí)行完,卻沒有執(zhí)行出隊時候的問題。

3.此外,我們還做了一些系統(tǒng)監(jiān)控方面的工作,如果某個接口請求時間過長,我們會從隊里獲取線程id,打印出線程的信息到日志中。同時我們還監(jiān)控了CPU,內(nèi)存等核心數(shù)據(jù),當(dāng)發(fā)現(xiàn)CPU,內(nèi)存等資源緊張的時候,我們不允許自動擴容,從而保護我們的系統(tǒng)。

四.過載保護可能帶來的問題

性能消耗,前置后置攔截器,計數(shù),擴容等等系列操作,都會對系統(tǒng)性能有一定影響,目前我們壓測系統(tǒng)性能的時候發(fā)現(xiàn)過載保護會降低我們系統(tǒng)的性能瓶頸,去掉過載保護,qps還能增高不少。

總結(jié):過載保護在系統(tǒng)中扮演著重要的角色,過載保護并不能提升我們的系統(tǒng)性能,只是為我們系統(tǒng)做了一個保障,避免因為異常導(dǎo)致系統(tǒng)整體不可用,當(dāng)系統(tǒng)達到性能瓶頸時,拒絕一些請求從而保護我們的系統(tǒng)整體可用,是十分有必要的。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉