當(dāng)前位置:首頁 > 公眾號(hào)精選 > 架構(gòu)師社區(qū)
[導(dǎo)讀]我在研究HikariCP(一個(gè)數(shù)據(jù)庫連接池)時(shí)無意間在HikariCP的Github wiki上看到了一篇文章(即前面給出的鏈接),這篇文章有力地消除了我一直以來的疑慮,看完之后感覺神清氣爽。

我在研究HikariCP(一個(gè)數(shù)據(jù)庫連接池)時(shí)無意間在HikariCP的Github wiki上看到了一篇文章(即前面給出的鏈接),這篇文章有力地消除了我一直以來的疑慮,看完之后感覺神清氣爽。故在此做譯文分享。

接下來是正文

數(shù)據(jù)庫連接池的配置是開發(fā)者們常常搞出坑的地方,在配置數(shù)據(jù)庫連接池時(shí),有幾個(gè)可以說是和直覺背道而馳的原則需要明確。

1萬并發(fā)用戶訪問

想象你有一個(gè)網(wǎng)站,壓力雖然還沒到Facebook那個(gè)級(jí)別,但也有個(gè)1萬上下的并發(fā)訪問——也就是說差不多2萬左右的TPS。那么這個(gè)網(wǎng)站的數(shù)據(jù)庫連接池應(yīng)該設(shè)置成多大呢?結(jié)果可能會(huì)讓你驚訝,因?yàn)檫@個(gè)問題的正確問法是:

  • “這個(gè)網(wǎng)站的數(shù)據(jù)庫連接池應(yīng)該設(shè)置成多 呢?”

下面這個(gè)視頻是Oracle Real World Performance Group發(fā)布的,請(qǐng)先看完:
http://www.dailymotion.com/video/x2s8uec

(因?yàn)檫@視頻是英文解說且沒有字幕,我替大家做一下簡(jiǎn)單的概括:)
視頻中對(duì)Oracle數(shù)據(jù)庫進(jìn)行壓力測(cè)試,9600并發(fā)線程進(jìn)行數(shù)據(jù)庫操作,每?jī)纱卧L問數(shù)據(jù)庫的操作之間sleep 550ms,一開始設(shè)置的中間件線程池大小為2048:

數(shù)據(jù)庫連接池到底應(yīng)該設(shè)多大?這次直接從100ms優(yōu)化到3ms!

初始的配置

壓測(cè)跑起來之后是這個(gè)樣子的:

數(shù)據(jù)庫連接池到底應(yīng)該設(shè)多大?這次直接從100ms優(yōu)化到3ms!

2048連接時(shí)的性能數(shù)據(jù)

每個(gè)請(qǐng)求要在連接池隊(duì)列里等待33ms,獲得連接后執(zhí)行SQL需要77ms

此時(shí)數(shù)據(jù)庫的等待事件是這個(gè)熊樣的:

數(shù)據(jù)庫連接池到底應(yīng)該設(shè)多大?這次直接從100ms優(yōu)化到3ms!

各種buffer busy waits

各種buffer busy waits,數(shù)據(jù)庫CPU在95%左右(這張圖里沒截到CPU)

接下來,把中間件連接池減到1024(并發(fā)什么的都不變),性能數(shù)據(jù)變成了這樣:

數(shù)據(jù)庫連接池到底應(yīng)該設(shè)多大?這次直接從100ms優(yōu)化到3ms!

連接池降到1024后

獲取鏈接等待時(shí)長(zhǎng)沒怎么變,但是執(zhí)行SQL的耗時(shí)減少了。
下面這張圖,上半部分是wait,下半部分是吞吐量

數(shù)據(jù)庫連接池到底應(yīng)該設(shè)多大?這次直接從100ms優(yōu)化到3ms!

wait和吞吐量

能看到,中間件連接池從2048減半之后,吐吞量沒變,但wait事件減少了一半。

接下來,把數(shù)據(jù)庫連接池減到96,并發(fā)線程數(shù)仍然是9600不變。

數(shù)據(jù)庫連接池到底應(yīng)該設(shè)多大?這次直接從100ms優(yōu)化到3ms!

96個(gè)連接時(shí)的性能數(shù)據(jù)

隊(duì)列平均等待1ms,執(zhí)行SQL平均耗時(shí)2ms。

數(shù)據(jù)庫連接池到底應(yīng)該設(shè)多大?這次直接從100ms優(yōu)化到3ms!


wait事件幾乎沒了,吞吐量上升。

沒有調(diào)整任何其他東西,僅僅只是縮小了中間件層的數(shù)據(jù)庫連接池,就把請(qǐng)求響應(yīng)時(shí)間從100ms左右縮短到了3ms。

But why?

為什么nginx只用4個(gè)線程發(fā)揮出的性能就大大超越了100個(gè)進(jìn)程的Apache HTTPD?回想一下計(jì)算機(jī)科學(xué)的基礎(chǔ)知識(shí),答案其實(shí)是很明顯的。

即使是單核CPU的計(jì)算機(jī)也能“同時(shí)”運(yùn)行數(shù)百個(gè)線程。但我們都[應(yīng)該]知道這只不過是操作系統(tǒng)用時(shí)間分片玩的一個(gè)小把戲。一顆CPU核心同一時(shí)刻只能執(zhí)行一個(gè)線程,然后操作系統(tǒng)切換上下文,核心開始執(zhí)行另一個(gè)線程的代碼,以此類推。給定一顆CPU核心,其順序執(zhí)行AB永遠(yuǎn)比通過時(shí)間分片“同時(shí)”執(zhí)行AB要快,這是一條計(jì)算機(jī)科學(xué)的基本法則。一旦線程的數(shù)量超過了CPU核心的數(shù)量,再增加線程數(shù)系統(tǒng)就只會(huì)更慢,而不是更快。

幾乎就是真理了……

有限的資源

上面的說法只能說是接近真理,但還并沒有這么簡(jiǎn)單,有一些其他的因素需要加入。當(dāng)我們尋找數(shù)據(jù)庫的性能瓶頸時(shí),總是可以將其歸為三類:CPU、磁盤、網(wǎng)絡(luò)。把內(nèi)存加進(jìn)來也沒有錯(cuò),但比起磁盤網(wǎng)絡(luò),內(nèi)存的帶寬要高出好幾個(gè)數(shù)量級(jí),所以就先不加了。

如果我們無視磁盤網(wǎng)絡(luò),那么結(jié)論就非常簡(jiǎn)單。在一個(gè)8核的服務(wù)器上,設(shè)定連接/線程數(shù)為8能夠提供最優(yōu)的性能,再增加連接數(shù)就會(huì)因上下文切換的損耗導(dǎo)致性能下降。

數(shù)據(jù)庫通常把數(shù)據(jù)存儲(chǔ)在磁盤上,磁盤又通常是由一些旋轉(zhuǎn)著的金屬碟片和一個(gè)裝在步進(jìn)馬達(dá)上的讀寫頭組成的。讀/寫頭同一時(shí)刻只能出現(xiàn)在一個(gè)地方,然后它必須“尋址”到另外一個(gè)位置來執(zhí)行另一次讀寫操作。所以就有了尋址的耗時(shí),此外還有旋回耗時(shí),讀寫頭需要等待碟片上的目標(biāo)數(shù)據(jù)“旋轉(zhuǎn)到位”才能進(jìn)行操作。使用緩存當(dāng)然是能夠提升性能的,但上述原理仍然成立。

在這一時(shí)間段(即"I/O等待")內(nèi),線程是在“阻塞”著等待磁盤,此時(shí)操作系統(tǒng)可以將那個(gè)空閑的CPU核心用于服務(wù)其他線程。所以,由于線程總是在I/O上阻塞,我們可以讓線程/連接數(shù)比CPU核心多一些,這樣能夠在同樣的時(shí)間內(nèi)完成更多的工作。

那么應(yīng)該多多少呢?這要取決于磁盤。較新型的SSD不需要尋址,也沒有旋轉(zhuǎn)的碟片??蓜e想當(dāng)然地認(rèn)為“SSD速度更快,所以我們應(yīng)該增加線程數(shù)”,恰恰相反,無需尋址和沒有旋回耗時(shí)意味著更少的阻塞,所以更少的線程[更接近于CPU核心數(shù)]會(huì)發(fā)揮出更高的性能。只有當(dāng)阻塞創(chuàng)造了更多的執(zhí)行機(jī)會(huì)時(shí),更多的線程數(shù)才能發(fā)揮出更好的性能

網(wǎng)絡(luò)磁盤類似。通過以太網(wǎng)接口讀寫數(shù)據(jù)時(shí)也會(huì)形成阻塞,10G帶寬會(huì)比1G帶寬的阻塞少一些,1G帶寬又會(huì)比100M帶寬的阻塞少一些。不過網(wǎng)絡(luò)通常是放在第三位考慮的,有些人會(huì)在性能計(jì)算中忽略它們。

數(shù)據(jù)庫連接池到底應(yīng)該設(shè)多大?這次直接從100ms優(yōu)化到3ms!

上圖是PostgreSQL的benchmark數(shù)據(jù),可以看到TPS增長(zhǎng)率從50個(gè)連接數(shù)開始變緩。在上面Oracle的視頻中,他們把連接數(shù)從2048降到了96,實(shí)際上96都太高了,除非服務(wù)器有16或32顆核心。

計(jì)算公式

下面的公式是由PostgreSQL提供的,不過我們認(rèn)為可以廣泛地應(yīng)用于大多數(shù)數(shù)據(jù)庫產(chǎn)品。你應(yīng)該模擬預(yù)期的訪問量,并從這一公式開始測(cè)試你的應(yīng)用,尋找最合適的連接數(shù)值。

連接數(shù) = ((核心數(shù) * 2) + 有效磁盤數(shù))

核心數(shù)不應(yīng)包含超線程(hyper thread),即使打開了hyperthreading也是。如果活躍數(shù)據(jù)全部被緩存了,那么有效磁盤數(shù)是0,隨著緩存命中率的下降,有效磁盤數(shù)逐漸趨近于實(shí)際的磁盤數(shù)。這一公式作用于SSD時(shí)的效果如何尚未有分析。

按這個(gè)公式,你的4核i7數(shù)據(jù)庫服務(wù)器的連接池大小應(yīng)該為((4 * 2) + 1) = 9。取個(gè)整就算是是10吧。是不是覺得太小了?跑個(gè)性能測(cè)試試一下,我們保證它能輕松搞定3000用戶以6000TPS的速率并發(fā)執(zhí)行簡(jiǎn)單查詢的場(chǎng)景。如果連接池大小超過10,你會(huì)看到響應(yīng)時(shí)長(zhǎng)開始增加,TPS開始下降。

筆者注:
這一公式其實(shí)不僅適用于數(shù)據(jù)庫連接池的計(jì)算,大部分涉及計(jì)算和I/O的程序,線程數(shù)的設(shè)置都可以參考這一公式。我之前在對(duì)一個(gè)使用Netty編寫的消息收發(fā)服務(wù)進(jìn)行壓力測(cè)試時(shí),最終測(cè)出的最佳線程數(shù)就剛好是CPU核心數(shù)的一倍。

公理:你需要一個(gè)小連接池,和一個(gè)充滿了等待連接的線程的隊(duì)列

如果你有10000個(gè)并發(fā)用戶,設(shè)置一個(gè)10000的連接池基本等于失了智。1000仍然很恐怖。即是100也太多了。你需要一個(gè)10來個(gè)連接的小連接池,然后讓剩下的業(yè)務(wù)線程都在隊(duì)列里等待。連接池中的連接數(shù)量應(yīng)該等于你的數(shù)據(jù)庫能夠有效同時(shí)進(jìn)行的查詢?nèi)蝿?wù)數(shù)(通常不會(huì)高于2*CPU核心數(shù))。

我們經(jīng)常見到一些小規(guī)模的web應(yīng)用,應(yīng)付著大約十來個(gè)的并發(fā)用戶,卻使用著一個(gè)100連接數(shù)的連接池。這會(huì)對(duì)你的數(shù)據(jù)庫造成極其不必要的負(fù)擔(dān)。

請(qǐng)注意

連接池的大小最終與系統(tǒng)特性相關(guān)。

比如一個(gè)混合了長(zhǎng)事務(wù)和短事務(wù)的系統(tǒng),通常是任何連接池都難以進(jìn)行調(diào)優(yōu)的。最好的辦法是創(chuàng)建兩個(gè)連接池,一個(gè)服務(wù)于長(zhǎng)事務(wù),一個(gè)服務(wù)于短事務(wù)。

再例如一個(gè)系統(tǒng)執(zhí)行一個(gè)任務(wù)隊(duì)列,只允許一定數(shù)量的任務(wù)同時(shí)執(zhí)行,此時(shí)并發(fā)任務(wù)數(shù)應(yīng)該去適應(yīng)連接池連接數(shù),而不是反過來。


免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。文章僅代表作者個(gè)人觀點(diǎn),不代表本平臺(tái)立場(chǎng),如有問題,請(qǐng)聯(lián)系我們,謝謝!

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉