10個(gè)關(guān)鍵的MySQL性能優(yōu)化技巧
與所有的關(guān)系型數(shù)據(jù)庫(kù)一樣,MySQL仿佛是一頭讓人難以琢磨的怪獸。它會(huì)隨時(shí)停擺,讓應(yīng)用限于停滯,或者讓你的業(yè)務(wù)處于危險(xiǎn)之中。
事實(shí)上,許多最常見的錯(cuò)誤都隱藏在MySQL性能問題的背后。為了確保你的MySQL服務(wù)器能夠一直處于全速運(yùn)行的狀態(tài),提供持續(xù)穩(wěn)定的性能,杜絕這些錯(cuò)誤是非常重要的。然而,這些錯(cuò)誤又往往隱藏在工作負(fù)載和配置問題之中。幸運(yùn)的是,許多MySQL性能問題都有著相似的解決方案,這使得排除故障與調(diào)整MySQL成為了一項(xiàng)易于管理的任務(wù)。以下就是10個(gè)讓MySQL發(fā)揮最佳性能的技巧。1.分析工作負(fù)載通過(guò)分析工作負(fù)載,你能夠發(fā)現(xiàn)進(jìn)一步調(diào)整中最昂貴的查詢。在這種情況下,時(shí)間是最重要的東西。因?yàn)楫?dāng)你向服務(wù)器發(fā)出查詢指令時(shí),除了如何快速完成查詢外,你很少關(guān)注其他的東西。分析工作負(fù)載的最佳方式是,使用諸如MySQL Enterprise Monitor的查詢分析器,或者Percona Toolkit的pt-query-digest等工具。這些工具能夠捕捉服務(wù)器所執(zhí)行的查詢,以降序的方式根據(jù)響應(yīng)時(shí)間列出任務(wù)列表。它們會(huì)將最昂貴的和最耗時(shí)的任務(wù)置頂,這樣你就能知道自己需要重點(diǎn)關(guān)注哪些地方。工作負(fù)載分析工具將相似的查詢匯聚在一行中,允許管理者查看速度慢的查詢,以及查看速度快但已多次執(zhí)行的查詢。2.理解四個(gè)基本資源功能性方面,一個(gè)數(shù)據(jù)庫(kù)服務(wù)器需要四個(gè)基本資源:CPU、內(nèi)存、硬盤和網(wǎng)絡(luò)。如果這四個(gè)資源中任何一個(gè)性能弱、不穩(wěn)定或超負(fù)載工作,那么就可能導(dǎo)致整個(gè)數(shù)據(jù)庫(kù)服務(wù)器的性能低下。理解基本資源在兩個(gè)特定的領(lǐng)域中至關(guān)重要:選擇硬件和排除故障。在為MySQL選擇硬件時(shí),應(yīng)該確保全部選用性能優(yōu)異的組件。這些組件相互匹配,彼此間能夠?qū)崿F(xiàn)合理平衡也很重要。通常情況下,企業(yè)會(huì)為服務(wù)器選擇速度快的CPU和硬盤,但是內(nèi)存卻嚴(yán)重不足。在一些案例中,大幅提升性能的最廉價(jià)方式是增加內(nèi)存,尤其是對(duì)于那些受制于磁盤讀取速度的工作負(fù)載。這似乎看起來(lái)有點(diǎn)違背常理,但是在許多案例中,由于沒有充足的內(nèi)存以保存服務(wù)器正在使用的數(shù)據(jù),因此導(dǎo)致了硬盤被過(guò)度使用。關(guān)于獲取這種平衡的另一個(gè)例子是CPU。在許多案例中,如果CPU速度快,那么MySQL的性能就非常出色,因?yàn)槊恳粋€(gè)查詢都是單線程運(yùn)行,而無(wú)法在CPU間并行運(yùn)行。在進(jìn)行故障排除時(shí),應(yīng)該檢查這四個(gè)資源的性能和使用情況,關(guān)注它們是否性能低下或是超負(fù)荷工作。這方面的知識(shí)能夠幫助你快速地解決問題。3.不要將MySQL作為隊(duì)列使用隊(duì)列以及與隊(duì)列相似的訪問方案會(huì)在你不知情的情況下悄悄地進(jìn)入應(yīng)用之中。例如,你設(shè)置了一個(gè)項(xiàng)目狀態(tài),以便在執(zhí)行前,特定的Worker Process(工作進(jìn)程)能夠?qū)ζ溥M(jìn)行標(biāo)記,那么你就等于在無(wú)意間創(chuàng)建了一個(gè)隊(duì)列。例如,將電子郵件標(biāo)記為未發(fā)送,然后發(fā)送它們,最后再將它們標(biāo)記為已發(fā)送。隊(duì)列會(huì)導(dǎo)致出現(xiàn)一些問題,這里面有兩大主要原因:它們對(duì)工作負(fù)載進(jìn)行了序列化,阻礙任務(wù)被并行處理。這導(dǎo)致正在處理中的任務(wù)和以前在工作中處理過(guò)的歷史數(shù)據(jù)會(huì)被根據(jù)序列排列在一個(gè)表單中。這樣一來(lái)既增加了應(yīng)用的延時(shí),也增加了MySQL的負(fù)載。4.以最廉價(jià)的方式過(guò)濾結(jié)果優(yōu)化MySQL的最佳方式是首先要做廉價(jià)和不精確的工作,然后再小規(guī)模地做困難的精確工作,最后再生成數(shù)據(jù)集。例如,假設(shè)你計(jì)算某一個(gè)地理坐標(biāo)點(diǎn)給定半徑內(nèi)的面積。在許多程序員的工具箱里第一個(gè)工具就是球面半正矢公式,以計(jì)算出球面的長(zhǎng)度。這一方法的問題是,該方程式需要許多三角函數(shù)運(yùn)算,需要擁有很強(qiáng)運(yùn)算能力的CPU。球面半正矢計(jì)算不僅運(yùn)行速度慢,而且會(huì)導(dǎo)致機(jī)器CPU的使用率飆升。在使用球面半正矢公式前,你可以先分解計(jì)算。有些分解計(jì)算并不需要使用三角函數(shù)。5.弄清兩個(gè)擴(kuò)展性死亡陷阱擴(kuò)展性可能并不像你認(rèn)為的那樣模糊。實(shí)際上,擴(kuò)展性有著精確的數(shù)學(xué)定義,它們以方程式的形式被表示出來(lái)。這些方程式既指出了系統(tǒng)無(wú)法擴(kuò)展的原因,同時(shí)也指出了它們應(yīng)該進(jìn)行擴(kuò)展的原因。通用擴(kuò)展定律(Universal Scalability Law)揭示和量化了系統(tǒng)的擴(kuò)展性特征。其通過(guò)兩個(gè)基礎(chǔ)性成本解釋了擴(kuò)展問題:即序列化與串?dāng)_(Crosstalk)。并行處理要求必須中止序列化,這就限制了它們的擴(kuò)展性。同樣的,如果并行處理需要始終進(jìn)行彼此對(duì)話以協(xié)調(diào)工作,那么它就相互進(jìn)行了限制。為了避免序列化與串?dāng)_,應(yīng)用進(jìn)行了更好的擴(kuò)展。這些在MySQL內(nèi)部被翻譯成了什么?結(jié)果不盡相同。不過(guò),一些案例應(yīng)該避免鎖定在特定的行之中。就像第3個(gè)技巧中所提到的,隊(duì)列擴(kuò)展性差的原因就是如此。6.不要過(guò)分關(guān)注配置數(shù)據(jù)庫(kù)管理員會(huì)花費(fèi)許多時(shí)間調(diào)整配置。調(diào)整的結(jié)果通常不會(huì)有很大的改善,相反有時(shí)候會(huì)帶來(lái)?yè)p害。我發(fā)現(xiàn)許多經(jīng)過(guò)“優(yōu)化的”服務(wù)器,在進(jìn)行強(qiáng)度稍微高一點(diǎn)的運(yùn)算時(shí)常常出現(xiàn)崩潰、內(nèi)存不足和性能低下等問題。雖然MySQL在交付時(shí)的默認(rèn)設(shè)置嚴(yán)重過(guò)時(shí),但是你并不需要對(duì)每一項(xiàng)都進(jìn)行配置。最好是根據(jù)需要,進(jìn)行基本糾正與設(shè)置調(diào)整。有10個(gè)選項(xiàng)調(diào)整正確,即可讓服務(wù)器發(fā)揮95%的最大性能。在許多案例中,我們并不推薦所謂的調(diào)整工具,因?yàn)樗鼈冎皇翘峁┮粋€(gè)大概設(shè)置,對(duì)特定案例沒有任何意義。有些工具甚至包含有危險(xiǎn)的和錯(cuò)誤的設(shè)備代碼。7.注意分頁(yè)查詢分頁(yè)查詢應(yīng)用會(huì)使服務(wù)器性能大降。這些應(yīng)用會(huì)在網(wǎng)頁(yè)上顯示搜索結(jié)果,然后通過(guò)鏈接跳轉(zhuǎn)至相應(yīng)網(wǎng)頁(yè)上。通常這些應(yīng)用無(wú)法使用索引進(jìn)行聚合與分類,而是使用LIMIT和OFFSET語(yǔ)句,這導(dǎo)致服務(wù)器工作負(fù)載大幅增加,并放棄行。 在用戶界面上常常會(huì)發(fā)現(xiàn)優(yōu)化選項(xiàng)。替代在結(jié)果中顯示網(wǎng)頁(yè)數(shù)量,以及分別與每個(gè)網(wǎng)頁(yè)相連的鏈接。這樣便可以僅顯示至下一頁(yè)的鏈接。你還可以阻止查詢者瀏覽與首頁(yè)過(guò)遠(yuǎn)的網(wǎng)頁(yè)。8.保存統(tǒng)計(jì)數(shù)據(jù),提高報(bào)警閥值監(jiān)控與報(bào)警必不可少,但是監(jiān)控系統(tǒng)被怎么處理了呢?當(dāng)它們發(fā)布假的報(bào)警信息時(shí),系統(tǒng)管理員會(huì)設(shè)置電子郵件過(guò)濾規(guī)則,以停止這些噪音。很快你的監(jiān)控系統(tǒng)就徹底沒用了。個(gè)人認(rèn)為,應(yīng)該以下面的兩種方式進(jìn)行監(jiān)控:捕捉指標(biāo)與報(bào)警。盡可能地捕捉與保存指標(biāo)非常重要,因?yàn)樵谀阍噲D搞明白系統(tǒng)中需要做哪些調(diào)整時(shí),你會(huì)慶幸之前保存了它們。如果某一天出現(xiàn)奇怪問題時(shí),你會(huì)很高興自己有能力繪制出服務(wù)器工作負(fù)載變化的圖形。9.了解索引的三大規(guī)則索引可能是數(shù)據(jù)庫(kù)中被誤解最多的一項(xiàng)。因?yàn)樗鼈兊墓ぷ鞣绞接性S多種,這導(dǎo)致人們常常對(duì)索引如何工作,以及服務(wù)器如何使用它們感到困惑。要想徹底搞清楚它們需要花上很大一番功夫。在被正確設(shè)計(jì)時(shí),索引在數(shù)據(jù)庫(kù)中主要用于實(shí)現(xiàn)以下三個(gè)重要目的:1.它們讓服務(wù)器尋找相鄰行群組,而不是單個(gè)行。許多人認(rèn)為,索引的目的是尋找單個(gè)行,但是尋找單個(gè)行會(huì)導(dǎo)致隨時(shí)磁盤操作,速度很慢。尋找行群組就要好許多,與一次尋找一個(gè)行相比,這更具吸引力。2.它們讓服務(wù)器避免以期望的讀行順序?qū)z索結(jié)果排序,排序成本十分高昂。以期望的順序讀行速度將更快。3.它們能夠滿足來(lái)自一個(gè)索引的所有查詢,從根本上避免了訪問表單的需求。這被稱為覆蓋索引或索引查詢。如果你能設(shè)計(jì)出符合這三個(gè)規(guī)則的索引與查詢,那么你的查詢速度將大幅提升。10.利用同行的專業(yè)知識(shí)不要孤軍奮戰(zhàn)。如果你在苦苦思考某個(gè)問題,并著手制訂明智的解決方案,那么這非常不錯(cuò)。在20次中,有19次問題會(huì)被順利解決。但是其中會(huì)有一次讓你不知所措,導(dǎo)致耗費(fèi)大量的資金和時(shí)間,準(zhǔn)確地說(shuō),是因?yàn)槟阏趪L試的解決方案只是貌似合理。創(chuàng)建一個(gè)MySQL相關(guān)資源網(wǎng)的意義遠(yuǎn)遠(yuǎn)大于工具集與故障排除指南。許多經(jīng)驗(yàn)豐富的專業(yè)人員就隱藏在論壇、問答網(wǎng)站之中。會(huì)議、展覽以及本地用戶集體活動(dòng),都會(huì)為我們提供獲得新見解的機(jī)會(huì)和與同行建立聯(lián)系的機(jī)會(huì),關(guān)鍵時(shí)刻這將對(duì)你很有幫助。