當(dāng)前位置:首頁 > 公眾號精選 > 架構(gòu)師社區(qū)
[導(dǎo)讀]MySQL死鎖異常是我們經(jīng)常會遇到的線上異常類別,一旦線上業(yè)務(wù)日間復(fù)雜,各種業(yè)務(wù)操作之間往往會產(chǎn)生鎖沖突,有些會導(dǎo)致死鎖異常。這種死鎖異常一般要在特定時(shí)間特定數(shù)據(jù)和特定業(yè)務(wù)操作才會復(fù)現(xiàn),并且分析解決時(shí)還需要了解MySQL鎖沖突相關(guān)知識,所以一般遇到這些偶爾出現(xiàn)的死鎖異常,往往一時(shí)沒有頭緒,不好處理。


前言

MySQL 死鎖異常是我們經(jīng)常會遇到的線上異常類別,一旦線上業(yè)務(wù)日間復(fù)雜,各種業(yè)務(wù)操作之間往往會產(chǎn)生鎖沖突,有些會導(dǎo)致死鎖異常。這種死鎖異常一般要在特定時(shí)間特定數(shù)據(jù)和特定業(yè)務(wù)操作才會復(fù)現(xiàn),并且分析解決時(shí)還需要了解 MySQL 鎖沖突相關(guān)知識,所以一般遇到這些偶爾出現(xiàn)的死鎖異常,往往一時(shí)沒有頭緒,不好處理。


本篇文章會講解一下如果線上發(fā)生了死鎖異常,如何去排查和處理。除了系列前文講解的有關(guān)加鎖和鎖沖突的原理還,還需要對 MySQl 死鎖日志和 binlog 日志進(jìn)行分析。

線上發(fā)生死鎖異常了,該怎么辦?

正文

日常工作中,應(yīng)對各類線上異常都要有我們自己的 SOP (標(biāo)準(zhǔn)作業(yè)流程) ,這樣不僅能夠提高自己的處理問題效率,也有助于將好的處理流程推廣到團(tuán)隊(duì),提高團(tuán)隊(duì)的整體處理異常能力。

所以,面對線上偶發(fā)的 MySQL 死鎖問題,我的排查處理過程如下:

  1. 線上錯(cuò)誤日志報(bào)警發(fā)現(xiàn)死鎖異常

  1. 查看錯(cuò)誤日志的堆棧信息

  1. 查看 MySQL 死鎖相關(guān)的日志

  1. 根據(jù) binlog 查看死鎖相關(guān)事務(wù)的執(zhí)行內(nèi)容

  1. 根據(jù)上述信息找出兩個(gè)相互死鎖的事務(wù)執(zhí)行的 SQL 操作,根據(jù)本系列介紹的鎖相關(guān)理論知識,進(jìn)行分析推斷死鎖原因

  1. 修改業(yè)務(wù)代碼


根據(jù)1,2步驟可以找到死鎖異常時(shí)進(jìn)行回滾事務(wù)的具體業(yè)務(wù),也就能夠找到該事務(wù)執(zhí)行的 SQL 語句。然后我們需要通過 3,4步驟找到死鎖異常時(shí)另外一個(gè)事務(wù),也就是最終獲得鎖的事務(wù)所執(zhí)行的 SQL 語句,然后再進(jìn)行鎖沖突相關(guān)的分析。

第一二步的線上錯(cuò)誤日志和堆棧信息一般比較容易獲得,第五步的分析 SQL 鎖沖突原因中涉及的鎖相關(guān)的理論在系列文章中都有介紹,沒有了解的同學(xué)可以自行去閱讀以下。

下面我們就來重點(diǎn)說一下其中的第三四步驟,也就是如何查看死鎖日志和 binlog 日志來找到死鎖相關(guān)的 SQL 操作。

死鎖日志的獲取

發(fā)生死鎖異常后,我們可以直接使用 show engine innodb status 命令獲取死鎖信息,但是該命令只能獲取最近一次的死鎖信息。所以,我們可以通過開啟 InnoDB 的監(jiān)控機(jī)制來獲取實(shí)時(shí)的死鎖信息,它會周期性(每隔 15 秒)打印 InnoDb 的運(yùn)行狀態(tài)到 mysqld 服務(wù)的錯(cuò)誤日志文件中。

InnoDb 的監(jiān)控較為重要的有標(biāo)準(zhǔn)監(jiān)控(Standard InnoDB Monitor)和 鎖監(jiān)控(InnoDB Lock Monitor),通過對應(yīng)的系統(tǒng)參數(shù)可以將其開啟。

線上發(fā)生死鎖異常了,該怎么辦?

另外,MySQL 提供了一個(gè)系統(tǒng)參數(shù) innodb_print_all_deadlocks 專門用于記錄死鎖日志,當(dāng)發(fā)生死鎖時(shí),死鎖日志會記錄到 MySQL 的錯(cuò)誤日志文件中。

另外,MySQL 提供了一個(gè)系統(tǒng)參數(shù) innodb_print_all_deadlocks 專門用于記錄死鎖日志,當(dāng)發(fā)生死鎖時(shí),死鎖日志會記錄到 MySQL 的錯(cuò)誤日志文件中。

set GLOBAL innodb_print_all_deadlocks=ON;

死鎖日志的分析

通過上述手段,我們可以拿到死鎖日志,下圖是我做實(shí)驗(yàn)觸發(fā)死鎖異常時(shí)獲取的日志(省略的部分信息)。

線上發(fā)生死鎖異常了,該怎么辦?

該日志會列出死鎖發(fā)生的時(shí)間,死鎖相關(guān)的事務(wù),并顯示出兩個(gè)事務(wù)(可惜,多事務(wù)發(fā)生死鎖時(shí),也只顯示兩個(gè)事務(wù))在發(fā)生死鎖時(shí)執(zhí)行的 SQL 語句、持有或等待的鎖信息和最終回滾的事務(wù)

下面,我們來一段一段的解讀該日志中給出的信息,我們按照圖中標(biāo)注的順序來介紹:

TRANSACTION 2078, ACTIVE 74 sec starting index read // -1 事務(wù)一的基礎(chǔ)信息,包括事務(wù)ID、活躍時(shí)間,當(dāng)前運(yùn)行狀態(tài)

表示的是 ACTIVE 74 sec 表示事務(wù)活動(dòng)時(shí)間,starting index read 為事務(wù)當(dāng)前正在運(yùn)行的狀態(tài),可能的事務(wù)狀態(tài)有:fetching rows,updating,deleting,inserting, starting index read 等狀態(tài)。

線上發(fā)生死鎖異常了,該怎么辦?

其中第一行,tables in use 1 表示有一個(gè)表被使用,locked 1 表示有一個(gè)表鎖。第二行中的 LOCK WAIT 表示事務(wù)正在等待鎖,3 lock struct(s) 表示該事務(wù)的鎖鏈表的長度為 3,每個(gè)鏈表節(jié)點(diǎn)代表該事務(wù)持有的一個(gè)鎖結(jié)構(gòu),包括表鎖,記錄鎖或 autoinc 鎖等。heap size 1136 為事務(wù)分配的鎖堆內(nèi)存大小。

第二行后半段中,2 row lock(s) 表示當(dāng)前事務(wù)持有的行鎖個(gè)數(shù),通過遍歷上面提到的 11 個(gè)鎖結(jié)構(gòu),找出其中類型為 LOCK_REC 的記錄數(shù)。undo log entries 1 表示當(dāng)前事務(wù)有 1 個(gè) undo log 記錄,說明該事務(wù)已經(jīng)更新了 1條記錄。

下面就是死鎖日志中最為重要的持有或者待獲取鎖信息,如圖中-5和-6行所示,通過它可以分析鎖的具體類型和涉及的表,這些信息能輔助你按照系列文章的鎖相關(guān)的知識來分析 SQL 的鎖沖突。

線上發(fā)生死鎖異常了,該怎么辦?

《鎖類型和加鎖原理》 一文中我們說過,一共有四種類型的行鎖:記錄鎖,間隙鎖,Next-key 鎖和插入意向鎖。這四種鎖對應(yīng)的死鎖日志各不相同,如下:

  • 記錄鎖(LOCK_REC_NOT_GAP): lock_mode X locks rec but not gap

  • 間隙鎖(LOCK_GAP): lock_mode X locks gap before rec

  • Next-key 鎖(LOCK_ORNIDARY): lock_mode X

  • 插入意向鎖(LOCK_INSERT_INTENTION): lock_mode X locks gap before rec insert intention

所以,按照死鎖日志,我們發(fā)現(xiàn)事務(wù)一持有了 test.t 表上的記錄鎖,并且等待另一個(gè)記錄鎖。


通過死鎖日志,我們可以找到最終獲得鎖事務(wù)最后執(zhí)行的 SQL,但是如果該事務(wù)執(zhí)行了多條 SQL,這些信息就可能不夠用的啦,我們需要完整的了解該事務(wù)所有執(zhí)行的 SQL語句。這時(shí),我們就需要從 binlog 日志中獲取。

binlog的獲取和分析

binlog 日志會完整記錄事務(wù)執(zhí)行的所有 SQL,借助它,我們就能找到最終獲取鎖事務(wù)所執(zhí)行的全部 SQL。然后再進(jìn)行具體的鎖沖突分析。


我們可以使用 MySQL 的命令行工具 Mysqlbinlog 遠(yuǎn)程獲取線上數(shù)據(jù)庫的 binlog 日志。具體命令如下所示:

Mysqlbinlog -h127.0.0.1 -u root -p --read-from-remote-server binlog.000001 --base64-output=decode-rows -v

其中 --base64-output=decode-rows 表示 row 模式 binlog日志,所以該方法只適用于 row 模式的 binlog日志,但是目前主流 MySQL 運(yùn)維也都是把 binlog 日志設(shè)置為 row 模式,所以這點(diǎn)限制也就無傷大雅。-v 則表示將行事件重構(gòu)成被注釋掉的偽SQL語句。


我們可以通過死鎖日志中死鎖發(fā)生的具體事件和最終獲取鎖事務(wù)正在執(zhí)行的SQL的參數(shù)信息找到 binlog 中該事務(wù)的對應(yīng)信息,比如我們可以直接通過死鎖日志截圖中的具體的時(shí)間 10點(diǎn)57分和 Tom1、Teddy2 等 SQL 的具體數(shù)據(jù)信息在 binlog 找到對應(yīng)的位置,具體如下圖所示。

線上發(fā)生死鎖異常了,該怎么辦?

根據(jù) binlog 的具體信息,我們可以清晰的找到最終獲取鎖事務(wù)所執(zhí)行的所有 SQL 語句,也就能找到其對應(yīng)的業(yè)務(wù)代碼,接下來我們就能進(jìn)行具體的鎖沖突分析。

小結(jié)

死鎖系列終于告一段落,如果大伙有什么疑問或者文中有什么錯(cuò)誤,歡迎在下方留言討論。也希望大家繼續(xù)持續(xù)關(guān)注。

特別推薦一個(gè)分享架構(gòu)+算法的優(yōu)質(zhì)內(nèi)容,還沒關(guān)注的小伙伴,可以長按關(guān)注一下:

線上發(fā)生死鎖異常了,該怎么辦?

線上發(fā)生死鎖異常了,該怎么辦?

線上發(fā)生死鎖異常了,該怎么辦?

長按訂閱更多精彩▼

線上發(fā)生死鎖異常了,該怎么辦?

如有收獲,點(diǎn)個(gè)在看,誠摯感謝

免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺僅提供信息存儲服務(wù)。文章僅代表作者個(gè)人觀點(diǎn),不代表本平臺立場,如有問題,請聯(lián)系我們,謝謝!

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動(dòng)現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動(dòng)力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉