來(lái)源:
https://www.toutiao.com/i6805798581971190276/
前言
近2年Docker非常的火熱,各位開(kāi)發(fā)者恨不得把所有的應(yīng)用、軟件都部署在Docker容器中,但是您確定也要把數(shù)據(jù)庫(kù)也部署的容器中嗎?
這個(gè)問(wèn)題不是子虛烏有,因?yàn)樵诰W(wǎng)上能夠找到很多各種操作手冊(cè)和視頻教程,小編整理了一些數(shù)據(jù)庫(kù)不適合容器化的原因供大家參考,同時(shí)也希望大家在使用時(shí)能夠謹(jǐn)慎一點(diǎn)。
目前為止將數(shù)據(jù)庫(kù)容器化是非常不合理的,但是容器化的優(yōu)點(diǎn)相信各位開(kāi)發(fā)者都嘗到了甜頭,希望隨著技術(shù)的發(fā)展能夠更加完美的解決方案出現(xiàn)。
Docker不適合部署數(shù)據(jù)庫(kù)的7大原因
不要將數(shù)據(jù)儲(chǔ)存在容器中,這也是 Docker 官方容器使用技巧中的一條。容器隨時(shí)可以停止、或者刪除。當(dāng)容器被rm掉,容器里的數(shù)據(jù)將會(huì)丟失。為了避免數(shù)據(jù)丟失,用戶可以使用數(shù)據(jù)卷掛載來(lái)存儲(chǔ)數(shù)據(jù)。但是容器的 Volumes 設(shè)計(jì)是圍繞 Union FS 鏡像層提供持久存儲(chǔ),數(shù)據(jù)安全缺乏保證。如果容器突然崩潰,數(shù)據(jù)庫(kù)未正常關(guān)閉,可能會(huì)損壞數(shù)據(jù)。另外,容器里共享數(shù)據(jù)卷組,對(duì)物理機(jī)硬件損傷也比較大。
即使你要把 Docker 數(shù)據(jù)放在主機(jī)來(lái)存儲(chǔ) ,它依然不能保證不丟數(shù)據(jù)。Docker volumes 的設(shè)計(jì)圍繞 Union FS 鏡像層提供持久存儲(chǔ),但它仍然缺乏保證。
使用當(dāng)前的存儲(chǔ)驅(qū)動(dòng)程序,Docker 仍然存在不可靠的風(fēng)險(xiǎn)。如果容器崩潰并數(shù)據(jù)庫(kù)未正確關(guān)閉,則可能會(huì)損壞數(shù)據(jù)。
大家都知道,MySQL 屬于關(guān)系型數(shù)據(jù)庫(kù),對(duì)IO要求較高。當(dāng)一臺(tái)物理機(jī)跑多個(gè)時(shí),IO就會(huì)累加,導(dǎo)致IO瓶頸,大大降低 MySQL 的讀寫性能。
在一次Docker應(yīng)用的十大難點(diǎn)專場(chǎng)上,某國(guó)有銀行的一位架構(gòu)師也曾提出過(guò):“數(shù)據(jù)庫(kù)的性能瓶頸一般出現(xiàn)在IO上面,如果按 Docker 的思路,那么多個(gè)docker最終IO請(qǐng)求又會(huì)出現(xiàn)在存儲(chǔ)上面?,F(xiàn)在互聯(lián)網(wǎng)的數(shù)據(jù)庫(kù)多是share nothing的架構(gòu),可能這也是不考慮遷移到 Docker 的一個(gè)因素吧”。
針對(duì)性能問(wèn)題有些同學(xué)可能也有相對(duì)應(yīng)的方案來(lái)解決:
(1)數(shù)據(jù)庫(kù)程序與數(shù)據(jù)分離
如果使用Docker 跑 MySQL,數(shù)據(jù)庫(kù)程序與數(shù)據(jù)需要進(jìn)行分離,將數(shù)據(jù)存放到共享存儲(chǔ),程序放到容器里。如果容器有異常或 MySQL 服務(wù)異常,自動(dòng)啟動(dòng)一個(gè)全新的容器。另外,建議不要把數(shù)據(jù)存放到宿主機(jī)里,宿主機(jī)和容器共享卷組,對(duì)宿主機(jī)損壞的影響比較大。
(2)跑輕量級(jí)或分布式數(shù)據(jù)庫(kù)
Docker 里部署輕量級(jí)或分布式數(shù)據(jù)庫(kù),Docker 本身就推薦服務(wù)掛掉,自動(dòng)啟動(dòng)新容器,而不是繼續(xù)重啟容器服務(wù)。
對(duì)于IO要求比較高的應(yīng)用或者服務(wù),將數(shù)據(jù)庫(kù)部署在物理機(jī)或者KVM中比較合適。目前TX云的TDSQL和阿里的Oceanbase都是直接部署在物理機(jī)器,而非Docker 。
要理解 Docker 網(wǎng)絡(luò),您必須對(duì)網(wǎng)絡(luò)虛擬化有深入的了解。也必須準(zhǔn)備應(yīng)付好意外情況。你可能需要在沒(méi)有支持或沒(méi)有額外工具的情況下,進(jìn)行 bug 修復(fù)。
我們知道:數(shù)據(jù)庫(kù)需要專用的和持久的吞吐量,以實(shí)現(xiàn)更高的負(fù)載。我們還知道容器是虛擬機(jī)管理程序和主機(jī)虛擬機(jī)背后的一個(gè)隔離層。然而網(wǎng)絡(luò)對(duì)于數(shù)據(jù)庫(kù)復(fù)制是至關(guān)重要的,其中需要主從數(shù)據(jù)庫(kù)間 24/7 的穩(wěn)定連接。未解決的 Docker 網(wǎng)絡(luò)問(wèn)題在1.9版本依然沒(méi)有得到解決。
把這些問(wèn)題放在一起,容器化使數(shù)據(jù)庫(kù)容器很難管理。我知道你是一個(gè)頂級(jí)的工程師,什么問(wèn)題都可以得到解決。但是,你需要花多少時(shí)間解決 Docker 網(wǎng)絡(luò)問(wèn)題?將數(shù)據(jù)庫(kù)放在專用環(huán)境不會(huì)更好嗎?節(jié)省時(shí)間來(lái)專注于真正重要的業(yè)務(wù)目標(biāo)。
在 Docker 中打包無(wú)狀態(tài)服務(wù)是很酷的,可以實(shí)現(xiàn)編排容器并解決單點(diǎn)故障問(wèn)題。但是數(shù)據(jù)庫(kù)呢?將數(shù)據(jù)庫(kù)放在同一個(gè)環(huán)境中,它將會(huì)是有狀態(tài)的,并使系統(tǒng)故障的范圍更大。下次您的應(yīng)用程序?qū)嵗驊?yīng)用程序崩潰,可能會(huì)影響數(shù)據(jù)庫(kù)。
知識(shí)點(diǎn):在 Docker 中水平伸縮只能用于無(wú)狀態(tài)計(jì)算服務(wù),而不是數(shù)據(jù)庫(kù)。
Docker 快速擴(kuò)展的一個(gè)重要特征就是無(wú)狀態(tài),具有數(shù)據(jù)狀態(tài)的都不適合直接放在 Docker 里面,如果 Docker 中安裝數(shù)據(jù)庫(kù),存儲(chǔ)服務(wù)需要單獨(dú)提供。
目前,TX云的TDSQL(金融分布式數(shù)據(jù)庫(kù))和阿里云的Oceanbase(分布式數(shù)據(jù)庫(kù)系統(tǒng))都直接運(yùn)行中在物理機(jī)器上,并非使用便于管理的 Docker 上。
資源隔離方面,Docker 確實(shí)不如虛擬機(jī)KVM,Docker是利用Cgroup實(shí)現(xiàn)資源限制的,只能限制資源消耗的最大值,而不能隔絕其他程序占用自己的資源。如果其他應(yīng)用過(guò)渡占用物理機(jī)資源,將會(huì)影響容器里 MySQL 的讀寫效率。
需要的隔離級(jí)別越多,獲得的資源開(kāi)銷就越多。相比專用環(huán)境而言,容易水平伸縮是Docker的一大優(yōu)勢(shì)。然而在 Docker 中水平伸縮只能用于無(wú)狀態(tài)計(jì)算服務(wù),數(shù)據(jù)庫(kù)并不適用。
我們沒(méi)有看到任何針對(duì)數(shù)據(jù)庫(kù)的隔離功能,那為什么我們應(yīng)該把它放在容器中呢?
大部分人通過(guò)共有云開(kāi)始項(xiàng)目。云簡(jiǎn)化了虛擬機(jī)操作和替換的復(fù)雜性,因此不需要在夜間或周末沒(méi)有人工作時(shí)間來(lái)測(cè)試新的硬件環(huán)境。當(dāng)我們可以迅速啟動(dòng)一個(gè)實(shí)例的時(shí)候,為什么我們需要擔(dān)心這個(gè)實(shí)例運(yùn)行的環(huán)境?
這就是為什么我們向云提供商支付很多費(fèi)用的原因。當(dāng)我們?yōu)閷?shí)例放置數(shù)據(jù)庫(kù)容器時(shí),上面說(shuō)的這些便利性就不存在了。因?yàn)閿?shù)據(jù)不匹配,新實(shí)例不會(huì)與現(xiàn)有的實(shí)例兼容,如果要限制實(shí)例使用單機(jī)服務(wù),應(yīng)該讓 DB 使用非容器化環(huán)境,我們僅僅需要為計(jì)算服務(wù)層保留彈性擴(kuò)展的能力。
7、運(yùn)行數(shù)據(jù)庫(kù)的環(huán)境需求
??吹?DBMS 容器和其他服務(wù)運(yùn)行在同一主機(jī)上。然而這些服務(wù)對(duì)硬件要求是非常不同的。
數(shù)據(jù)庫(kù)(特別是關(guān)系型數(shù)據(jù)庫(kù))對(duì) IO 的要求較高。一般數(shù)據(jù)庫(kù)引擎為了避免并發(fā)資源競(jìng)爭(zhēng)而使用專用環(huán)境。如果將你的數(shù)據(jù)庫(kù)放在容器中,那么將浪費(fèi)你的項(xiàng)目的資源。因?yàn)槟阈枰獮樵搶?shí)例配置大量額外的資源。在公有云,當(dāng)你需要 34G 內(nèi)存時(shí),你啟動(dòng)的實(shí)例卻必須開(kāi) 64G 內(nèi)存。在實(shí)踐中,這些資源并未完全使用。
怎么解決?您可以分層設(shè)計(jì),并使用固定資源來(lái)啟動(dòng)不同層次的多個(gè)實(shí)例。水平伸縮總是比垂直伸縮更好。
總結(jié)
針對(duì)上面問(wèn)題是不是說(shuō)數(shù)據(jù)庫(kù)一定不要部署在容器里嗎?
我們可以把數(shù)據(jù)丟失不敏感的業(yè)務(wù)(搜索、埋點(diǎn))就可以數(shù)據(jù)化,利用數(shù)據(jù)庫(kù)分片來(lái)來(lái)增加實(shí)例數(shù),從而增加吞吐量。
docker適合跑輕量級(jí)或分布式數(shù)據(jù)庫(kù),當(dāng)docker服務(wù)掛掉,會(huì)自動(dòng)啟動(dòng)新容器,而不是繼續(xù)重啟容器服務(wù)。
數(shù)據(jù)庫(kù)利用中間件和容器化系統(tǒng)能夠自動(dòng)伸縮、容災(zāi)、切換、自帶多個(gè)節(jié)點(diǎn),也是可以進(jìn)行容器化的。
特別推薦一個(gè)分享架構(gòu)+算法的優(yōu)質(zhì)內(nèi)容,還沒(méi)關(guān)注的小伙伴,可以長(zhǎng)按關(guān)注一下:
長(zhǎng)按訂閱更多精彩▼
如有收獲,點(diǎn)個(gè)在看,誠(chéng)摯感謝
免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。文章僅代表作者個(gè)人觀點(diǎn),不代表本平臺(tái)立場(chǎng),如有問(wèn)題,請(qǐng)聯(lián)系我們,謝謝!