當(dāng)前位置:首頁 > 公眾號精選 > 架構(gòu)師社區(qū)
[導(dǎo)讀]來自:DBAplus社群 作者介紹 許珣,新炬網(wǎng)絡(luò)數(shù)據(jù)庫運(yùn)維專家,OCP。擁有五年的Oracle數(shù)據(jù)庫運(yùn)維經(jīng)驗(yàn),精通OGG技術(shù)相關(guān)應(yīng)用。 一、需求來源 自從阿里喊出“去IOE”的口號,又經(jīng)過2013年棱鏡門事件,政府也將數(shù)據(jù)安全視為重中之重,逐漸在加強(qiáng)管控軟、硬件的國產(chǎn)


通過OGG實(shí)現(xiàn)多源端數(shù)據(jù)庫的數(shù)據(jù)集中分發(fā)

來自:DBAplus社群


作者介紹

許珣,新炬網(wǎng)絡(luò)數(shù)據(jù)庫運(yùn)維專家,OCP。擁有五年的Oracle數(shù)據(jù)庫運(yùn)維經(jīng)驗(yàn),精通OGG技術(shù)相關(guān)應(yīng)用。


一、需求來源


自從阿里喊出“去IOE”的口號,又經(jīng)過2013年棱鏡門事件,政府也將數(shù)據(jù)安全視為重中之重,逐漸在加強(qiáng)管控軟、硬件的國產(chǎn)化之路。好吧,這跟我們今天要說的數(shù)據(jù)分發(fā)有什么關(guān)系呢?


眾所周知,IOE中的I和E相對比較容易被替代,而Oracle的替代則是一條漫長、艱辛的摸索之路。某省運(yùn)營商的數(shù)據(jù)分發(fā)需求也是在此大背景下不得不選擇的一條轉(zhuǎn)型之路。在此之前,集團(tuán)數(shù)據(jù)下發(fā)是通過小型機(jī)的存儲底層復(fù)制技術(shù),將整個(gè)生產(chǎn)庫每天同步到異機(jī)啟動,再通過創(chuàng)建一系列的對象和授權(quán),從而將生產(chǎn)庫的數(shù)據(jù)下發(fā)給地市查詢使用。小型機(jī)停止使用之后,X86環(huán)境無法實(shí)現(xiàn),則有了通過OGG來實(shí)現(xiàn)多源端數(shù)據(jù)庫的數(shù)據(jù)集中分發(fā)方式。


二、場景構(gòu)架


通過OGG實(shí)現(xiàn)多源端數(shù)據(jù)庫的數(shù)據(jù)集中分發(fā)


如圖所示,源端有多個(gè)數(shù)據(jù)庫,基于存儲、網(wǎng)絡(luò)的限制,無法做到打通所有源端到目標(biāo)端的網(wǎng)絡(luò),源端也無法保證每個(gè)數(shù)據(jù)庫服務(wù)器都能有足夠大的容量來存放隊(duì)列文件。


因此我們設(shè)立了一個(gè)大容量的分發(fā)中心,用于統(tǒng)一網(wǎng)絡(luò)傳輸路徑,并集中管理OGG產(chǎn)生的隊(duì)列文件,使之能保存較長時(shí)間,并將源端的隊(duì)列文件統(tǒng)一中轉(zhuǎn)后傳遞至目標(biāo)端,最后在目標(biāo)端應(yīng)用,從而實(shí)現(xiàn)數(shù)據(jù)的多源端到統(tǒng)一目標(biāo)端的分發(fā)。


三、詳情介紹


1、OGG技術(shù)原理


雖然知道讀者們基本都是運(yùn)維界的老鳥,不過也可能有不熟悉的朋友,下面介紹一下OGG的基本工作原理。以下摘自網(wǎng)絡(luò):


GoldenGate軟件是一種基于日志的結(jié)構(gòu)化數(shù)據(jù)復(fù)制軟件,它通過解析源數(shù)據(jù)庫在線日志或歸檔日志獲得數(shù)據(jù)的增刪改變化,再將這些變化應(yīng)用到目標(biāo)數(shù)據(jù)庫,實(shí)現(xiàn)源數(shù)據(jù)庫與目標(biāo)數(shù)據(jù)庫實(shí)時(shí)同步。


GoldenGate軟件可以在異構(gòu)的IT基礎(chǔ)結(jié)構(gòu)(包括幾乎所有常用操作系統(tǒng)平臺和數(shù)據(jù)庫平臺)之間實(shí)現(xiàn)大量數(shù)據(jù)亞秒一級的實(shí)時(shí)復(fù)制,其復(fù)制過程簡圖如下:


通過OGG實(shí)現(xiàn)多源端數(shù)據(jù)庫的數(shù)據(jù)集中分發(fā)


如上圖所示,GoldenGate的數(shù)據(jù)復(fù)制過程如下:


利用捕捉進(jìn)程(Capture Process)在源系統(tǒng)端讀取Online Redo Log或Archive Log,然后進(jìn)行解析,只提取其中數(shù)據(jù)的變化如增、刪、改操作,并將相關(guān)信息轉(zhuǎn)換為GoldenGate自定義的中間格式存放在隊(duì)列文件(trail)中。


再利用傳送進(jìn)程將隊(duì)列文件通過TCP/IP傳送到目標(biāo)系統(tǒng)。捕捉進(jìn)程在每次讀完log中的數(shù)據(jù)變化并在數(shù)據(jù)傳送到目標(biāo)系統(tǒng)后,會寫檢查點(diǎn)(checkpoint),記錄當(dāng)前完成捕捉的log位置,檢查點(diǎn)的存在可以使捕捉進(jìn)程在中止并恢復(fù)后可從檢查點(diǎn)位置繼續(xù)復(fù)制。


說白了OGG就是讀取日志,然后轉(zhuǎn)換成特定格式的文件,最后在目標(biāo)端回放源端的操作,支持類似“斷點(diǎn)續(xù)傳”。


2、本地環(huán)境


目前我們這邊源端的數(shù)據(jù)庫版本較多,以11.2.0.4的版本為主,分發(fā)中心OGG軟件版本為當(dāng)時(shí)的最新版12.2。整體環(huán)境已經(jīng)運(yùn)行了2年多,總體來說,運(yùn)行較為平穩(wěn)(這句話是假的,其實(shí)是踩坑踩過來的),現(xiàn)在已完全替代之前底層復(fù)制的方式來供各個(gè)地市查詢數(shù)據(jù)。相比于底層復(fù)制技術(shù),OGG無法做到像前者那樣,將整個(gè)庫都給復(fù)制過來,并且能保證數(shù)據(jù)的準(zhǔn)確性;但OGG也有其優(yōu)勢,就是時(shí)效性以及對主庫極小的壓力。


Oracle數(shù)據(jù)庫的數(shù)據(jù)類型那么多,OGG只能支持其中常用的一部分,雖然這么說看上去確實(shí)有兼容性方面的問題,不過我相信實(shí)際應(yīng)用中,這“常用的一部分”數(shù)據(jù)類型已經(jīng)基本覆蓋了OLTP系統(tǒng)應(yīng)用的需要,所以不需要太擔(dān)心,如果真的有,可以嘗試一部分特殊表用特殊方式來處理。


在時(shí)效性方面,OGG通常情況下不會讓人覺得有什么延遲,幾乎都是秒級或者官方吹牛的亞秒級同步。不過這種說法也僅限于通常情況,在某省運(yùn)營商每個(gè)月出賬后的時(shí)間,OGG的部分復(fù)制進(jìn)程同步延遲經(jīng)常達(dá)到十幾個(gè)小時(shí),這還是在目標(biāo)端拆分了大量復(fù)制進(jìn)程以后的情況。


畢竟不是所有的表都有主鍵,雖然Oracle宣稱沒有主鍵也可以,會將所有列合起來當(dāng)成唯一約束或者主鍵,但實(shí)際應(yīng)用中大批量Delete操作的性能問題確實(shí)令人難以忍受,而且一旦存在重復(fù)行的情況,OGG對于Update、Delete操作的同步可能還會有隨機(jī)的不確定性(目前來說數(shù)據(jù)的準(zhǔn)確性還是比較能保證)。


不過其實(shí)想想也正常,出賬期間,物理備庫基于數(shù)據(jù)塊的同步都有延遲,更別說基于SQL同步的OGG了,再高的并行回放,依然不能與主庫的高并發(fā)寫相提并論。


由于OGG的抽取進(jìn)程所做的僅是讀取日志,并生成相應(yīng)的隊(duì)列文件,可能還有一部分寫B(tài)R文件的操作,所以只需要很少的IO即可完成,這點(diǎn)IO對數(shù)據(jù)庫的性能影響微乎及微。而存儲底層復(fù)制的情況下,需要在2-3小時(shí)內(nèi)完成20~30T存儲的復(fù)制,這對網(wǎng)絡(luò)、IO的壓力可想而知。


不過雖然說OGG對IO的需求較少,但也不代表完全沒有需求,本地環(huán)境中,一部分源端是在物理備庫上使用ALO(archived log only)模式抽取,并且關(guān)閉了BR功能,否則每晚日賬期間,OGG進(jìn)程必定僵死,Oracle原廠也無法解釋清楚問題原因。


我認(rèn)為主要還是OGG軟件對備庫的支持不好,同樣條件下,主庫就沒有這樣的問題。除了僵死問題,備庫抽取所能支持的抽取模式也僅有經(jīng)典模式,這在Exadata一體機(jī)上是致命問題,所以除非逼不得已,不建議在備庫抽取。


3、運(yùn)行情況


前面吐槽了這么多,那么實(shí)際應(yīng)用反饋如何呢?答案是基本滿足地市查詢需求,僅部分表需特殊處理,偶爾有需要新增同步的表。


源端的所有數(shù)據(jù)庫加起來,少說有10W張表,其中大部分為歷史數(shù)據(jù)表,數(shù)據(jù)基本不變,主要查詢的基礎(chǔ)配置表和年月表都能正常同步,僅部分表因?yàn)閼?yīng)用會有頻繁的DDL操作導(dǎo)致無法正常同步。對于這類無法正常同步的表,我們通過自動化的expdp/impdp腳本,每天將這部分表同步到目標(biāo)端即可。


因?yàn)榈厥胁樵兊木唧w需求也不要求這類表做到實(shí)時(shí)同步,之前底層存儲復(fù)制的方式,數(shù)據(jù)也有一天的延遲,所以完全可以滿足需求。如果有新增表同步的需求,也會有標(biāo)準(zhǔn)化的操作流程,對已同步的表不會造成大的影響。


對于SQL的性能,我們也做了一部分測試,大部分情況下的查詢,因?yàn)槟繕?biāo)端存儲采用了閃存,查詢速度都會比原有減配的小型機(jī)環(huán)境更快,但也有部分復(fù)雜SQL的執(zhí)行計(jì)劃變更,查詢速度變慢,這屬于性能優(yōu)化的范疇了,在此不做討論。


總之,OGG并不完美,但采用什么構(gòu)架、技術(shù)也總是在現(xiàn)有的資源、環(huán)境、需求下做的妥協(xié)選擇,至少做到滿足當(dāng)前需求,它還是做到了。


四、問題解決


1、版本問題


OGG軟件是向下兼容的,但實(shí)際使用過程中,我們發(fā)現(xiàn)在源端-中轉(zhuǎn)端-目標(biāo)端的傳遞鏈路上,需要源端的軟件版本等于或低于中轉(zhuǎn)端的版本,否則一旦源端的OGG抽取或投遞進(jìn)程狀態(tài)有變更,就會導(dǎo)致中轉(zhuǎn)端的投遞進(jìn)程abend,并且重啟無法解決,需手工生成新的隊(duì)列文件。


這一問題有待后續(xù)升級構(gòu)架方案嘗試解決,但目前我們只能采取OGG版本一致的策略。但這也帶來了新的問題,那就是源端總是會有數(shù)據(jù)庫遷移、升級的吧?那數(shù)據(jù)庫上了18C、19C,OGG也必須使用新版本才能支持,這怎么辦呢?


首當(dāng)其沖想到的是中轉(zhuǎn)端隨之升級OGG版本,那中轉(zhuǎn)端升級,目標(biāo)端肯定也要升級啊,但是這需要充分的升級測試,目前來說,還沒有十足的把握來保證升級成功,一旦升級失敗,這上百T數(shù)據(jù)量的重新初始化真的夠我們喝好幾壺了……其實(shí)源端已經(jīng)有了一套數(shù)據(jù)庫上了18C,當(dāng)前只能采取繞過中轉(zhuǎn)端的方式,無奈之舉。


2、表類型支持問題


謝天謝地,當(dāng)前我們除了碰到壓縮表不支持之外,幾乎沒有碰到其他類型的表不支持問題,而壓縮表也基本都是很老的歷史表,幾乎無變更。所以對我們來說這點(diǎn)倒是不頭疼。


3、BR問題


BR的設(shè)計(jì)理念確實(shí)很好,可以防止OGG進(jìn)程在異常后重復(fù)讀取日志,并且僅需很小的IO和存儲。奈何備庫抽取的條件下,開了BR就會在段時(shí)間內(nèi)事務(wù)量巨大的情況下導(dǎo)致進(jìn)程僵死,遂在備庫上均關(guān)閉BR,主庫抽取時(shí)開啟。


4、DDL問題


OGG其實(shí)是可以支持DDL復(fù)制的,但經(jīng)典抽取模式需要開啟全庫級別的觸發(fā)器,這對于生產(chǎn)庫的性能影響肉眼可見,肯定是不建議使用的。目前我們碰到最多的是源端的表MOVE和rename,這也是前文所說的部分表無法正常同步的主要原因。集成模式倒是可以在不部署觸發(fā)器的情況下同步DDL操作,這也是后續(xù)我們升級時(shí)重點(diǎn)測試項(xiàng)目之一。 


通過OGG實(shí)現(xiàn)多源端數(shù)據(jù)庫的數(shù)據(jù)集中分發(fā)


5、內(nèi)存占用問題


正常情況下,OGG進(jìn)程僅需很小的內(nèi)存,但我們也碰到在一個(gè)服務(wù)器上,OGG抽取進(jìn)程占用了上限的64G內(nèi)存,導(dǎo)致服務(wù)器內(nèi)存不足,我們只好加上限制內(nèi)存的參數(shù),防止OGG進(jìn)程內(nèi)存占用過大。



CACHEMGR CACHESIZE 16G


6、僅歸檔模式(ALO)問題


前文有提到,OGG軟件對于備庫的支持不好,所以如果抽取進(jìn)程部署在備庫,最好讓抽取進(jìn)程僅從歸檔抽取,就是下面這個(gè)參數(shù):



TRANLOGOPTIONS ALTARCHIVELOGDEST


隨之帶來的問題就是,數(shù)據(jù)同步的時(shí)間永遠(yuǎn)會差一個(gè)歸檔的時(shí)間,就是必須得等源端的redo log寫入歸檔并且傳輸?shù)絺鋷炝?,OGG進(jìn)程才能開始讀取。不過我想在時(shí)效性和可用性之間,應(yīng)該都會選擇可用性吧。


7、歸檔日志保護(hù)


前面還提到過,每月出賬時(shí)間,可能會有十幾個(gè)小時(shí)的延遲,就算是物理備庫,也經(jīng)常會出現(xiàn)幾個(gè)小時(shí)的延遲。主庫可以配置歸檔的備份刪除策略,讓歸檔未在備庫應(yīng)用時(shí)不被刪除,但OGG不行啊。所以我們改造了NBU的備份腳本,每次歸檔備份時(shí),讀取OGG進(jìn)程當(dāng)前讀取到的歸檔sequence號,僅備份刪除此sequence號之前的日志。


8、未完待續(xù)……


實(shí)際運(yùn)維中,遇到的問題不僅僅是這些,篇幅問題,就不一一列舉了,歡迎感興趣的朋友可以在評論區(qū)留言交流OGG運(yùn)維中的坑。


五、升級方向


雖然目前的構(gòu)架、方案可以滿足應(yīng)用的需要,但技術(shù)更新、版本迭代不可避免,隨著數(shù)據(jù)庫版本的不斷升級,當(dāng)前環(huán)境勢必會在日后會不滿足需求,需要我們提供更好,更完善,更便于維護(hù)的方案。


目前我們思考的升級方式是使用OGG Integrated Mode(downstream方式),建立一個(gè)mining database統(tǒng)一接收多源端的歸檔日志,并創(chuàng)建相對應(yīng)的抽取進(jìn)程,使之獲得與在主庫部署的集成模式(Integrated Mode)抽取進(jìn)程一樣的支持。


同時(shí),mining database可以創(chuàng)建RAC,避免單點(diǎn)故障。這種構(gòu)架還能解決一個(gè)非常棘手的問題,那就是源端的主備庫切換。在現(xiàn)有構(gòu)架中,源端一旦發(fā)生主備庫切換,就有可能帶來數(shù)據(jù)不一致的風(fēng)險(xiǎn),而且必須要人工干預(yù),有可能還會需要對部分表做重新初始化,這都是額外的工作量。


而使用downstream方式則不會有此問題,因?yàn)閙ining database只是接收源端的歸檔,至于抽取進(jìn)程里配置的連接主庫的TNS問題,通過域名就可以解決。我猜想最多在發(fā)生主備切換時(shí),重啟一下mining database上的抽取進(jìn)程就可以了,那就高枕無憂了!當(dāng)然,有待我們后續(xù)的測試驗(yàn)證,這點(diǎn)我也很期待……


好了,有了新的構(gòu)架,我們還是繞不開源端數(shù)據(jù)庫版本升級的問題,但至少我們把需要升級的服務(wù)器從“N源端+1中轉(zhuǎn)+1目標(biāo)端”減少為了“1 mining database+1目標(biāo)端”,至少風(fēng)險(xiǎn)點(diǎn)看上去是減少了。但具體的實(shí)現(xiàn),我們還需大量的測試驗(yàn)證,比如如果mining database的數(shù)據(jù)庫版本高于源端,OGG還能不能正常工作,這就是測試的重中之重。


最后,放一張官方的構(gòu)架圖:


通過OGG實(shí)現(xiàn)多源端數(shù)據(jù)庫的數(shù)據(jù)集中分發(fā)


六、心得體會


在做這個(gè)項(xiàng)目的過程當(dāng)中,雖然碰到過不少莫名其妙的坑,但也確實(shí)收獲了很多經(jīng)驗(yàn)教訓(xùn),讓我對OGG的實(shí)施運(yùn)維有了很多新的認(rèn)識。但是技術(shù)總是會不斷更新,我們總得不斷嘗試,才能有所得,與諸君共勉。





特別推薦一個(gè)分享架構(gòu)+算法的優(yōu)質(zhì)內(nèi)容,還沒關(guān)注的小伙伴,可以長按關(guān)注一下:

通過OGG實(shí)現(xiàn)多源端數(shù)據(jù)庫的數(shù)據(jù)集中分發(fā)

長按訂閱更多精彩▼

通過OGG實(shí)現(xiàn)多源端數(shù)據(jù)庫的數(shù)據(jù)集中分發(fā)

如有收獲,點(diǎn)個(gè)在看,誠摯感謝

免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺僅提供信息存儲服務(wù)。文章僅代表作者個(gè)人觀點(diǎn),不代表本平臺立場,如有問題,請聯(lián)系我們,謝謝!

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉