當前位置:首頁 > 電源 > 數(shù)字電源
[導(dǎo)讀]隨來社會的進步,計算機的廣泛應(yīng)用,很多事務(wù)處理過程中事務(wù)的恢復(fù)工作一般依賴于計算機數(shù)據(jù)庫管理系統(tǒng),而事務(wù)管理器必須做好分布式事務(wù)處理的事務(wù)恢復(fù)處理。這需要做好二個階段的工作:在正常的事務(wù)處理過程中,交

隨來社會的進步,計算機的廣泛應(yīng)用,很多事務(wù)處理過程中事務(wù)的恢復(fù)工作一般依賴于計算機數(shù)據(jù)庫管理系統(tǒng),而事務(wù)管理器必須做好分布式事務(wù)處理的事務(wù)恢復(fù)處理。這需要做好二個階段的工作:在正常的事務(wù)處理過程中,交易中間件在穩(wěn)定存儲器中完整記錄事務(wù)恢復(fù)時的必要信息;在事務(wù)的恢復(fù)階段,恢復(fù)系統(tǒng)根據(jù)穩(wěn)定存儲器中記錄的事務(wù)相關(guān)信息恢復(fù)事務(wù)。本文就對該系統(tǒng)進行講解。

在OMG組織的OTS(對象事務(wù)服務(wù))中規(guī)定了一套事務(wù)失敗恢復(fù)的模型。該模型是基于假定回滾的策略恢復(fù)失敗的事務(wù)。假定回滾是事務(wù)二階段提交協(xié)議的一種效率優(yōu)化策略,事務(wù)發(fā)起者在決定提交之前和資源在準備好之前都不用寫任何日志。這樣在失敗發(fā)生后重新啟動時,所有未記錄日志的事務(wù)都認為已經(jīng)做過回滾操作。

ACID,指數(shù)據(jù)庫事務(wù)正確執(zhí)行的四個基本要素的縮寫。包含:原子性(Atomicity)、一致性(CONsiSTency)、隔離性(IsolATIon)、持久性(Durability)。一個支持事務(wù)(TransacTIon)的數(shù)據(jù)庫系統(tǒng),必需要具有這四種特性,否則在事務(wù)過程(Transaction processing)當中無法保證數(shù)據(jù)的正確性,交易過程極可能達不到交易方的要求。

本文分析了OTS的事務(wù)失敗模型的恢復(fù)機制,用Java語言實現(xiàn)了交易中間件的事務(wù)恢復(fù)子系統(tǒng),從而保證了分布式交易處理的完整性和一致性。

1  OTS中的事務(wù)失敗模型和恢復(fù)機制

1.1 事務(wù)的失敗模型

事務(wù)服務(wù)在應(yīng)用、系統(tǒng)或通信失敗時,要提供事務(wù)的原子性結(jié)果。下面描述失敗發(fā)生時各應(yīng)用實體的行為。

(1)事務(wù)創(chuàng)建者

局部失?。涸谑聞?wù)創(chuàng)建者發(fā)出提交命令之前的失敗將引起事務(wù)回滾。在事務(wù)創(chuàng)建者發(fā)出提交命令之后而在事務(wù)結(jié)果報告之前的失敗,依賴于時機導(dǎo)致提交或回滾。這種情況下事務(wù)的完成情況與事務(wù)創(chuàng)建者的失敗無關(guān)。

外部失?。喝魏卧谑聞?wù)創(chuàng)建者發(fā)出提交命令之前的外部失敗,都將引起事務(wù)的回滾。在事務(wù)創(chuàng)建者發(fā)出提交命令之后而在事務(wù)結(jié)果報告之前的失敗,意味客戶端可能不會通知事務(wù)的結(jié)果,這依賴于失敗的特征和提交命令是否使用report_heuristics選項。但這也不是可靠的方法,因為可能得到事務(wù)不存在的結(jié)果。

(2)事務(wù)服務(wù)器

局部失?。菏聞?wù)服務(wù)器失敗后,事務(wù)服務(wù)如果實現(xiàn)可選的檢查方法,將引起事務(wù)的回滾。如果沒有實現(xiàn)可選的檢查方法,事務(wù)是否回滾取決于事務(wù)的提交命令是否發(fā)出。當未檢查的客戶端在收到所有服務(wù)器的應(yīng)答之前發(fā)出提交命令時就是這種情況。

外部失?。喝魏卧谑聞?wù)服務(wù)器執(zhí)行過程發(fā)生的外部失敗都將引起事務(wù)的回滾。事務(wù)對象的方法執(zhí)行時發(fā)生失敗,將不會影響方法的執(zhí)行。方法將會正常結(jié)束,返回結(jié)果到客戶端。最后事務(wù)回滾異常返回到發(fā)出提交命令的客戶端。

(3)恢復(fù)服務(wù)器

可恢復(fù)服務(wù)器在失敗發(fā)生時的行為決定于Coordinator與可恢復(fù)服務(wù)器的資源對象之間的二階段提交協(xié)議。

1.2 事務(wù)失敗后的繼續(xù)完成

通常,完成方法是在失敗發(fā)生點繼續(xù)完成事務(wù)。這意味著Coordinator常常有責任向注冊的資源發(fā)送提交命令。某些失敗情況下也需要資源初始化恢復(fù)程序。

資源代表與某一事務(wù)關(guān)聯(lián)的可恢復(fù)數(shù)據(jù)的集合。當失敗恢復(fù)時,已經(jīng)準備好的資源使用RecoveryCoordinator對象的reply_completion方法確定事務(wù)的結(jié)果和完成事務(wù)。

根Coordinator在日志記錄決定提交前的失敗可能是單方面的回滾事務(wù)。如果所有資源都準備好,需要初始化的恢復(fù)過程如下:若根Coordinator的結(jié)果是提交,則發(fā)出提交命令繼續(xù)完成協(xié)議;若根Coordinator的結(jié)果是回滾,則發(fā)出回滾命令繼續(xù)完成協(xié)議。

2  事務(wù)的恢復(fù)處理

事務(wù)恢復(fù),就是能夠在容錯的方式下繼續(xù)完成事務(wù)。通過日志的記錄信息,在恢復(fù)過程中使用這些有用的信息恢復(fù)事務(wù)。

事務(wù)恢復(fù)的二個階段是:①正常操作時,在事務(wù)處理過程中存儲必要的信息到日志順序文件,后臺進程對已完成的順序文件做歸檔操作。②恢復(fù)過程中,通過歸檔文件和日志文件的信息恢復(fù)事務(wù)。

2.1 事務(wù)的正常階段

(1)事務(wù)的狀態(tài)及保存點

在OTS中,事務(wù)的惟一標識是事務(wù)標識。事務(wù)標識由三個字段的數(shù)據(jù)結(jié)構(gòu)表示:全局事務(wù)標識,用GtxID表示;分支事務(wù)標識,用BqualID表示;事務(wù)的格式標識,用FORMATID表示。由以上三個字段組成的事務(wù)標識可以惟一標識任何范圍內(nèi)分布式計算環(huán)境中的一個事務(wù)。

事務(wù)在其整個生命周期中存在以下的狀態(tài):活動事務(wù),正在準備的事務(wù),準備好的事務(wù),正在提交的事務(wù),已完成提交的事務(wù),正在回滾的事務(wù),已完成回滾的事務(wù),標記為回滾的事務(wù),出現(xiàn)啟發(fā)式異常的事務(wù)。

根據(jù)OTS規(guī)范的事務(wù)失敗假定回滾策略,所有在事務(wù)失敗時沒有決定提交或回滾的事務(wù),在恢復(fù)處理過程中都可以忽略。為了簡化事務(wù)失敗恢復(fù)的操作,提高交易中間件的事務(wù)處理能力,選取事務(wù)處理過程中的以下幾個關(guān)鍵點做為事務(wù)的保存點。在事務(wù)的生命周期中遇到事務(wù)的保存點,就必須在事務(wù)的日志文件中記錄下事務(wù)的相關(guān)信息程中使用。事務(wù)的保存點如下:PREPARED:二階段提交事務(wù)的準備階段正常完成后,事務(wù)管理器向各個資源發(fā)出提交命令之前;COMMIteD:事務(wù)提交正常完成之后;ROLLBACKED:事務(wù)回滾正常完成之后;UNKNOWN:事務(wù)出現(xiàn)HEURISTIC異常。在事務(wù)的保存點除了記錄事務(wù)的狀態(tài)信息以外,還需要記錄事務(wù)的標識信息??梢杂萌齻€值分別記錄事務(wù)的全局事務(wù)標識、分支事務(wù)標識及格式標識。

(2)日志文件的設(shè)計

日志文件以行數(shù)據(jù)作為結(jié)構(gòu)單元。一行數(shù)據(jù)包括以下幾列:第一列值表示全局事務(wù)標識;第二列值表示分支事務(wù)標識(BqualID);第三列值表示格式標識;第四列值表示事務(wù)保存點的狀態(tài);第五列值是行結(jié)束符。每個文件的行數(shù)可以配置為一個定值ROWMAX,寫滿了一個日志文件后,便可以開始寫下一個順序文件。

事務(wù)的處理進程在事務(wù)的保存點根據(jù)事務(wù)的信息添加一行記錄。每個日志文件長度達到ROWMAX行后,做一個標記,創(chuàng)建一個新的日志順序文件,并刷新事務(wù)進程的寫緩沖區(qū),開始在新的日志文件中記錄。

后臺單獨有一個線程對已寫滿的日志文件做歸檔操作。歸檔文件和日志文件的結(jié)構(gòu)是相同的,所有的日志文件歸檔后保存到一個歸檔文件中。日志文件歸檔完成后就刪除該日志文件或做歸檔完成標記。

事務(wù)寫日志的流程圖如圖1所示。

(3)其他優(yōu)化

為了提高寫日志的效率、減少系統(tǒng)資源的開銷,事務(wù)的狀態(tài)值可以用一個字節(jié)表示,事務(wù)的標識可以用定長個數(shù)的字節(jié)表示。

日志文件的同步寫操作在成千上萬的事務(wù)并發(fā)處理過程中,可能成為事務(wù)處理器的瓶頸。因此有必要同時開辟若干個寫緩沖區(qū)和若干個日志文件供不同的事務(wù)并發(fā)寫日志。

2.2 事務(wù)的恢復(fù)階段

(1)恢復(fù)方式

事務(wù)的恢復(fù)有二種可行的方式:

①事務(wù)管理器恢復(fù)并發(fā)送結(jié)果到資源。資源不用主動參與恢復(fù)過程,只是正常的提交或回滾命令被觸發(fā)。

②資源沒有發(fā)現(xiàn)事務(wù)結(jié)果傳遞過來,就發(fā)請求到事務(wù)管理器。事務(wù)管理器恢復(fù)RecoveryCoordinator對象,資源通過該對象的replay_completion()方法請求獲得事務(wù)結(jié)果,如果不能獲得結(jié)果信息,則回滾事務(wù),否則按獲得的結(jié)果完成事務(wù)。

為了事務(wù)的完整性,OTS在恢復(fù)時,既要恢復(fù)RecoveryCoordinator對象,又要根據(jù)日志中事務(wù)的狀態(tài)向注冊的資源發(fā)送commit()或rollback()命令。

(3)事務(wù)恢復(fù)

事務(wù)恢復(fù)根據(jù)以下規(guī)則進行:所有活動的事務(wù)都必須恢復(fù),所有已經(jīng)準備提交的事務(wù)都提交,所有已經(jīng)準備回滾的事務(wù)都回滾,所有狀態(tài)未知的事務(wù)都回滾。

事務(wù)發(fā)生失敗后,在交易中間件重啟時要做恢復(fù)操作。首先讀取失敗時日志目錄下所有未來得及歸檔的日志文件,再讀取歸檔文件中的內(nèi)容。恢復(fù)過程如圖2所示。

讀取日志文件和歸檔文件后,要根據(jù)以下算法篩選出失敗時沒有完成的事務(wù)。下面是篩選算法的Java原語:

  if(Log.decision==COMMITED || Log.decision

  ==ROLLEDBACK){

  //忽略這些事務(wù)

  }

  if(Log.decision==UNKNOWN)

  //日志文件中存在需要重新提交的事務(wù),重啟Coordinator,

  //發(fā)出提交命令

  //重啟該事務(wù)

  Restart(tx)

  //回滾事務(wù)

  tx.rollback();

  }

  if(Log.decision==DECISION_TO_ROLLBACK)

  //日志文件中存在需要回滾的事務(wù),重啟Coordinator,發(fā)出

  //回滾命令

  //重啟該事務(wù)

  Restart(tx)

  //回滾事務(wù)

  tx.rollback();

  if(Log.decision==DECISION_TO_COMMIT)

  //日志文件中存在需要回滾的事務(wù),重啟Coordinator,發(fā)出

  //回滾命令

  //重啟該事務(wù)

  Restart(tx)

  //提交事務(wù)

  tx.commit();

2.3 系統(tǒng)的模型結(jié)構(gòu)

(1)系統(tǒng)模型主要由四個對象組成:①日志文件操作對象。該對象保證事務(wù)管理器所有進程共享寫日志文件和寫緩沖區(qū)。通過該對象,格式化日志的行數(shù)據(jù)并寫入日志文件,讀出日志文件的數(shù)據(jù)并解析行數(shù)據(jù),刪除滿足條件的行數(shù)據(jù)等。②日志管理對象。③日志歸檔對象。后臺線程定時歸檔日志文件。從日志文件和歸檔文件中篩選出未完成的事務(wù)記錄,更新到歸檔文件中。④日志恢復(fù)對象。事務(wù)管理器重啟時,讀取歸檔文件和未來得及歸檔的日志文件的內(nèi)容,恢復(fù)日志中未完成的事務(wù)。

(2)模型結(jié)構(gòu)

系統(tǒng)的模型結(jié)構(gòu)如圖3所示。

3  結(jié)  論

依據(jù)OMG組織的OTS規(guī)范,本文分析了分布式事務(wù)的恢復(fù)處理過程,并實現(xiàn)了該系統(tǒng)在交易中間件的應(yīng)用。它不僅適合于一般的事務(wù)失敗恢復(fù),而且保證了事務(wù)失敗情況下的事務(wù)完整性和一致性。在操作日志文件時利用格式化的行數(shù)據(jù)的優(yōu)越性,可以減少事務(wù)處理過程中持久化事務(wù)相關(guān)信息占用的系統(tǒng)資源,提高交易中間件事務(wù)處理的效率。由于事務(wù)失敗的絕對性存在,建立事務(wù)失敗的分布式組件模型,明確各組件在事務(wù)恢復(fù)過程的職責,協(xié)調(diào)好各組件參與事務(wù)的恢復(fù)處理。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉