當前位置:首頁 > 芯聞號 > 充電吧
[導讀]1.基本架構?2.ZAB協(xié)議?? ZooKeeper并沒有完全采用Paxos算法,而是使用了一種稱為ZooKeeper Atomic Broadcast(ZAB,zookeeper原子消息廣播協(xié)議)的

1.基本架構

?2.ZAB協(xié)議

?? ZooKeeper并沒有完全采用Paxos算法,而是使用了一種稱為ZooKeeper Atomic Broadcast(ZAB,zookeeper原子消息廣播協(xié)議)的協(xié)議作為其數(shù)據(jù)一致性的核心算法。

??? 2.1選擇Leader需用半數(shù)通過才選舉成成功,同時集群中已經(jīng)有過半的機器與該Leader服務器完成狀態(tài)同步(數(shù)據(jù)同步)才能開始服務。

??? 2.2所有事務請求必須由一個全局唯一的服務器來協(xié)調(diào)處理,這樣的服務器稱為Leader服務器,而余下的其他服務器則成為Follower服務器。Leader服務器負責將一個客戶端事務請求轉(zhuǎn)換成一個事務Proposal(提議),并將該Proposal分發(fā)給集群中所有的Follower服務器。之后Leader服務器需要等待所有Follower服務器的反饋,一旦超過半數(shù)的Follower服務器進行了正確反饋后,那么Leader就會再次向所有的Follower服務器分發(fā)Commit消息,要求其將前一個Proposal進行提交。

3.Leader和Follower啟動過程

4.請求處理

?? 4.1請求處理鏈

????? 4.1.1leader請求處理鏈

????? 4.1.2follower請求處理鏈

??? 4.2處理流程

??? 以creater服務端為leade為例流程如下

???? FollowerZooKeeperServer與LeaderZooKeeperServer處理流程的差別是FollowerRequestProcessor會將事務請求轉(zhuǎn)發(fā)給leader,SendAckRequestProcessor向leader返回事務提議正確的響應,其他的處理鏈都是一致的。SendAckRequestProcessor和AckRequestProcessor的區(qū)別是AckRequestProcessor是leader的本地調(diào)用。FollowerRequestProcessor的事務請求的代碼如下

Java代碼 public?void?run()?{?????????try?{?????????????while?(!finished)?{?????????????????Request?request?=?queuedRequests.take();?????????????????if?(LOG.isTraceEnabled())?{?????????????????????ZooTrace.logRequest(LOG,?ZooTrace.CLIENT_REQUEST_TRACE_MASK,?????????????????????????????'F',?request,?"");?????????????????}?????????????????if?(request?==?Request.requestOfDeath)?{?????????????????????break;?????????????????}?????????????????//?We?want?to?queue?the?request?to?be?processed?before?we?submit?????????????????//?the?request?to?the?leader?so?that?we?are?ready?to?receive?????????????????//?the?response?????????????????nextProcessor.processRequest(request);??????????????????????????????????//?We?now?ship?the?request?to?the?leader.?As?with?all?????????????????//?other?quorum?operations,?sync?also?follows?this?code?????????????????//?path,?but?different?from?others,?we?need?to?keep?track?????????????????//?of?the?sync?operations?this?follower?has?pending,?so?we?????????????????//?add?it?to?pendingSyncs.?????????????????switch?(request.type)?{?????????????????case?OpCode.sync:?????????????????????zks.pendingSyncs.add(request);?????????????????????zks.getFollower().request(request);?????????????????????break;?????????????????case?OpCode.create:?????????????????case?OpCode.delete:?????????????????case?OpCode.setData:?????????????????case?OpCode.setACL:?????????????????case?OpCode.createSession:?????????????????case?OpCode.closeSession:?????????????????case?OpCode.multi:?????????????????????zks.getFollower().request(request);?????????????????????break;?????????????????}?????????????}?????????}?catch?(Exception?e)?{?????????????LOG.error("Unexpected?exception?causing?exit",?e);?????????}?????????LOG.info("FollowerRequestProcessor?exited?loop!");?????}??

5.數(shù)據(jù)同步

??? ZooKeeper集群數(shù)據(jù)同步分為4類,分別為直接差異化同步(DIFF)、先回滾再差異化同步(TRUNC+DIFF)、回滾同步(TRUNC)和全量同步(SNAP)。在同步之前,leader服務器先對peerLastZxid(該leader服務器最好處理的ZXID)、minCommittedLog(leader服務器提議緩存隊列committedLog中的最小ZXID)、maxCommittedLog(leader服務器提議緩存隊列committedLog中的最大ZXID)進行初始化,然后通過這3個ZXID值進行判斷同步類型,并進行同步。代碼見LearnerHandler的run方法:

Java代碼 .....??long?peerLastZxid;??StateSummary?ss?=?null;??long?zxid?=?qp.getZxid();??long?newEpoch?=?leader.getEpochToPropose(this.getSid(),?lastAcceptedEpoch);????if?(this.getVersion()?<?0x10000)?{??????//?we?are?going?to?have?to?extrapolate?the?epoch?information??????long?epoch?=?ZxidUtils.getEpochFromZxid(zxid);??????ss?=?new?StateSummary(epoch,?zxid);??????//?fake?the?message??????leader.waitForEpochAck(this.getSid(),?ss);??}?else?{??????byte?ver[]?=?new?byte[4];??????ByteBuffer.wrap(ver).putInt(0x10000);??????QuorumPacket?newEpochPacket?=?new?QuorumPacket(Leader.LEADERINFO,?ZxidUtils.makeZxid(newEpoch,?0),?ver,?null);??????oa.writeRecord(newEpochPacket,?"packet");??????bufferedOutput.flush();??????QuorumPacket?ackEpochPacket?=?new?QuorumPacket();??????ia.readRecord(ackEpochPacket,?"packet");??????if?(ackEpochPacket.getType()?!=?Leader.ACKEPOCH)?{??????????LOG.error(ackEpochPacket.toString()??????????????????+?"?is?not?ACKEPOCH");??????????return;????????ByteBuffer?bbepoch?=?ByteBuffer.wrap(ackEpochPacket.getData());??????ss?=?new?StateSummary(bbepoch.getInt(),?ackEpochPacket.getZxid());??????leader.waitForEpochAck(this.getSid(),?ss);??}??peerLastZxid?=?ss.getLastZxid();????/*?the?default?to?send?to?the?follower?*/??int?packetToSend?=?Leader.SNAP;??long?zxidToSend?=?0;??long?leaderLastZxid?=?0;??/**?the?packets?that?the?follower?needs?to?get?updates?from?**/??long?updates?=?peerLastZxid;????/*?we?are?sending?the?diff?check?if?we?have?proposals?in?memory?to?be?able?to???*?send?a?diff?to?the???*/???ReentrantReadWriteLock?lock?=?leader.zk.getZKDatabase().getLogLock();??ReadLock?rl?=?lock.readLock();??try?{??????rl.lock();??????????????final?long?maxCommittedLog?=?leader.zk.getZKDatabase().getmaxCommittedLog();??????final?long?minCommittedLog?=?leader.zk.getZKDatabase().getminCommittedLog();??????LOG.info("Synchronizing?with?Follower?sid:?"?+?sid??????????????+"?maxCommittedLog=0x"+Long.toHexString(maxCommittedLog)??????????????+"?minCommittedLog=0x"+Long.toHexString(minCommittedLog)??????????????+"?peerLastZxid=0x"+Long.toHexString(peerLastZxid));????????LinkedList

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術學會聯(lián)合牽頭組建的NVI技術創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術創(chuàng)新聯(lián)...

關鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術
關閉
關閉