當(dāng)前位置:首頁(yè) > 芯聞號(hào) > 美通社全球TMT
[導(dǎo)讀] (全球TMT2022年6月17日訊)日前,在由存儲(chǔ)產(chǎn)業(yè)技術(shù)創(chuàng)新聯(lián)盟主辦的"元宇宙存儲(chǔ)研究與實(shí)踐"開(kāi)放計(jì)算技術(shù)沙龍上,來(lái)自中科大、華中大、鄭州大學(xué)以及浪潮存儲(chǔ)的"產(chǎn)學(xué)研用"各界專家匯聚一堂,在關(guān)注元宇宙存儲(chǔ)發(fā)展的同時(shí),還共同就糾刪碼優(yōu)化、細(xì)粒度感知等數(shù)據(jù)保護(hù)話題展開(kāi)討論。本次沙龍...

(全球TMT2022年6月17日訊)日前,在由存儲(chǔ)產(chǎn)業(yè)技術(shù)創(chuàng)新聯(lián)盟主辦的"元宇宙存儲(chǔ)研究與實(shí)踐"開(kāi)放計(jì)算技術(shù)沙龍上,來(lái)自中科大、華中大、鄭州大學(xué)以及浪潮存儲(chǔ)的"產(chǎn)學(xué)研用"各界專家匯聚一堂,在關(guān)注元宇宙存儲(chǔ)發(fā)展的同時(shí),還共同就糾刪碼優(yōu)化、細(xì)粒度感知等數(shù)據(jù)保護(hù)話題展開(kāi)討論。本次沙龍是場(chǎng)景共同體戰(zhàn)略的承襲和實(shí)踐,浪潮信息存儲(chǔ)產(chǎn)品線總經(jīng)理李輝曾提出,面向?qū)映霾桓F的新應(yīng)用、新場(chǎng)景,攜手產(chǎn)業(yè)鏈伙伴推進(jìn)"平臺(tái)+生態(tài)"戰(zhàn)略,以六種模式加速企業(yè)數(shù)字轉(zhuǎn)型。

以元宇宙為代表的新應(yīng)用帶來(lái)數(shù)據(jù)規(guī)模十倍、百倍激增,快速增長(zhǎng)的多模態(tài)數(shù)據(jù)增加了企業(yè)數(shù)據(jù)保護(hù)的難度。數(shù)據(jù)顯示,企業(yè)現(xiàn)在管理的數(shù)據(jù)量是五年前的十倍以上,全球82%、中國(guó)88%的IT決策者擔(dān)心現(xiàn)有數(shù)據(jù)保護(hù)方案無(wú)法滿足未來(lái)業(yè)務(wù)挑戰(zhàn)。數(shù)據(jù)保護(hù),已然成為擺在企業(yè)數(shù)字化轉(zhuǎn)型面前的一大挑戰(zhàn)。本次沙龍,中國(guó)科學(xué)技術(shù)大學(xué)許胤龍教授以及浪潮存儲(chǔ)技術(shù)專家共同給出了答案。

數(shù)據(jù)容錯(cuò)  業(yè)界兩種技術(shù)流派之爭(zhēng)

"數(shù)據(jù)容錯(cuò),業(yè)界通常有兩種辦法,一種是多副本,另一種是糾刪碼",許胤龍教授表示。多副本訪問(wèn)性能高、故障修復(fù)快,但存儲(chǔ)開(kāi)銷比較大(燒錢、占地),令企業(yè)直呼吃不消;糾刪碼開(kāi)銷?。ɑㄐ″X、辦大事),一般存儲(chǔ)空間比RAID 1鏡像小,在數(shù)據(jù)爆炸式增長(zhǎng)的趨勢(shì)下更受市場(chǎng)歡迎,企業(yè)用腳投票紛紛選擇了糾刪碼。

三副本和糾刪碼對(duì)比
三副本和糾刪碼對(duì)比

時(shí)下人氣攀升的糾刪碼,究竟是什么呢? 所謂糾刪碼(Erasure Coding),是一種數(shù)據(jù)保護(hù)方法,它將數(shù)據(jù)分割成片段,把冗余數(shù)據(jù)塊擴(kuò)展、編碼,并將其存儲(chǔ)在不同位置,比如硬盤、存儲(chǔ)節(jié)點(diǎn)或其他物理位置。

"糾刪碼,可以簡(jiǎn)單理解成對(duì)原始數(shù)據(jù)做線性組合",許胤龍教授表示。比如 (2+2) 糾刪碼,就是A、B兩個(gè)數(shù)據(jù)可以做A+B和A+2B的線性組合,能容任意兩個(gè)節(jié)點(diǎn)錯(cuò),當(dāng)恢復(fù)數(shù)據(jù)的時(shí)候直接解方程就行。一般情況下,業(yè)界常用的是(k,m)-MDS碼,把k個(gè)數(shù)據(jù)編碼成m個(gè)校驗(yàn)數(shù)據(jù),k+m個(gè)數(shù)據(jù)塊形成一個(gè)條帶,最多可以容許m個(gè)塊同時(shí)故障。工業(yè)界常見(jiàn)的m一般是2或3,數(shù)據(jù)規(guī)模較大的話,可以把m設(shè)為4~6。

糾刪碼 跑得如絲般順滑并非易事

糾刪碼"花小錢、辦大事"的優(yōu)勢(shì)雖然非常明顯,但要在超大規(guī)模數(shù)據(jù)中心內(nèi)或者是跨數(shù)據(jù)中心使用糾刪碼做數(shù)據(jù)保護(hù),卻需要過(guò)五關(guān)闖六將,絕非易事。

第一關(guān):同一數(shù)據(jù)中心內(nèi),數(shù)據(jù)恢復(fù)的網(wǎng)絡(luò)傳輸時(shí)間占比超90%,糾刪碼"龜速"難題如何破。

糾刪碼能夠降低存儲(chǔ)成本、提高容錯(cuò)能力,但糾刪碼最大的問(wèn)題是在數(shù)據(jù)丟失之后,數(shù)據(jù)恢復(fù)過(guò)程需要從其他地方讀取大量數(shù)據(jù),故障修復(fù)堪稱龜速。通過(guò)對(duì)糾刪碼"從存活節(jié)點(diǎn)讀取數(shù)據(jù)、傳輸、在備份節(jié)點(diǎn)解碼、傳輸、在替代節(jié)點(diǎn)寫(xiě)入"的整個(gè)流程做分析,發(fā)現(xiàn)網(wǎng)絡(luò)傳輸占整個(gè)數(shù)據(jù)恢復(fù)時(shí)間的比例超90%,如何優(yōu)化數(shù)據(jù)恢復(fù)時(shí)間呢?

首先,數(shù)據(jù)分批恢復(fù)。在實(shí)際系統(tǒng)里面,數(shù)據(jù)塊是隨機(jī)的分布到不同的節(jié)點(diǎn)里,隨機(jī)數(shù)據(jù)分布從統(tǒng)計(jì)概率的角度來(lái)說(shuō),是能達(dá)到負(fù)載均衡的。但一般來(lái)說(shuō),在系統(tǒng)實(shí)現(xiàn)的時(shí)候,一般來(lái)說(shuō)因?yàn)橄到y(tǒng)IO、內(nèi)存、CPU資源也有限,同時(shí)系統(tǒng)還要支撐前臺(tái)的應(yīng)用綜合各方面,所以修復(fù)一般都會(huì)是分批進(jìn)行。"我們做過(guò)實(shí)驗(yàn),分批比不分批大概要快15%左右",許教授表示。

清華、港中大、普渡、中科大紛紛開(kāi)展糾刪碼優(yōu)化研究
清華、港中大、普渡、中科大紛紛開(kāi)展糾刪碼優(yōu)化研究

其次,可以利用二部圖和網(wǎng)絡(luò)流圖的辦法,使得從不同的節(jié)點(diǎn)上進(jìn)行恢復(fù)的時(shí)候,不同節(jié)點(diǎn)上讀數(shù)據(jù)量是均衡的,寫(xiě)數(shù)據(jù)量也是均衡的,并且每一個(gè)節(jié)點(diǎn)承擔(dān)的恢復(fù)任務(wù)也是均衡的。清華、港中大、普渡、中科大等高校均對(duì)糾刪碼技術(shù)進(jìn)行了研究,經(jīng)過(guò)優(yōu)化中科大SelectiveEC技術(shù)能夠在90%以上的情況下都實(shí)現(xiàn)負(fù)載均衡,相比HDFS大約50%的負(fù)載均衡水平,中科大的負(fù)載均衡水平能高出70%以上,恢復(fù)速度提升30%以上。同時(shí)Selective EC比HDFS有更少的毛刺、更短的長(zhǎng)尾、更短的任務(wù)生命周期。

糾刪碼優(yōu)化結(jié)果
糾刪碼優(yōu)化結(jié)果

"我們很認(rèn)同許教授的觀點(diǎn),為了實(shí)現(xiàn)數(shù)據(jù)糾刪的負(fù)載均衡,浪潮存儲(chǔ)一直在技術(shù)上不斷打磨和創(chuàng)新",浪潮信息分布式存儲(chǔ)架構(gòu)師張立強(qiáng)表示。浪潮分布式存儲(chǔ)AS13000突破軟硬件協(xié)同寬條帶糾刪技術(shù),融合多元算力,解決數(shù)據(jù)高冗余比糾刪的計(jì)算性能、資源消耗、容量、可靠性等指標(biāo)難以兼顧的問(wèn)題。舉個(gè)例子,浪潮存儲(chǔ)創(chuàng)新研制了糾刪碼FPGA加速卡,設(shè)計(jì)可重構(gòu)最小硬件邏輯單元,實(shí)現(xiàn)編解碼復(fù)用、全糾刪比支持,實(shí)現(xiàn)寬條帶糾刪的CPU計(jì)算卸載。在32+6糾刪比配置下,浪潮存儲(chǔ)能夠?qū)⑻幚砥髌脚_(tái)的CPU占用率降低90%,性能提升390%,這就如同將汽車行駛的速度提升到了復(fù)興號(hào)的水平。其實(shí)浪潮分布式存儲(chǔ)在高校領(lǐng)域應(yīng)用廣泛,目前已經(jīng)在中科大、清華、北大、復(fù)旦、浙大、中山大學(xué)等國(guó)內(nèi)高校實(shí)現(xiàn)規(guī)?;渴?,支撐科研智慧應(yīng)用平臺(tái)穩(wěn)定運(yùn)行,以數(shù)據(jù)之力助力科研取得豐碩成果。

第二關(guān):跨數(shù)據(jù)中心場(chǎng)景,數(shù)據(jù)中心帶寬極其有限,如何"跨越萬(wàn)水千山"做糾刪。

考慮到地震、山洪、火災(zāi)等災(zāi)害因素影響,大型企業(yè)往往會(huì)跨數(shù)據(jù)中心做數(shù)據(jù)保護(hù)。所謂跨數(shù)據(jù)中心,是指多個(gè)數(shù)據(jù)中心可能建在距離城區(qū)比較遠(yuǎn)的地方或者是不同的城區(qū)的地方,這時(shí)候跨數(shù)據(jù)中心的帶寬就會(huì)很寶貴,通常跟數(shù)據(jù)中心內(nèi)部的帶寬相比,跨數(shù)據(jù)中心帶寬只有1/20。

跨數(shù)據(jù)中心帶寬約為數(shù)據(jù)中心內(nèi)帶寬的1/20
跨數(shù)據(jù)中心帶寬約為數(shù)據(jù)中心內(nèi)帶寬的1/20

RS碼部署方式在同一數(shù)據(jù)中心內(nèi)做糾刪是有優(yōu)勢(shì)的,但在跨數(shù)據(jù)中心環(huán)境下卻面臨挑戰(zhàn)。這是因?yàn)镽S碼是把一個(gè)條帶的數(shù)據(jù)均勻分布到不同數(shù)據(jù)中心去。假如現(xiàn)在有15個(gè)數(shù)據(jù)塊,把它編碼成12個(gè)校驗(yàn)塊,分散在三個(gè)數(shù)據(jù)中心,這時(shí)候只能容單個(gè)數(shù)據(jù)中心故障,存儲(chǔ)開(kāi)銷大概是180%,如果出現(xiàn)單塊故障,需要跨數(shù)據(jù)中心訪問(wèn)7個(gè)數(shù)據(jù)塊,需要的帶寬開(kāi)銷比較多。

新型LRC(Locally Repairable Code)分組編碼方式,可以在存儲(chǔ)開(kāi)銷和恢復(fù)性能之間做一個(gè)權(quán)衡。LRC(k,l,g)分組編碼有三個(gè)值,k表示數(shù)據(jù)塊,l代表局部校驗(yàn)塊,g是全局校驗(yàn)塊。LRC分組編碼通過(guò)讀取局部數(shù)據(jù)塊,減少重構(gòu)所需的數(shù)據(jù)量,從而提升數(shù)據(jù)修復(fù)性能。這就好比618購(gòu)物,北京小伙買一箱牛奶,如何用最快的速度把貨物送到顧客手里呢,電商平臺(tái)會(huì)找到距離顧客比較近的天津或河北倉(cāng)庫(kù)(類似l局部校驗(yàn)塊)進(jìn)行配送,盡量減少?gòu)奈靼不驈V州(類似g全局校驗(yàn)塊)調(diào)貨的概率。

LRC分組編碼技術(shù)優(yōu)化結(jié)果
LRC分組編碼技術(shù)優(yōu)化結(jié)果

按照新型部署方式,"在實(shí)際集群里面,我們實(shí)現(xiàn)了數(shù)據(jù)傳輸、數(shù)據(jù)解碼的優(yōu)化,大概能把速度提升30%",許胤龍教授表示。

"浪潮一直將可靠性視為存儲(chǔ)的生命線,在異地?cái)?shù)據(jù)保護(hù)方面做了諸多創(chuàng)新",浪潮信息存儲(chǔ)研發(fā)部何營(yíng)表示。浪潮存儲(chǔ)不僅基于一套存儲(chǔ)架構(gòu)承載塊、文件、對(duì)象、大數(shù)據(jù)等多種數(shù)據(jù)服務(wù),在WAN加速、快速重構(gòu)、透明故障切換等高級(jí)功能方面持續(xù)創(chuàng)新。以WAN廣域網(wǎng)加速技術(shù)為例,浪潮存儲(chǔ)通過(guò)數(shù)據(jù)流壓縮、固定塊切割和多數(shù)據(jù)流并發(fā),將遠(yuǎn)程傳輸性能提升高達(dá)10倍、延時(shí)降低10倍,幫助海量數(shù)據(jù)異地遷徙和災(zāi)備。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉