當(dāng)前位置:首頁(yè) > 嵌入式 > 嵌入式硬件
[導(dǎo)讀]與管理傳統(tǒng)的大型數(shù)據(jù)基礎(chǔ)設(shè)施相比,管理與大數(shù)據(jù)相關(guān)的拍字節(jié)級(jí)數(shù)據(jù)存儲(chǔ)是一種全新的方式。目前在線照片分享網(wǎng)站Shutterfly管理著30拍字節(jié)的數(shù)據(jù)。Shutterfly在這里與我們

與管理傳統(tǒng)的大型數(shù)據(jù)基礎(chǔ)設(shè)施相比,管理與大數(shù)據(jù)相關(guān)的拍字節(jié)級(jí)數(shù)據(jù)存儲(chǔ)是一種全新的方式。目前在線照片分享網(wǎng)站Shutterfly管理著30拍字節(jié)的數(shù)據(jù)。Shutterfly在這里與我們分享了他們馴服“數(shù)據(jù)野獸”的經(jīng)驗(yàn)。

目前,每個(gè)人都在談?wù)摯髷?shù)據(jù)分析方法和相關(guān)的商務(wù)智能成果。但是在公司能夠利用這些數(shù)據(jù)前,他們必須想辦法解決存儲(chǔ)問(wèn)題。管理拍字節(jié)級(jí)甚至更大規(guī)模的數(shù)據(jù)存儲(chǔ)與管理傳統(tǒng)大型數(shù)據(jù)集有著本質(zhì)的區(qū)別。

Shutterfly為一家在線照片分享網(wǎng)站。他們并不限制用戶存儲(chǔ)照片的數(shù)量,并且允許用戶存儲(chǔ)原始分辨率的照片,用戶在存儲(chǔ)時(shí)可以不用降低照片的分辨率。Shutterfly還曾承諾永遠(yuǎn)不會(huì)刪除任何照片。

Shutterfly 高級(jí)副總裁兼首席技術(shù)官Neil Day稱:“我們的照片存檔大小已經(jīng)超過(guò)了30拍字節(jié)。存儲(chǔ)池的增長(zhǎng)速度遠(yuǎn)遠(yuǎn)高于用戶群的增長(zhǎng)速度。在我們吸引到客戶后,他們做的第一件事就是向我們上傳大量照片。在他們喜歡上我們之后,他們做的第一件事就是再次上傳大量照片。”

為了有一個(gè)直觀的印象,大家可以想像一下,1拍字節(jié)等于100太字節(jié),等于1百萬(wàn)吉字節(jié)。美國(guó)宇航局哈勃太空望遠(yuǎn)鏡前20年的觀測(cè)數(shù)據(jù)存檔也僅為45太字節(jié)多一點(diǎn)。以128 kB/s速率壓縮的1太字節(jié)音頻數(shù)據(jù)可以存儲(chǔ)17000小時(shí)的音頻。

拍字節(jié)級(jí)基礎(chǔ)設(shè)施的特點(diǎn)

Day稱:“拍字節(jié)級(jí)基礎(chǔ)設(shè)施與傳統(tǒng)存儲(chǔ)設(shè)施完全不同。建立和維護(hù)它們非常困難。與傳統(tǒng)大型數(shù)據(jù)集的管理壓力相比,一個(gè)拍字節(jié)或多個(gè)拍字節(jié)基礎(chǔ)設(shè)施的管理壓力完全是天壤之別。它們之間的差異就如同在筆記本電腦上處理數(shù)據(jù)和在RAID陣列上處理數(shù)據(jù)一樣。”

Day在2009年進(jìn)入Shutterfly網(wǎng)站。當(dāng)時(shí)存儲(chǔ)已經(jīng)成為了公司最大的開(kāi)銷,并且這一開(kāi)銷仍然在飛速地增長(zhǎng)。這些開(kāi)銷的增長(zhǎng)速度并不是根據(jù)原始容量的增長(zhǎng)速度而增長(zhǎng),而是根據(jù)員工數(shù)量的增長(zhǎng)速度而增長(zhǎng)。

Day 稱:“存儲(chǔ)每增長(zhǎng)n個(gè)拍字節(jié)就意味著我們需要增加一名存儲(chǔ)管理員,以及相應(yīng)的物理和邏輯基礎(chǔ)設(shè)施。有了這些大型存儲(chǔ),數(shù)據(jù)量不斷創(chuàng)下新高。實(shí)際管理這些大型存檔的人必須不斷的解決硬件故障問(wèn)題。每個(gè)人都想解決這一基本問(wèn)題,因?yàn)榇蠹叶记宄脖P方面的任何一個(gè)故障都會(huì)導(dǎo)致服務(wù)中斷。那么你如何確保數(shù)據(jù)能夠被持續(xù)獲取,如何保證性能不會(huì)下降?”

擴(kuò)展RAID是一個(gè)棘手的問(wèn)題

失效備援的標(biāo)準(zhǔn)解決方案是進(jìn)行復(fù)制,通常是以RAID陣列的形式進(jìn)行。但是如果規(guī)模龐大,那么RAID產(chǎn)生的問(wèn)題將比解決的問(wèn)題更多。在傳統(tǒng)的 RAID數(shù)據(jù)存儲(chǔ)方案中,為了保證完整性和可用性,每個(gè)數(shù)據(jù)的拷貝都會(huì)被做成鏡像,存儲(chǔ)在不同的磁盤陣列上。不過(guò),這也意味著每份被存儲(chǔ)和被做成鏡像的數(shù)據(jù)將導(dǎo)致存儲(chǔ)容量膨脹五倍。隨著RAID陣列中的磁盤容量越來(lái)越大,將故障磁盤中的內(nèi)容恢復(fù)到新磁盤上所需要的時(shí)間也越來(lái)越長(zhǎng)。

Day 稱:“實(shí)際上,我們?cè)赗AID上并沒(méi)有遇到操作問(wèn)題。我們遇到的問(wèn)題是,磁盤容量越來(lái)越大,如果磁盤組件出現(xiàn)故障,切換至冗余系統(tǒng)的時(shí)間將越來(lái)越長(zhǎng)。奇偶校驗(yàn)與生成的數(shù)據(jù)集的大小是成正比的。目前我們已經(jīng)開(kāi)始在基礎(chǔ)設(shè)施中使用1太字節(jié)和2太字節(jié)的磁盤,這導(dǎo)致切換到冗余系統(tǒng)的時(shí)間更長(zhǎng)。目前的發(fā)展趨勢(shì)并沒(méi)有朝著正確的方向發(fā)展。”

可靠性和可用性對(duì)于Shutterfly來(lái)說(shuō)非常關(guān)鍵,這也是企業(yè)級(jí)存儲(chǔ)的需求。Day稱,快速增長(zhǎng)的存儲(chǔ)成本使得商品化服務(wù)越來(lái)越具有吸引力。在 Day和他的團(tuán)隊(duì)對(duì)一些能夠讓Shutterfly控制成本的潛在技術(shù)解決方案進(jìn)行投資的過(guò)程中,他們接觸到了一種名為糾刪碼的技術(shù)。這一技術(shù)引起了他們的興趣。

利用糾刪碼創(chuàng)建下一代存儲(chǔ)

Reed-Solomon糾刪碼最初是作為前身糾錯(cuò)(FEC)代碼,用于在不可靠的信道中發(fā)送數(shù)據(jù),例如深空探測(cè)任務(wù)中的數(shù)據(jù)傳輸。這一技術(shù)還被廣泛的應(yīng)用在CD和DVD上,以處理灰塵和劃痕等光盤損傷問(wèn)題。目前幾家存儲(chǔ)廠商已經(jīng)開(kāi)始展開(kāi)合作,將糾刪碼整合到他們的解決方案中。通過(guò)糾刪碼,數(shù)據(jù)段能夠被分解為多個(gè)小塊,每一小塊數(shù)據(jù)本身都是沒(méi)用的。然后,這些數(shù)據(jù)塊被分散到不同的硬盤上或是服務(wù)器上。只需要部分?jǐn)?shù)據(jù)塊,數(shù)據(jù)就能夠隨時(shí)被重新恢復(fù),甚至當(dāng)硬盤故障導(dǎo)致多個(gè)數(shù)據(jù)塊丟失后,數(shù)據(jù)仍然能夠被完整地拼湊起來(lái)。換句話說(shuō),你不再需要?jiǎng)?chuàng)建多份數(shù)據(jù)拷貝,單個(gè)實(shí)例就能夠保證數(shù)據(jù)的完整性和可用性。

總部位于芝加哥的Cleversaf公司是較早涉足糾刪碼解決方案的廠商之一。該公司還通過(guò)增加存儲(chǔ)單元信息研發(fā)出了分散碼技術(shù)。該技術(shù)允許用戶在地理位置上相互獨(dú)立的地方,如在多個(gè)數(shù)據(jù)中心上存儲(chǔ)數(shù)據(jù)塊、或是片段。

由于每個(gè)片斷在數(shù)學(xué)意義上都是無(wú)用的,這使得其具有私密性和安全性。與RAID需要多份拷貝不同,信息分散技術(shù)僅使用一個(gè)單個(gè)實(shí)例數(shù)據(jù),并且為了確保數(shù)據(jù)的完整性和可用性只進(jìn)行了最低限制的擴(kuò)展,因此公司可能節(jié)省90%的存儲(chǔ)成本。

Cleversafe 公司產(chǎn)品策略、營(yíng)銷和客戶解決方案副總裁Russ Kennedy稱:“在重新將數(shù)據(jù)塊拼湊在一起時(shí),你不必?fù)碛忻恳粋€(gè)數(shù)據(jù)塊。所生成的全部數(shù)據(jù)塊的數(shù)量我們稱之為廣度,恢復(fù)數(shù)據(jù)所需要的最低限度的數(shù)據(jù)塊,我們稱之為閾值。這兩者之間的差異決定了數(shù)據(jù)的可靠性。當(dāng)你同時(shí)丟失了節(jié)點(diǎn)和硬盤后,你仍然能夠恢復(fù)原始的數(shù)據(jù)。在RAID中你能夠獲得的最高的可靠性是雙奇偶校驗(yàn),你可以丟失兩塊硬盤。但是在我們的解決方案中,你可以丟失最多六塊硬盤。”

糾刪碼是一項(xiàng)以軟件為基礎(chǔ)的技術(shù),這意味著該技術(shù)可以使用商用硬件,進(jìn)一步壓縮擴(kuò)展成本。

創(chuàng)建下一代存儲(chǔ)基礎(chǔ)設(shè)施

Day稱:“在找到了合適的技術(shù)后,我們將關(guān)注提供這種技術(shù)解決方案的廠商。同時(shí),我們還關(guān)注如何創(chuàng)建它們。我們認(rèn)為,如果能夠找到一家能夠滿足我們需求的公司,并且他們的系統(tǒng)已經(jīng)經(jīng)過(guò)了實(shí)踐檢驗(yàn),那么對(duì)于我們來(lái)說(shuō)是再好不過(guò)的了。”

Shutterfly讓四家廠商為他們?cè)u(píng)估和創(chuàng)建其數(shù)據(jù)中心所需要的存儲(chǔ)設(shè)備原型。Day稱,他們關(guān)注的重點(diǎn)是性能、可用性、容錯(cuò)性和可管理性。

他解釋稱:“我們有專門的人員管理照片存檔。我們?cè)?010年最大的一個(gè)顧慮是照片存檔越來(lái)越大。隨著存檔的日益增長(zhǎng),我們不得不增加管理人員的數(shù)量。這讓我們感到很頭疼。”[!--empirenews.page--]

Day稱,Cleversafe的出現(xiàn)讓Shutterfly遇到了救星,該公司也希望與Shutterfly合作,為Shutterfly量身訂做解決方案。他們對(duì)這一新概念進(jìn)行了仔細(xì)驗(yàn)證,包括在Shutterfly實(shí)驗(yàn)室中進(jìn)行上傳和性能測(cè)試。在Shutterfly對(duì)運(yùn)行和性能感到滿意后,Cleversafe推出了一款平行存儲(chǔ)基礎(chǔ)設(shè)施,同時(shí)公司將Shutterfly所有流量的一份拷貝引導(dǎo)至這一基礎(chǔ)設(shè)施上。

Day 稱:“每一份上傳的照片都被同時(shí)存儲(chǔ)在我們的老式基礎(chǔ)設(shè)施上和Cleversafe的基礎(chǔ)設(shè)施上。當(dāng)時(shí)我們運(yùn)行了六個(gè)月的時(shí)間,包括節(jié)假日。”節(jié)假日對(duì)于Shutterfly來(lái)說(shuō)是使用高峰期,許多用戶都會(huì)創(chuàng)建相冊(cè),并上傳大量的照片。

在2011年,Shutterfly將Cleversafe的解決方案全面應(yīng)用于照片存檔中,并將其作為主要的照片存儲(chǔ)倉(cāng)庫(kù)。

糾刪碼存儲(chǔ)的總擁有成本

Day 稱:“總體上,糾刪碼存儲(chǔ)是一個(gè)軟件解決方案,允許我們部署費(fèi)效比更好的硬件。對(duì)于我們來(lái)說(shuō),它改變了總擁有成本。我們與硬件廠商打交道時(shí)擁有了更高的靈活性,我們可以確保在硬盤和基礎(chǔ)設(shè)施方面獲得最優(yōu)惠的價(jià)格。”

Day表示存儲(chǔ)池的管理也得到了極大的簡(jiǎn)化。他稱:“現(xiàn)在我們基本上只需要增加存儲(chǔ)空間即可,隨后它們會(huì)自動(dòng)的添加到我們所指定的存儲(chǔ)池中。以前,只有我們?cè)黾恿祟~外的存儲(chǔ),那么我們就不得不進(jìn)折騰一翻。”

現(xiàn)在,如果一塊硬盤發(fā)生故障或是掉線了,Shutterfly的存儲(chǔ)基礎(chǔ)設(shè)施能夠?qū)⑵錁?biāo)記為不可用狀態(tài),并引導(dǎo)數(shù)據(jù)繞開(kāi)這塊硬盤,同時(shí)迅速恢復(fù)這塊硬盤上的數(shù)據(jù)。以往當(dāng)一塊硬盤或是多塊硬盤發(fā)生了故障,團(tuán)隊(duì)會(huì)召集所有的人一起排除故障,現(xiàn)在他們的團(tuán)隊(duì)只需注明故障,在計(jì)劃維護(hù)方案中替換掉受影響的基礎(chǔ)設(shè)施即可。

他稱:“這樣一來(lái),我們不必再像以前一樣盡可能快的增加人手了。現(xiàn)在,我們的人手仍然在增長(zhǎng),但是速度比以前慢多了。日常維護(hù)工作的工作量已經(jīng)下降了不少。管理員可以在他們感興趣的前瞻性項(xiàng)目中花上更多的時(shí)間。他們的工作重點(diǎn)已經(jīng)轉(zhuǎn)移至我們以往稱為附加工作的工作上去了。在增加員工人數(shù)和工作內(nèi)容方面,這一技術(shù)都產(chǎn)生了不錯(cuò)的效果。”

數(shù)據(jù)存儲(chǔ)將讓公司具備敏銳的洞察力

盡管Shutterfly是一家需要處理海量數(shù)據(jù)的互聯(lián)網(wǎng)公司,但是如今大多數(shù)公司也都不得不面對(duì)大量數(shù)據(jù),全球的公司正在存儲(chǔ)越來(lái)越多的數(shù)據(jù)。

他稱:“我們的存檔規(guī)模在五年內(nèi)將變得非常龐大,與比平均水平相比,要大幾個(gè)數(shù)量級(jí)。我們希望在四年或五年后能夠看到大量應(yīng)用和技術(shù)投入市場(chǎng),讓處理超大型數(shù)據(jù)集成為可能。讓人感到興奮的是,它們將允許公司觀察細(xì)微的數(shù)據(jù),從而使得公司具有更加敏銳的業(yè)務(wù)洞察力。”

Day稱:“這是一個(gè)發(fā)展趨勢(shì)。目前我們還僅僅處于初級(jí)階段。隨著業(yè)務(wù)的互聯(lián)性、移動(dòng)性以及與客戶實(shí)時(shí)互動(dòng)程度的不斷提升,數(shù)據(jù)量將越來(lái)越大。對(duì)這些數(shù)據(jù)的分析可能將會(huì)對(duì)業(yè)務(wù)洞察力產(chǎn)生深遠(yuǎn)影響。但是這些工作的首要條件是要能夠可靠地存儲(chǔ)這些海量數(shù)據(jù)。”

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉