應(yīng)該何時(shí)把大數(shù)據(jù)遷移到云上
掃描二維碼
隨時(shí)隨地手機(jī)看文章
云對(duì)每個(gè)人來(lái)說(shuō)都是又大、又白、又輕柔的夢(mèng)境。當(dāng)有人說(shuō)他們的大數(shù)據(jù)戰(zhàn)略是“把全部投入云端”時(shí),你無(wú)法確定他們是否是一個(gè)有遠(yuǎn)見(jiàn)的人,或僅僅是重復(fù)一個(gè)專(zhuān)家在一次行業(yè)會(huì)議上告訴他們的事。
大數(shù)據(jù)和云范例之間實(shí)際的重復(fù)非常廣泛,你可以宣稱(chēng)你正在一個(gè)內(nèi)部部署的Hadoop、NoSQL、或企業(yè)數(shù)據(jù)倉(cāng)庫(kù)環(huán)境下處理基于云的大數(shù)據(jù)。請(qǐng)記住云被廣泛理解為包含“私有”部署以補(bǔ)充或代替公共云、SaaS、和多租戶托管環(huán)境。
但是如果你把云的實(shí)際定義限制于公共訂購(gòu)服務(wù)內(nèi),你就能找到問(wèn)題的核心:識(shí)別哪些大數(shù)據(jù)應(yīng)用相對(duì)于內(nèi)部部署更適合公共云/SaaS 部署(比如那些涉及提前優(yōu)化的硬件設(shè)備或虛擬服務(wù)器集群的應(yīng)用)。
換句話說(shuō):你什么時(shí)候可以通過(guò)引進(jìn)一個(gè)外部服務(wù)供應(yīng)商為你管理它們,從而提高大數(shù)據(jù)的可擴(kuò)展性、靈活性、性能、成本效益、可靠性、以及可管理性?以下是一些明確的大數(shù)據(jù)在公共云中的使用實(shí)例。
已經(jīng)在云中托管的企業(yè)應(yīng)用程序:如果和許多企業(yè)一樣——尤其是中小型企業(yè)——你使用了一個(gè)外部服務(wù)供應(yīng)商提供的基于云的應(yīng)用程序,許多你的源交易數(shù)據(jù)已經(jīng)被置于公共云之上。如果你在這個(gè)云平臺(tái)上有更深入的歷史數(shù)據(jù),那么它可能已經(jīng)積累至大數(shù)據(jù)級(jí)。如果外部服務(wù)供應(yīng)商或它的合作伙伴之一提供了一個(gè)增值的分析服務(wù)——如客戶流失分析、營(yíng)銷(xiāo)優(yōu)化、或客戶數(shù)據(jù)的異地備份和歸檔——那么利用這些服務(wù)會(huì)比將這些數(shù)據(jù)置于內(nèi)部來(lái)得有意義。
需要相當(dāng)大的預(yù)處理能力的大容量外部數(shù)據(jù)源:例如,如果你打算通過(guò)監(jiān)測(cè)社交媒體數(shù)據(jù)的聚合輸入來(lái)分析客戶的情感,內(nèi)部的服務(wù)器、存儲(chǔ)、或帶寬容量可能無(wú)法很好地為你完成這項(xiàng)任務(wù)。這是一個(gè)明顯的關(guān)于應(yīng)用程序的例子,在這里你會(huì)希望利用一個(gè)基于公共云的、大數(shù)據(jù)驅(qū)動(dòng)的服務(wù)所提供的社交媒體過(guò)濾服務(wù)解決問(wèn)題。
超過(guò)你內(nèi)部部署的大數(shù)據(jù)處理能力的策略型應(yīng)用程序:如果你已經(jīng)有一個(gè)專(zhuān)門(mén)為某個(gè)應(yīng)用程序內(nèi)部部署的大數(shù)據(jù)平臺(tái)(比如高容量非結(jié)構(gòu)化數(shù)據(jù)源ETL專(zhuān)用的Hadoop集群),那么使用一個(gè)公共云來(lái)處理當(dāng)前平臺(tái)所不適用的、或是按需服務(wù)會(huì)更健壯或劃算的新的應(yīng)用程序(例如多渠道營(yíng)銷(xiāo)、社交媒體分析、地理空間分析、可查詢歸檔、彈性數(shù)據(jù)沙盒技術(shù))可能會(huì)更行得通。事實(shí)上,如果你需要盡快獲得PB級(jí)規(guī)模的、流媒體的、多結(jié)構(gòu)的大數(shù)據(jù)處理能力,那么一個(gè)公共云產(chǎn)品可能是唯一可行的選擇。
非常大但只是短暫存在的沙盒的彈性供應(yīng):如果你有一個(gè)短期周轉(zhuǎn)的短期數(shù)據(jù)科學(xué)項(xiàng)目,而這個(gè)項(xiàng)目需要比慣常大一個(gè)數(shù)量級(jí)的探索型數(shù)據(jù)集市(又名沙盒),那么云可能是你唯一可行或可以支付的選擇。你能夠很快在項(xiàng)目期間運(yùn)作基于云的存儲(chǔ)和處理能力,然后當(dāng)項(xiàng)目結(jié)束時(shí)又可以很快的取消之前配置的一切。我稱(chēng)之為“泡沫集市”部署模型,它是為云量身定制的。
如果你已經(jīng)有過(guò)這其中任一的經(jīng)歷,那么基于云的大數(shù)據(jù)的戰(zhàn)略問(wèn)題就不是你該從何開(kāi)始。隨著基于云的大數(shù)據(jù)服務(wù)逐漸成熟以及性價(jià)比(包括性能、可擴(kuò)展性、靈活性和可管理性)不斷提高,這個(gè)問(wèn)題將會(huì)是你該在哪結(jié)束。到本個(gè)十年的末期,隨著越來(lái)越多的應(yīng)用程序和數(shù)據(jù)遷移到公共云上,建立和運(yùn)作你自己的大數(shù)據(jù)部署的想法似乎如同現(xiàn)在你想設(shè)計(jì)自己的服務(wù)器一般不切實(shí)際。