什么是大數(shù)據(jù)分析?大數(shù)據(jù)分析的含義與目前形式
“很多人還沒搞清楚什么是PC互聯(lián)網(wǎng),移動(dòng)互聯(lián)網(wǎng)來了,我們還沒搞清楚移動(dòng)互聯(lián)的時(shí)候,大數(shù)據(jù)時(shí)代又來了?!薄R云卸任演講
大數(shù)據(jù)已經(jīng)應(yīng)用到各行各業(yè),發(fā)揮著不可替代的作用,創(chuàng)造著不可估量的價(jià)值。然而隨著時(shí)代潮流的大邁步,市場(chǎng)上對(duì)數(shù)據(jù)分析人才的缺口已經(jīng)很大,據(jù)調(diào)查,目前近60%企業(yè)已成立數(shù)據(jù)分析相關(guān)部門,超過1/3的企業(yè)已經(jīng)將大數(shù)據(jù)分析應(yīng)用于其日常運(yùn)營(yíng)和銷售中。那么究竟什么是大數(shù)據(jù)分析呢?
大數(shù)據(jù)分析是指對(duì)規(guī)模巨大的數(shù)據(jù)進(jìn)行分析。大數(shù)據(jù)可以概括為4個(gè)V, 數(shù)據(jù)量大(Volume)、速度快(Velocity)、類型多(Variety)、價(jià)值(Value)。
大數(shù)據(jù)作為時(shí)下最火熱的IT行業(yè)的詞匯,隨之而來的數(shù)據(jù)倉庫、數(shù)據(jù)安全、數(shù)據(jù)分析、數(shù)據(jù)挖掘等等圍繞大數(shù)據(jù)的商業(yè)價(jià)值的利用逐漸成為行業(yè)人士爭(zhēng)相追捧的利潤(rùn)焦點(diǎn)。隨著大數(shù)據(jù)時(shí)代的來臨,大數(shù)據(jù)分析也應(yīng)運(yùn)而生。
大數(shù)據(jù)分析可以分為大數(shù)據(jù)和分析兩個(gè)方面。如今大數(shù)據(jù)已經(jīng)經(jīng)常出現(xiàn)在報(bào)紙新聞當(dāng)中,但大數(shù)據(jù)與大數(shù)據(jù)分析并不是同一概念。假如沒有數(shù)據(jù)分析,再多的數(shù)據(jù)都只能是一堆儲(chǔ)存維護(hù)成本高而毫無用處的IT庫存。國外發(fā)達(dá)國家的大數(shù)據(jù)分析更注重分析,從分析出發(fā)去找數(shù)據(jù),然后再有效地將從數(shù)據(jù)中得到的信息有效利用;而國內(nèi),對(duì)大數(shù)據(jù)的理解有失偏頗,盲目注重于大數(shù)據(jù)的采集而未能對(duì)收集到的數(shù)據(jù)有效利用,或許只是簡(jiǎn)單的畫個(gè)圖表得出表層結(jié)論而已,難以對(duì)數(shù)據(jù)的深層價(jià)值進(jìn)行深入挖掘。
關(guān)于大數(shù)據(jù)分析具體含義
1、數(shù)據(jù)分析可以讓人們對(duì)數(shù)據(jù)產(chǎn)生更加優(yōu)質(zhì)的詮釋,而具有預(yù)知意義的分析可以讓分析員根據(jù)可視化分析和數(shù)據(jù)分析后的結(jié)果做出一些預(yù)測(cè)性的推斷。
2、大數(shù)據(jù)的分析與存儲(chǔ)和數(shù)據(jù)的管理是一些數(shù)據(jù)分析層面的最佳實(shí)踐。通過按部就班的流程和工具對(duì)數(shù)據(jù)進(jìn)行分析可以保證一個(gè)預(yù)先定義好的高質(zhì)量的分析結(jié)果。
3、不管使用者是數(shù)據(jù)分析領(lǐng)域中的專家,還是普通的用戶,可作為數(shù)據(jù)分析工具的始終只能是數(shù)據(jù)可視化。可視化可以直觀的展示數(shù)據(jù),讓數(shù)據(jù)自己表達(dá),讓客戶得到理想的結(jié)果。
4、大數(shù)據(jù)已經(jīng)不像前些年給人一種虛無縹緲的感覺,而當(dāng)下最重要的是對(duì)大數(shù)據(jù)進(jìn)行分析,只有經(jīng)過分析的數(shù)據(jù),才能對(duì)用戶產(chǎn)生最重要的價(jià)值,越來越多人開始對(duì)什么是大數(shù)據(jù)分析產(chǎn)生聯(lián)想,所以大數(shù)據(jù)的分析方式在整個(gè)IT領(lǐng)域就顯得尤為重要,可以說是決定最終信息是否有價(jià)值的決定性因素。
大數(shù)據(jù)分析目前存在以下三個(gè)問題
數(shù)據(jù)存儲(chǔ)問題:隨著技術(shù)不斷發(fā)展,數(shù)據(jù)量從TB上升至PB,EB量級(jí),如果還用傳統(tǒng)的數(shù)據(jù)存儲(chǔ)方式,必將給大數(shù)據(jù)分析造成諸多不便,這就需要借助數(shù)據(jù)的動(dòng)態(tài)處理技術(shù),即隨著數(shù)據(jù)的規(guī)律性變更和顯示需求,對(duì)數(shù)據(jù)進(jìn)行非定期的處理。同時(shí),數(shù)量極大的數(shù)據(jù)不能直接使用傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)庫進(jìn)行存儲(chǔ),人們需要探索一種適合大數(shù)據(jù)的數(shù)據(jù)儲(chǔ)存模式,也是當(dāng)下應(yīng)該著力解決的一大難題。
分析資源調(diào)度問題:大數(shù)據(jù)產(chǎn)生的時(shí)間點(diǎn),數(shù)據(jù)量都是很難計(jì)算的,這就是大數(shù)據(jù)的一大特點(diǎn),不確定性。所以我們需要確立一種動(dòng)態(tài)響應(yīng)機(jī)制,對(duì)有限的計(jì)算、存儲(chǔ)資源進(jìn)行合理的配置及調(diào)度。另外,如何以最小的成本獲得最理想的分析結(jié)果也是一個(gè)需要考慮的問題。
專業(yè)的分析工具:在發(fā)展數(shù)據(jù)分析技術(shù)的同時(shí),傳統(tǒng)的軟件工具不再適用。目前人類科技尚不成熟,距離開發(fā)出能夠滿足大數(shù)據(jù)分析需求的通用軟件還有一定距離。 如若不能對(duì)這些問題做出處理,在不久的將來大數(shù)據(jù)的發(fā)展就會(huì)進(jìn)入瓶頸,甚至有可能出現(xiàn)一段時(shí)間的滯留期,難以持續(xù)起到促進(jìn)經(jīng)濟(jì)發(fā)展的作用。