互聯(lián)網(wǎng)大數(shù)據(jù)如何更深層次的去理解
隨著大數(shù)據(jù)的快速發(fā)展,就像計算機和互聯(lián)網(wǎng)一樣,大數(shù)據(jù)很有可能是新一輪的技術革命。隨之興起的數(shù)據(jù)挖掘、機器學習和人工智能等相關技術,可能會改變數(shù)據(jù)世界里的很多算法和基礎理論,實現(xiàn)科學技術上的突破?!按髷?shù)據(jù)”給人的第一刺激是“大量數(shù)據(jù)”。確實如此,隨著半導體工業(yè)、制造業(yè)的發(fā)達,世界上的工業(yè)設備、汽車、公路、管線、電表上都會有傳感器,隨時測量著有關位置、溫度、濕度、運動、震動乃至空氣中化學物質的變化,海量的數(shù)據(jù)就會產(chǎn)生。
權威機構—美國互聯(lián)網(wǎng)數(shù)據(jù)中心指出,互聯(lián)網(wǎng)上的數(shù)據(jù)每年增長50%,每兩年翻一番,90%以上的數(shù)據(jù)是最近幾年才產(chǎn)生的。早在1980年,未來學家阿爾文托夫勒便將“大數(shù)據(jù)”熱情地贊頌為“第三次浪潮”,直到互聯(lián)網(wǎng)大發(fā)展,這個詞才因為海量數(shù)據(jù)的產(chǎn)生而成為流行詞匯。
當下還處在大數(shù)據(jù)的初級階段,和實踐的結合還不夠,很多概念都還只停留在表層,人們的看法也參差而缺乏深度。比如關于大數(shù)據(jù)的定義:一種規(guī)模大到在獲取、存儲、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫軟件工具能力范圍的數(shù)據(jù)集合,具有海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流轉、多樣的數(shù)據(jù)類型和價值密度低四大特征。這是顯得最權威的認識了。
大數(shù)據(jù)有足夠的技術深度,適合解決時代的問題,符合時代氣質,可以引發(fā)巨大變革。但是,任何一種生產(chǎn)力,它都會被不同的眼光打量,用于滿足不同需求,在不同的人那兒表現(xiàn)各異。我們不能滿足于當下的觀點,要用歷史視角觀看,結合人類需要解決的問題思考大數(shù)據(jù)。大數(shù)據(jù)成為這個時代的時髦詞匯,很多人都宣稱大數(shù)據(jù),包括很多權威機構,其實是數(shù)據(jù)量稍微多一些,查詢條件關聯(lián)條件稍微復雜一些而已,根本還是以往的關系型數(shù)據(jù)庫模式醫(yī)學數(shù)據(jù)更是繁多,包含幾乎所有生命特性,醫(yī)院的檢查工具會從專業(yè)的角度貢獻數(shù)據(jù),往往局限于疾病狀態(tài)。更多數(shù)據(jù)來源已經(jīng)開啟,體聯(lián)網(wǎng)和腦聯(lián)網(wǎng)會立足于生活貢獻數(shù)據(jù),數(shù)據(jù)的種類大大擴展了,數(shù)據(jù)的量級更會億萬倍地增加。這是長期不間斷的監(jiān)測,海量數(shù)據(jù)中,某些隱含的規(guī)律就會出現(xiàn)。假設,白細胞計數(shù)以天為單位呈現(xiàn)周期性波動,和年齡、生活特性等相關,找到這些規(guī)律,就可定義何為正常何為異常,可探索保養(yǎng)身體的思路,發(fā)現(xiàn)生命滑向危險狀態(tài)的苗頭。