2014年大數(shù)據(jù)將有12個(gè)趨勢:Hadoop和R語言成主角
掃描二維碼
隨時(shí)隨地手機(jī)看文章
21ic通信網(wǎng)訊,現(xiàn)在,“大數(shù)據(jù)”已經(jīng)成為最熱門詞匯之一,越來越多的企業(yè)開始關(guān)注和擁抱大數(shù)據(jù),2014年大數(shù)據(jù)將會有更多實(shí)質(zhì)性的進(jìn)展,其中,Hadoop和R語言將會成為主角。
“大數(shù)據(jù)”已成為2013年使用頻率最高的技術(shù)熱詞之一。相應(yīng)的市場也在這一年中出現(xiàn)了迅速增長。和大數(shù)據(jù)相關(guān)的Hadoop及其生態(tài)系統(tǒng)已經(jīng)從原先只有非常天才的程序員和工程師才會使用的技術(shù)變成了數(shù)據(jù)科學(xué)家們的常用工具。越來越多的企業(yè)開始擁抱大數(shù)據(jù)技術(shù),并將大數(shù)據(jù)應(yīng)用引入生產(chǎn)環(huán)境中。
那么,2014年的大數(shù)據(jù)將會如何發(fā)展呢?這里給出的便是大數(shù)據(jù)明年可能劃出的12個(gè)預(yù)言軌跡。
1.人們不再談?wù)摯髷?shù)據(jù)而是開始賦予其意義
2014年,“大數(shù)據(jù)”作為一個(gè)技術(shù)熱詞的吸引力將會消散,人們會更關(guān)注大數(shù)據(jù)本身的價(jià)值所在。例如Gainsight公司就在其IaaS平臺中利用大數(shù)據(jù)分析提供所謂“客戶成功管理”服務(wù)。Gainsight相信,在2014年,每家云應(yīng)用提供商都將會在其后端的基礎(chǔ)設(shè)施中支持大數(shù)據(jù)。
2.Hadoop將從新奇玩意變成關(guān)鍵組件
云環(huán)境并非大數(shù)據(jù)技術(shù)唯一可以一顯身手的地方。2014年,Hadoop將會從數(shù)據(jù)批處理和存儲轉(zhuǎn)向通用目的的計(jì)算基礎(chǔ)設(shè)施,從而成為企業(yè)數(shù)據(jù)架構(gòu)的核心組件。這意味著數(shù)據(jù)分析將會繼續(xù)成為大數(shù)據(jù)的首要應(yīng)用。
3.企業(yè)挖掘客戶數(shù)據(jù)獲得前瞻性
各類企業(yè)正計(jì)劃認(rèn)真對待其客戶們在與產(chǎn)品客服以及在線客服互動(dòng)時(shí)所留下的所謂數(shù)字“面包屑”痕跡,并從中尋找到有價(jià)值的內(nèi)容。而為了實(shí)現(xiàn)這一目的,數(shù)據(jù)分析能力就必須越出BI團(tuán)隊(duì)的藩籬,能夠?yàn)檎麄€(gè)企業(yè)提供商業(yè)價(jià)值。
4.大數(shù)據(jù)進(jìn)入市場營銷游戲
2014年,用于市場營銷的數(shù)據(jù)分析和大數(shù)據(jù)也會成為一個(gè)大年,影響著廣告、產(chǎn)品推銷和消費(fèi)者的行為。這些方面的一些關(guān)鍵創(chuàng)新時(shí)刻估計(jì)將會在世界杯和冬季奧運(yùn)會期間出現(xiàn)。
5.現(xiàn)代分析不再只是數(shù)據(jù)科學(xué)家的事情
讓各業(yè)務(wù)部門的分析師從事大數(shù)據(jù)和數(shù)據(jù)分析,這將比高薪聘請數(shù)據(jù)科學(xué)家更重要。此舉將會壓低數(shù)據(jù)科學(xué)技能導(dǎo)致的過高薪水。
6.從萬物互連(Internet of Things)演變?yōu)槲锫?lián)網(wǎng)(Web of Things)
IEEE的專業(yè)分會認(rèn)為,2014年,萬物互連——可識別的物體無縫集成到信息網(wǎng)絡(luò)中——將會讓位給真正的物聯(lián)網(wǎng)。而物聯(lián)網(wǎng)將會充分發(fā)揮移動(dòng)設(shè)備和傳感器觀察并監(jiān)控其周邊環(huán)境的能力,增強(qiáng)現(xiàn)實(shí)世界中的物體與其Web副本之間的協(xié)同性。
12物聯(lián)網(wǎng)將會生成大量與現(xiàn)實(shí)世界相關(guān)的數(shù)據(jù),因而會要求智能化的解決方案在現(xiàn)實(shí)世界與相對應(yīng)的數(shù)字世界資源之間賦予連接性、網(wǎng)際互連和相關(guān)性。
7.從大數(shù)據(jù)到巨量數(shù)據(jù)
數(shù)據(jù)的規(guī)模、速度和種類(volume、velocity and variety)在2014年將會繼續(xù)呈指數(shù)級發(fā)展,因此更需要一些簡單的分析工具來駕馭這些“數(shù)據(jù)洪流”。
IEEE稱,“正是這3個(gè)V讓大數(shù)據(jù)成了非常難以制服的老虎。技術(shù)世界如今還跟不上培訓(xùn)數(shù)據(jù)科學(xué)家,為各行各業(yè)提供易用工具的龐大需求,尚無能力將各行業(yè)收集到的數(shù)據(jù)轉(zhuǎn)換成有意義的洞察力。而目前已經(jīng)出現(xiàn)的巨量數(shù)據(jù)時(shí)代更要求在數(shù)據(jù)管理和分析方面采用新的范式和實(shí)踐。2014年,競爭就將在這一領(lǐng)域中展開。”
8.R語言將取代傳統(tǒng)SAS解決方案成為主流
基于R編程語言的分析是專為數(shù)據(jù)科學(xué)家用于統(tǒng)計(jì)分析的,這種分析功能2014年將成為主流,逐漸讓傳統(tǒng)的編程環(huán)境如SAS和SPSS邊緣化。
目前有超過200萬用戶和300萬的分析師們都在尋找更好的解決方案。R語言恰逢其時(shí)。
9.Hadoop將增強(qiáng)實(shí)時(shí)定制應(yīng)用
來年我們將會看到各種交互應(yīng)用——Web應(yīng)用、移動(dòng)應(yīng)用、社交應(yīng)用等的大爆發(fā),它們均基于Hadoop平臺構(gòu)建,可與人們實(shí)時(shí)交互,實(shí)時(shí)SQL-on-Hadoop數(shù)據(jù)庫廠商Splice Machine的聯(lián)合創(chuàng)始人兼CEO Monte Zweben說。
“2014年將會出現(xiàn)實(shí)時(shí)的大數(shù)據(jù)應(yīng)用平臺,”Zweben稱。“我們不再只用今天去分析昨天的數(shù)據(jù)了。你可以分析5分鐘之前,甚至1分鐘之前的數(shù)據(jù)了。企業(yè)必須得有交互式應(yīng)用,以便進(jìn)行實(shí)時(shí)的決策。”
10.Hadoop將得到企業(yè)級強(qiáng)化
2014年,Hadoop將會在安全、運(yùn)營管理、資源管理和多點(diǎn)復(fù)制方面發(fā)展得更好,從而獲得企業(yè)更多的信賴,Zweben說。
“企業(yè)所需要的各種東西Hadoop逐漸都會有,”他說。“而且這些大數(shù)據(jù)平臺也會變得更加規(guī)范和標(biāo)準(zhǔn)化。我認(rèn)為這將會成為一大要點(diǎn)。”
11.到2014年底,至少會有一家NoSQL公司成功上市
大數(shù)據(jù)平臺的商用被廣泛認(rèn)可的標(biāo)志就是,至少會有一家Hadoop或NoSQL提供商在2014年成功上市,為大數(shù)據(jù)和云環(huán)境提供安全解決方案的Gazzang的總裁兼CEO Larry Wamock做出了這樣的預(yù)測。
12.新的分析堆棧將會出現(xiàn)
2014年,一個(gè)新的數(shù)據(jù)和分析堆棧將會與數(shù)據(jù)庫、分析和虛擬化等新的解決方案一起出現(xiàn),這將會對傳統(tǒng)的大型數(shù)據(jù)庫廠商帶來沉重打擊。傳統(tǒng)廠商也將會以匆忙拼湊出的新的解決方案加以應(yīng)對。
12