SAS將提供基于Hadoop的開創(chuàng)性大數(shù)據(jù)分析技術(shù)
掃描二維碼
隨時(shí)隨地手機(jī)看文章
全球領(lǐng)先的商業(yè)分析軟件與服務(wù)供應(yīng)商SAS公司正在開發(fā)一種基于SAS內(nèi)存分析技術(shù),并適用于開源框架Hadoop的交互式分析編程環(huán)境。新軟件通過更快地挖掘大數(shù)據(jù)獲取更精確商業(yè)洞察,幫助企業(yè)提升盈利、降低風(fēng)險(xiǎn)、增進(jìn)對客戶的了解以及創(chuàng)造更多商業(yè)成功的機(jī)會。
SAS®In-MemoryStatisticsforHadoop能夠讓多用戶同時(shí)并交互地管理、挖掘和分析數(shù)據(jù),建立和比對模型,以及對Hadoop框架內(nèi)的海量數(shù)據(jù)進(jìn)行評分。Hadoop開源框架被廣泛認(rèn)為是大數(shù)據(jù)未來發(fā)展方向。SAS軟件將在2014年上半年內(nèi)幫助數(shù)據(jù)科學(xué)家大幅提高工作效率。
“SAS®In-MemoryStatisticsforHadoop可單次載入Hadoop數(shù)據(jù)并將其保存到內(nèi)存中供多用戶進(jìn)行一個(gè)會話內(nèi)的多類型分析,相比之下,其他需要將數(shù)據(jù)寫入磁盤的方式面臨的問題是:所有的數(shù)據(jù)傳輸對于大數(shù)據(jù)處理而言都是極其低效的。”SAS分析服務(wù)器研發(fā)部門高級總監(jiān)OliverSchabenberger表示,“我們正致力于幫助數(shù)據(jù)科學(xué)家、建模師和統(tǒng)計(jì)員減少使用多種分析編程語言,擺脫各種工具混合使用的繁瑣。SAS®In-MemoryStatisticsforHadoop支持所有類型的數(shù)據(jù)分析,為協(xié)同分析開辟一條快速、強(qiáng)勁和綜合的途徑。”
SAS®In-MemoryStatisticsforHadoop支持的統(tǒng)計(jì)和機(jī)器學(xué)習(xí)建模技術(shù)包括:聚類、回歸、廣義線性模型、方差分析、決策樹、隨機(jī)決策森林、文本分析和推薦系統(tǒng)。SAS可視化分析(SAS®VisualAnalytics)采用的內(nèi)存分析技術(shù)也被應(yīng)用到SAS®In-MemoryStatisticsforHadoop中。SAS內(nèi)存架構(gòu)為數(shù)據(jù)分析提供前所未有的速度—這對于在海量數(shù)據(jù)中挖掘價(jià)值來說必不可少。
為什么選擇Hadoop?
市場研究機(jī)構(gòu)IDC預(yù)測到2016年,Hadoop將實(shí)現(xiàn)8.128億美元的銷售額—復(fù)合年增長率達(dá)到60.2%。SAS期望客戶能夠借助Hadoop繼續(xù)將大數(shù)據(jù)轉(zhuǎn)化為卓越洞察。
“Hadoop對累積了海量數(shù)據(jù)資產(chǎn)的企業(yè)來說意義非凡。SAS致力于幫助這些部署大數(shù)據(jù)架構(gòu)的企業(yè),運(yùn)用行業(yè)最頂尖的分析技術(shù)實(shí)現(xiàn)大價(jià)值,”SAS首席數(shù)據(jù)科學(xué)家WayneThompson表示,“在大數(shù)據(jù)理念大熱之前,SAS便開始著力于服務(wù)大數(shù)據(jù)用戶。隨著技術(shù)的發(fā)展,我們也不斷滿足變化的客戶需求,實(shí)現(xiàn)客戶所想。”
他還提到SAS與Hadoop生態(tài)系統(tǒng)中知名公司Cloudera和Hortonworks進(jìn)行了戰(zhàn)略合作,使客戶在受歡迎的Hadoop分布中有機(jī)會使用行業(yè)領(lǐng)先的分析技術(shù)。
Hadoop可以在商業(yè)服務(wù)器集群上分布數(shù)據(jù)和執(zhí)行并行處理,還能偵測和處理對于分布式處理至關(guān)重要的故障。Hadoop除了具備低成本分布式硬件和數(shù)據(jù)冗余安全模式之外,還擁有以下一系列顯著優(yōu)勢:
?并行處理—Hadoop分布式計(jì)算模型擁有海量數(shù)據(jù)處理能力。
?可擴(kuò)展性—可通過添加節(jié)點(diǎn)輕松擴(kuò)展Hadoop系統(tǒng)。
?存儲靈活性—與傳統(tǒng)的關(guān)系型數(shù)據(jù)庫不同,數(shù)據(jù)無需為存儲進(jìn)行預(yù)處理。Hadoop能夠輕松存儲非結(jié)構(gòu)化數(shù)據(jù)。
SAS公司大中華區(qū)總裁吳輔世先生表示:“大數(shù)據(jù)的興起促成了底層開源Hadoop技術(shù)的繁榮。我們也看到了Hadoop蘊(yùn)含的潛在商機(jī),它成本更為低廉、部署更為簡單、能夠存儲文本等非結(jié)構(gòu)化數(shù)據(jù),可滿足企業(yè)所需。目前,Hadoop在國內(nèi)的應(yīng)用愈加廣泛,尤其是在電信業(yè)和金融業(yè)。SAS希望能夠在Hadoop中引入強(qiáng)大分析技術(shù),幫助企業(yè)從Hadoop部署中獲取價(jià)值。”