大數(shù)據(jù)分析可以起到什么作用
掃描二維碼
隨時隨地手機看文章
大數(shù)據(jù)需要特殊的技術,以有效地處理大量的容忍經(jīng)過時間內(nèi)的數(shù)據(jù)。適用于大數(shù)據(jù)的技術,包括大規(guī)模并行處理(MPP)數(shù)據(jù)庫、數(shù)據(jù)挖掘、分布式文件系統(tǒng)、分布式數(shù)據(jù)庫、云計算平臺、互聯(lián)網(wǎng)和可擴展的存儲系統(tǒng)。國內(nèi)大數(shù)據(jù)應用已快十年,然而,對大數(shù)據(jù)應用的深入思考卻沒跟上,以統(tǒng)計分析的模式來想象大數(shù)據(jù)的應用,定格在信息獲取方向上會影響在其它領域的應用創(chuàng)新。本文作者原國家信息中心副主任胡小明,從“大數(shù)據(jù)應用”的角度帶來一些全新啟發(fā)!本文將從信息獲取、網(wǎng)絡服務、數(shù)據(jù)整合三個方向探討大數(shù)據(jù)應用,拓寬應用視野。
一、信息獲取的大數(shù)據(jù)應用
1.1信息獲取與知識發(fā)現(xiàn)
對大數(shù)據(jù)最容易想到的應用是信息獲取,大數(shù)據(jù)應用經(jīng)常被視為是統(tǒng)計分析模式的延伸,維克多·邁爾-舍恩伯格與肯尼斯·庫克耶合著的《大數(shù)據(jù)時代》從信息獲取、知識發(fā)現(xiàn)的視角提出了大數(shù)據(jù)應用帶來的創(chuàng)新:一是使用全部數(shù)據(jù)替代抽樣數(shù)據(jù),二是允許數(shù)據(jù)的混雜型而非精確性,三是重視相關關系而非因果關系。大數(shù)據(jù)創(chuàng)新開辟了知識發(fā)現(xiàn)的新思路,促進了科學研究工作的發(fā)展。
1.2政府決策的大數(shù)據(jù)應用
大數(shù)據(jù)在知識發(fā)現(xiàn)中呈現(xiàn)出來的優(yōu)勢使政府產(chǎn)生用大數(shù)據(jù)實現(xiàn)決策科學化的構想,決策是領導者的行為,但是人腦無法直接使用大數(shù)據(jù)決策,數(shù)據(jù)所包含的內(nèi)容要濃縮經(jīng)過理解之后才能成為人腦中的信息,與人腦其它信共同參與決策。數(shù)據(jù)挖掘、統(tǒng)計分析都是對數(shù)據(jù)內(nèi)容進行濃縮處理,形成人腦易于理解的信息內(nèi)容,數(shù)據(jù)包含的信息要通過人腦在決策中發(fā)揮作用。
1.3政府大數(shù)據(jù)應用的局限性
大數(shù)據(jù)應用對政府決策的改進并不明顯,否則不至于長期纂寫不出政府大數(shù)據(jù)決策案例集。政府決策應用大數(shù)據(jù)困難主要有兩點:
一是缺少適用的數(shù)據(jù)源,政府自己并沒有多少大數(shù)據(jù)資源,適合當即需要決策問題的外部大數(shù)據(jù)也極難碰到;
二是很多重要信息如國際形勢、重大事件、管理能力、社會文化很難數(shù)字化,政府僅靠數(shù)據(jù)決策會有很大的片面性;
1.4大數(shù)據(jù)適合特定領域的決策
大數(shù)據(jù)主要來源特定的業(yè)務渠道,渠道的局限性使大數(shù)據(jù)獲取的信息也有相應的局限性,因此大數(shù)據(jù)不適合大范圍的決策,對政府的宏觀決策幫助并不大,但是在微觀應用中會有很多成功的應用,如案件偵破等。電子商務企業(yè)經(jīng)常利用業(yè)務積累的數(shù)據(jù)分析用戶需求,依據(jù)客戶瀏覽內(nèi)容推薦新產(chǎn)品與服務。
二、智能網(wǎng)絡服務的大數(shù)據(jù)應用
2.1智能網(wǎng)絡服務也是大數(shù)據(jù)應用
大數(shù)據(jù)局限于信息獲取應用會忽略在服務中的貢獻。產(chǎn)生大數(shù)據(jù)的業(yè)務本身是更基礎的大數(shù)據(jù)應用。谷歌、百度、阿里巴巴、騰訊、亞馬遜等公司是大數(shù)據(jù)企業(yè),電信運營商、銀行等也是大數(shù)據(jù)企業(yè),這些機構的大數(shù)據(jù)應用與信息獲取應用不同,它們關心的是提供服務效率而不是知識獲取,智能網(wǎng)絡服務的大數(shù)據(jù)應用系統(tǒng)直接針對數(shù)據(jù)操作,不需要提取信息。
2.2智能網(wǎng)絡服務直接使用數(shù)據(jù)
大數(shù)據(jù)智能網(wǎng)絡服務系統(tǒng)直接處理數(shù)據(jù),為用戶提供服務結果,這種業(yè)務由計算機流程自動處理數(shù)據(jù),系統(tǒng)完全依據(jù)數(shù)據(jù)辦事,沒有人腦參與就能達到極高的處理速度,確保處理結果一致性不受操作人影響。
2.3智能服務的數(shù)據(jù)資源是動態(tài)數(shù)據(jù)流
信息獲取的大數(shù)據(jù)應用是一次性運行,數(shù)據(jù)是靜態(tài)的,一旦獲取了信息即交由人腦處理,計算機的任務就結束了,智能網(wǎng)絡服務則是連續(xù)的不停頓的業(yè)務,只要用戶有需求系統(tǒng)就要響應,手機支付系統(tǒng)就需要不停工作以保證支付的及時性。電信運營商的服務亦不能停頓,其數(shù)據(jù)來自手機不停地向基站發(fā)出連接信號。連續(xù)的業(yè)務需要連續(xù)的數(shù)據(jù)源,智能網(wǎng)絡服務處理的數(shù)據(jù)是在服務中實時產(chǎn)生的,它是連續(xù)的數(shù)據(jù)流。
2.4云平臺數(shù)據(jù)資源使服務智能化
智能網(wǎng)絡服務需要來自用戶的服務需求數(shù)據(jù),還需要以前存儲的數(shù)據(jù)資源,谷歌、百度需要收集網(wǎng)站數(shù)據(jù)以備用戶查詢。地理導航系統(tǒng)需要地圖數(shù)據(jù)才能按照用戶的實時位置計算導航路線。系統(tǒng)能夠使用存放在云平臺上的大量知識資源,高速的網(wǎng)絡系統(tǒng)加上云提供的知識資源使網(wǎng)絡服務如虎添翼,將普通網(wǎng)絡服務升級為智能網(wǎng)絡服務,智慧城市的網(wǎng)絡服務暨是智能網(wǎng)絡服務。
三、對政府大數(shù)據(jù)中心的建議
3.1大數(shù)據(jù)中心可持續(xù)的關鍵是效益
決策者要認真考慮大數(shù)據(jù)中心持續(xù)經(jīng)營的問題,否則上馬容易下馬難,可持續(xù)生存的關鍵是經(jīng)濟上合理,總效益大于總成本才能生存,大數(shù)據(jù)中心普遍的問題是想做的事情很多,但具體效益目標不清晰,很多項目的效益設想是建立在隨大流的假定之上,盲目性很大,失敗率很高,尋求效益可靠的服務項目是大數(shù)據(jù)中心生存的關鍵。
3.2以改進政府精細化管理為中心
政府管理與服務的精細化是未來十年的中心任務,關鍵是做好政府業(yè)務數(shù)據(jù)整合,提高基層工作人員的現(xiàn)場工作效率,提升公眾的滿意度和政府部門的滿意度。大數(shù)據(jù)中心可在支持政府領導決策方面努力,但重點是提高基層工作效率而非決策分析,基層工作改進容易見效而決策分析卻很難讓領導滿意。
3.3不要盲目地收集數(shù)據(jù)
太多數(shù)據(jù)會成為包袱,耗費設施資源還耗費管理精力。沒有應用方向的數(shù)據(jù)不必忙于收集,更別指望會有人來信息共享,互聯(lián)網(wǎng)時代數(shù)據(jù)資源早已過剩,有效益的應用目標才是數(shù)據(jù)應用的稀缺資源。
3.4從最有效益的數(shù)據(jù)整合應用入手
政府數(shù)據(jù)整合對提高基層服務效率更能發(fā)揮作用,信息技術改進操作的效果明顯高于改進決策。數(shù)據(jù)整合可以按數(shù)據(jù)合作圈分步推進,利用率高的數(shù)據(jù)整合先做,利用率低的后做甚至不做,不必齊步走,好鋼用到刀刃上才是好方案。
3.5開放的大數(shù)據(jù)中心更有生命力
大數(shù)據(jù)中心要促進政府數(shù)據(jù)向社會開放,數(shù)據(jù)開放是增加公眾獲得感的重要內(nèi)容,公眾支持率高能夠直接提升大數(shù)據(jù)中心存在的價值。開放的大數(shù)據(jù)中心可以與企業(yè)合作,訂購企業(yè)的可視化產(chǎn)品支持政府工作,將大數(shù)據(jù)中心做成政府與社會共享的可視化數(shù)據(jù)展示平臺會很受歡迎,社會影響力越大,大數(shù)據(jù)中心生命力越強。
四
4.1政府大數(shù)據(jù)概念的變通
政府部門的大數(shù)據(jù)概念與專家概念不同,專家認為常規(guī)信息技術無法處理的規(guī)模數(shù)據(jù)才算是大數(shù)據(jù),因此政府沒有什么大數(shù)據(jù);政府認為各部門的數(shù)據(jù)匯集起來就是大數(shù)據(jù),政府把大數(shù)據(jù)概念變通為數(shù)據(jù)整合的概念,使政府有大數(shù)據(jù)工作可做,但是《大數(shù)據(jù)時代》提出的大數(shù)據(jù)理念已不適用這種變通的應用,要用數(shù)據(jù)整合的思維方式推動政府變通的大數(shù)據(jù)應用。
4.2政府業(yè)務數(shù)據(jù)管理與服務的特點
政府日常工作最重要的數(shù)據(jù)是各部門的業(yè)務管理數(shù)據(jù),部門需要收集與積累本部門業(yè)務的管理與執(zhí)行記錄的數(shù)據(jù)。政府業(yè)務數(shù)據(jù)處理是對當事人或事項的精準處理,是下一步管理操作的依據(jù),業(yè)務數(shù)據(jù)是不可替代的。
4.3數(shù)據(jù)整合提升政府精細化管理能力
未來十年電子政務工作重點是實現(xiàn)政府業(yè)務的精細化管理,數(shù)據(jù)整合是實現(xiàn)精細化管理的重要手段。政府的信息管理能力取決數(shù)據(jù)的完整性與現(xiàn)場調(diào)用能力,來不及調(diào)用的數(shù)據(jù)等于沒有數(shù)據(jù),現(xiàn)場管理人員與用戶的信息不對稱會影響服務效率并增加受騙機會。數(shù)據(jù)整合類似數(shù)據(jù)庫建設,實現(xiàn)各部門數(shù)據(jù)在語義上統(tǒng)一,優(yōu)化數(shù)據(jù)的組織,提高相關數(shù)據(jù)的調(diào)用速度,實現(xiàn)數(shù)據(jù)對現(xiàn)場工作人員的及時提供,發(fā)揮數(shù)據(jù)的整體優(yōu)勢。
4.4數(shù)據(jù)整合提高政府公共服務效率
各地政府都提出讓公眾“只跑一次”和“一網(wǎng)通辦”的目標,其目的是節(jié)約用戶時間,跨部門數(shù)據(jù)的調(diào)用速度是提高服務效率的關鍵,數(shù)據(jù)整合可以提高跨部門數(shù)據(jù)調(diào)用的流暢性,提高公共服務的最終效率。
4.5數(shù)據(jù)整合與信息共享不能混為一談
將數(shù)據(jù)整合與信息共享區(qū)別對待是提高政府數(shù)據(jù)使用效率重要環(huán)節(jié),數(shù)據(jù)整合的目標是提高政府業(yè)務操作的效率,目標很明確容易見效。數(shù)據(jù)整合工作宜采取應用導向,急用先做,提高效益。信息共享目的是獲取信息來支持決策與研究,常常需要調(diào)用整個數(shù)據(jù)集進行數(shù)據(jù)挖掘,信息共享需要對數(shù)據(jù)集整體的使用,數(shù)據(jù)整合調(diào)用是對特定數(shù)據(jù)的精準調(diào)用,兩種應用區(qū)別很大,不宜共用一個平臺。