大數(shù)據(jù)分析可以有哪些應(yīng)用?
掃描二維碼
隨時隨地手機(jī)看文章
大數(shù)據(jù)需要特殊的技術(shù),以有效地處理大量的容忍經(jīng)過時間內(nèi)的數(shù)據(jù)。適用于大數(shù)據(jù)的技術(shù),包括大規(guī)模并行處理(MPP)數(shù)據(jù)庫、數(shù)據(jù)挖掘、分布式文件系統(tǒng)、分布式數(shù)據(jù)庫、云計(jì)算平臺、互聯(lián)網(wǎng)和可擴(kuò)展的存儲系統(tǒng)。國內(nèi)大數(shù)據(jù)應(yīng)用已快十年,然而,對大數(shù)據(jù)應(yīng)用的深入思考卻沒跟上,以統(tǒng)計(jì)分析的模式來想象大數(shù)據(jù)的應(yīng)用,定格在信息獲取方向上會影響在其它領(lǐng)域的應(yīng)用創(chuàng)新。本文作者原國家信息中心副主任胡小明,從“大數(shù)據(jù)應(yīng)用”的角度帶來一些全新啟發(fā)!本文將從信息獲取、網(wǎng)絡(luò)服務(wù)、數(shù)據(jù)整合三個方向探討大數(shù)據(jù)應(yīng)用,拓寬應(yīng)用視野。
一、信息獲取的大數(shù)據(jù)應(yīng)用
1.1信息獲取與知識發(fā)現(xiàn)
對大數(shù)據(jù)最容易想到的應(yīng)用是信息獲取,大數(shù)據(jù)應(yīng)用經(jīng)常被視為是統(tǒng)計(jì)分析模式的延伸,維克多·邁爾-舍恩伯格與肯尼斯·庫克耶合著的《大數(shù)據(jù)時代》從信息獲取、知識發(fā)現(xiàn)的視角提出了大數(shù)據(jù)應(yīng)用帶來的創(chuàng)新:一是使用全部數(shù)據(jù)替代抽樣數(shù)據(jù),二是允許數(shù)據(jù)的混雜型而非精確性,三是重視相關(guān)關(guān)系而非因果關(guān)系。大數(shù)據(jù)創(chuàng)新開辟了知識發(fā)現(xiàn)的新思路,促進(jìn)了科學(xué)研究工作的發(fā)展。
1.2政府決策的大數(shù)據(jù)應(yīng)用
大數(shù)據(jù)在知識發(fā)現(xiàn)中呈現(xiàn)出來的優(yōu)勢使政府產(chǎn)生用大數(shù)據(jù)實(shí)現(xiàn)決策科學(xué)化的構(gòu)想,決策是領(lǐng)導(dǎo)者的行為,但是人腦無法直接使用大數(shù)據(jù)決策,數(shù)據(jù)所包含的內(nèi)容要濃縮經(jīng)過理解之后才能成為人腦中的信息,與人腦其它信共同參與決策。數(shù)據(jù)挖掘、統(tǒng)計(jì)分析都是對數(shù)據(jù)內(nèi)容進(jìn)行濃縮處理,形成人腦易于理解的信息內(nèi)容,數(shù)據(jù)包含的信息要通過人腦在決策中發(fā)揮作用。
1.3政府大數(shù)據(jù)應(yīng)用的局限性
大數(shù)據(jù)應(yīng)用對政府決策的改進(jìn)并不明顯,否則不至于長期纂寫不出政府大數(shù)據(jù)決策案例集。政府決策應(yīng)用大數(shù)據(jù)困難主要有兩點(diǎn):
一是缺少適用的數(shù)據(jù)源,政府自己并沒有多少大數(shù)據(jù)資源,適合當(dāng)即需要決策問題的外部大數(shù)據(jù)也極難碰到;
二是很多重要信息如國際形勢、重大事件、管理能力、社會文化很難數(shù)字化,政府僅靠數(shù)據(jù)決策會有很大的片面性;
1.4大數(shù)據(jù)適合特定領(lǐng)域的決策
大數(shù)據(jù)主要來源特定的業(yè)務(wù)渠道,渠道的局限性使大數(shù)據(jù)獲取的信息也有相應(yīng)的局限性,因此大數(shù)據(jù)不適合大范圍的決策,對政府的宏觀決策幫助并不大,但是在微觀應(yīng)用中會有很多成功的應(yīng)用,如案件偵破等。電子商務(wù)企業(yè)經(jīng)常利用業(yè)務(wù)積累的數(shù)據(jù)分析用戶需求,依據(jù)客戶瀏覽內(nèi)容推薦新產(chǎn)品與服務(wù)。
二、智能網(wǎng)絡(luò)服務(wù)的大數(shù)據(jù)應(yīng)用
2.1智能網(wǎng)絡(luò)服務(wù)也是大數(shù)據(jù)應(yīng)用
大數(shù)據(jù)局限于信息獲取應(yīng)用會忽略在服務(wù)中的貢獻(xiàn)。產(chǎn)生大數(shù)據(jù)的業(yè)務(wù)本身是更基礎(chǔ)的大數(shù)據(jù)應(yīng)用。谷歌、百度、阿里巴巴、騰訊、亞馬遜等公司是大數(shù)據(jù)企業(yè),電信運(yùn)營商、銀行等也是大數(shù)據(jù)企業(yè),這些機(jī)構(gòu)的大數(shù)據(jù)應(yīng)用與信息獲取應(yīng)用不同,它們關(guān)心的是提供服務(wù)效率而不是知識獲取,智能網(wǎng)絡(luò)服務(wù)的大數(shù)據(jù)應(yīng)用系統(tǒng)直接針對數(shù)據(jù)操作,不需要提取信息。
2.2智能網(wǎng)絡(luò)服務(wù)直接使用數(shù)據(jù)
大數(shù)據(jù)智能網(wǎng)絡(luò)服務(wù)系統(tǒng)直接處理數(shù)據(jù),為用戶提供服務(wù)結(jié)果,這種業(yè)務(wù)由計(jì)算機(jī)流程自動處理數(shù)據(jù),系統(tǒng)完全依據(jù)數(shù)據(jù)辦事,沒有人腦參與就能達(dá)到極高的處理速度,確保處理結(jié)果一致性不受操作人影響。
2.3智能服務(wù)的數(shù)據(jù)資源是動態(tài)數(shù)據(jù)流
信息獲取的大數(shù)據(jù)應(yīng)用是一次性運(yùn)行,數(shù)據(jù)是靜態(tài)的,一旦獲取了信息即交由人腦處理,計(jì)算機(jī)的任務(wù)就結(jié)束了,智能網(wǎng)絡(luò)服務(wù)則是連續(xù)的不停頓的業(yè)務(wù),只要用戶有需求系統(tǒng)就要響應(yīng),手機(jī)支付系統(tǒng)就需要不停工作以保證支付的及時性。電信運(yùn)營商的服務(wù)亦不能停頓,其數(shù)據(jù)來自手機(jī)不停地向基站發(fā)出連接信號。連續(xù)的業(yè)務(wù)需要連續(xù)的數(shù)據(jù)源,智能網(wǎng)絡(luò)服務(wù)處理的數(shù)據(jù)是在服務(wù)中實(shí)時產(chǎn)生的,它是連續(xù)的數(shù)據(jù)流。
2.4云平臺數(shù)據(jù)資源使服務(wù)智能化
智能網(wǎng)絡(luò)服務(wù)需要來自用戶的服務(wù)需求數(shù)據(jù),還需要以前存儲的數(shù)據(jù)資源,谷歌、百度需要收集網(wǎng)站數(shù)據(jù)以備用戶查詢。地理導(dǎo)航系統(tǒng)需要地圖數(shù)據(jù)才能按照用戶的實(shí)時位置計(jì)算導(dǎo)航路線。系統(tǒng)能夠使用存放在云平臺上的大量知識資源,高速的網(wǎng)絡(luò)系統(tǒng)加上云提供的知識資源使網(wǎng)絡(luò)服務(wù)如虎添翼,將普通網(wǎng)絡(luò)服務(wù)升級為智能網(wǎng)絡(luò)服務(wù),智慧城市的網(wǎng)絡(luò)服務(wù)暨是智能網(wǎng)絡(luò)服務(wù)。
三、對政府大數(shù)據(jù)中心的建議
3.1大數(shù)據(jù)中心可持續(xù)的關(guān)鍵是效益
決策者要認(rèn)真考慮大數(shù)據(jù)中心持續(xù)經(jīng)營的問題,否則上馬容易下馬難,可持續(xù)生存的關(guān)鍵是經(jīng)濟(jì)上合理,總效益大于總成本才能生存,大數(shù)據(jù)中心普遍的問題是想做的事情很多,但具體效益目標(biāo)不清晰,很多項(xiàng)目的效益設(shè)想是建立在隨大流的假定之上,盲目性很大,失敗率很高,尋求效益可靠的服務(wù)項(xiàng)目是大數(shù)據(jù)中心生存的關(guān)鍵。
3.2以改進(jìn)政府精細(xì)化管理為中心
政府管理與服務(wù)的精細(xì)化是未來十年的中心任務(wù),關(guān)鍵是做好政府業(yè)務(wù)數(shù)據(jù)整合,提高基層工作人員的現(xiàn)場工作效率,提升公眾的滿意度和政府部門的滿意度。大數(shù)據(jù)中心可在支持政府領(lǐng)導(dǎo)決策方面努力,但重點(diǎn)是提高基層工作效率而非決策分析,基層工作改進(jìn)容易見效而決策分析卻很難讓領(lǐng)導(dǎo)滿意。
3.3不要盲目地收集數(shù)據(jù)
太多數(shù)據(jù)會成為包袱,耗費(fèi)設(shè)施資源還耗費(fèi)管理精力。沒有應(yīng)用方向的數(shù)據(jù)不必忙于收集,更別指望會有人來信息共享,互聯(lián)網(wǎng)時代數(shù)據(jù)資源早已過剩,有效益的應(yīng)用目標(biāo)才是數(shù)據(jù)應(yīng)用的稀缺資源。
3.4從最有效益的數(shù)據(jù)整合應(yīng)用入手
政府?dāng)?shù)據(jù)整合對提高基層服務(wù)效率更能發(fā)揮作用,信息技術(shù)改進(jìn)操作的效果明顯高于改進(jìn)決策。數(shù)據(jù)整合可以按數(shù)據(jù)合作圈分步推進(jìn),利用率高的數(shù)據(jù)整合先做,利用率低的后做甚至不做,不必齊步走,好鋼用到刀刃上才是好方案。
3.5開放的大數(shù)據(jù)中心更有生命力
大數(shù)據(jù)中心要促進(jìn)政府?dāng)?shù)據(jù)向社會開放,數(shù)據(jù)開放是增加公眾獲得感的重要內(nèi)容,公眾支持率高能夠直接提升大數(shù)據(jù)中心存在的價值。開放的大數(shù)據(jù)中心可以與企業(yè)合作,訂購企業(yè)的可視化產(chǎn)品支持政府工作,將大數(shù)據(jù)中心做成政府與社會共享的可視化數(shù)據(jù)展示平臺會很受歡迎,社會影響力越大,大數(shù)據(jù)中心生命力越強(qiáng)。
四
4.1政府大數(shù)據(jù)概念的變通
政府部門的大數(shù)據(jù)概念與專家概念不同,專家認(rèn)為常規(guī)信息技術(shù)無法處理的規(guī)模數(shù)據(jù)才算是大數(shù)據(jù),因此政府沒有什么大數(shù)據(jù);政府認(rèn)為各部門的數(shù)據(jù)匯集起來就是大數(shù)據(jù),政府把大數(shù)據(jù)概念變通為數(shù)據(jù)整合的概念,使政府有大數(shù)據(jù)工作可做,但是《大數(shù)據(jù)時代》提出的大數(shù)據(jù)理念已不適用這種變通的應(yīng)用,要用數(shù)據(jù)整合的思維方式推動政府變通的大數(shù)據(jù)應(yīng)用。
4.2政府業(yè)務(wù)數(shù)據(jù)管理與服務(wù)的特點(diǎn)
政府日常工作最重要的數(shù)據(jù)是各部門的業(yè)務(wù)管理數(shù)據(jù),部門需要收集與積累本部門業(yè)務(wù)的管理與執(zhí)行記錄的數(shù)據(jù)。政府業(yè)務(wù)數(shù)據(jù)處理是對當(dāng)事人或事項(xiàng)的精準(zhǔn)處理,是下一步管理操作的依據(jù),業(yè)務(wù)數(shù)據(jù)是不可替代的。
4.3數(shù)據(jù)整合提升政府精細(xì)化管理能力
未來十年電子政務(wù)工作重點(diǎn)是實(shí)現(xiàn)政府業(yè)務(wù)的精細(xì)化管理,數(shù)據(jù)整合是實(shí)現(xiàn)精細(xì)化管理的重要手段。政府的信息管理能力取決數(shù)據(jù)的完整性與現(xiàn)場調(diào)用能力,來不及調(diào)用的數(shù)據(jù)等于沒有數(shù)據(jù),現(xiàn)場管理人員與用戶的信息不對稱會影響服務(wù)效率并增加受騙機(jī)會。數(shù)據(jù)整合類似數(shù)據(jù)庫建設(shè),實(shí)現(xiàn)各部門數(shù)據(jù)在語義上統(tǒng)一,優(yōu)化數(shù)據(jù)的組織,提高相關(guān)數(shù)據(jù)的調(diào)用速度,實(shí)現(xiàn)數(shù)據(jù)對現(xiàn)場工作人員的及時提供,發(fā)揮數(shù)據(jù)的整體優(yōu)勢。
4.4數(shù)據(jù)整合提高政府公共服務(wù)效率
各地政府都提出讓公眾“只跑一次”和“一網(wǎng)通辦”的目標(biāo),其目的是節(jié)約用戶時間,跨部門數(shù)據(jù)的調(diào)用速度是提高服務(wù)效率的關(guān)鍵,數(shù)據(jù)整合可以提高跨部門數(shù)據(jù)調(diào)用的流暢性,提高公共服務(wù)的最終效率。
4.5數(shù)據(jù)整合與信息共享不能混為一談
將數(shù)據(jù)整合與信息共享區(qū)別對待是提高政府?dāng)?shù)據(jù)使用效率重要環(huán)節(jié),數(shù)據(jù)整合的目標(biāo)是提高政府業(yè)務(wù)操作的效率,目標(biāo)很明確容易見效。數(shù)據(jù)整合工作宜采取應(yīng)用導(dǎo)向,急用先做,提高效益。信息共享目的是獲取信息來支持決策與研究,常常需要調(diào)用整個數(shù)據(jù)集進(jìn)行數(shù)據(jù)挖掘,信息共享需要對數(shù)據(jù)集整體的使用,數(shù)據(jù)整合調(diào)用是對特定數(shù)據(jù)的精準(zhǔn)調(diào)用,兩種應(yīng)用區(qū)別很大,不宜共用一個平臺。