帶你了解數(shù)據(jù)信息知識(shí)之間的關(guān)系與區(qū)別
大數(shù)據(jù)是比較火的一個(gè)熱詞,但說到什么是數(shù)據(jù),很多人首先想到的是數(shù)字,如1,2,3等。其實(shí)這是數(shù)據(jù)的狹義定義。數(shù)據(jù)所涉及的范圍很廣,并且隨著技術(shù)的發(fā)展,數(shù)據(jù)的定義范圍也越來越寬泛,比如在互聯(lián)網(wǎng)時(shí)代文字,圖片和視頻都是數(shù)據(jù),醫(yī)院里面的醫(yī)學(xué)影像圖片也都是數(shù)據(jù),甚至包括公司和工廠的設(shè)計(jì)圖案、解決方案等等。
數(shù)據(jù)是一種客體存在,并隨著文明的發(fā)展而不斷擴(kuò)大和變化。以前并不是數(shù)據(jù)的,但現(xiàn)在看來都已經(jīng)變成了數(shù)據(jù)內(nèi)的范疇,比如在互聯(lián)網(wǎng)出現(xiàn)之前,文字并不被認(rèn)為是數(shù)據(jù),但是互聯(lián)網(wǎng)出來以后,通過將文字進(jìn)行電子化儲(chǔ)存,因此成了可以計(jì)算的文本,這就涉及到自然語言處理技術(shù)。甚至包括我們聊天記錄、網(wǎng)頁內(nèi)容、打電話記錄、用戶生存內(nèi)容(UGC)、論壇評(píng)論,購物數(shù)據(jù),社會(huì)關(guān)系,行程記錄等等都是數(shù)據(jù)內(nèi)容。數(shù)據(jù)也經(jīng)歷了從結(jié)構(gòu)化到非結(jié)構(gòu)化的轉(zhuǎn)變,而且非結(jié)構(gòu)化數(shù)據(jù)中蘊(yùn)含這更大的價(jià)值。
由于人們多數(shù)據(jù)的概念沒有那么清晰,容易將數(shù)據(jù)、信息和知識(shí)這三個(gè)的理念弄混,特別是數(shù)據(jù)與信息,真是傻傻分不清楚。雖然數(shù)據(jù)、信息、知識(shí)之間存在這聯(lián)想,但還是很有必要將三者有個(gè)合理的認(rèn)識(shí),下面就來詳細(xì)講講他們之間的區(qū)別與關(guān)系。
信息是對(duì)世界人和事等描述,它比數(shù)據(jù)更加抽象。信息是隱藏在數(shù)據(jù)背后的規(guī)律,需要人類的挖掘和探索才能夠發(fā)現(xiàn)。比如地球的面積和質(zhì)量,物理學(xué)中的參數(shù),圓周率等。
數(shù)據(jù)是信息的載體,從數(shù)據(jù)到信息不僅是一門技術(shù),也是一門藝術(shù)。以胡夫大金字塔為例,該金字塔的周長和高度的比值為大約6.29,金字塔的長為20埃及古尺長,寬為10埃及古尺長,但高度為11.18埃埃及古尺長。為什么不是一個(gè)整數(shù)?
通過考古專家的分析,這是為了保證對(duì)角線都是整數(shù),分別是15和25。通過對(duì)這些數(shù)據(jù)處理,我們可以得到在古埃及就懂得了勾股定理。
數(shù)據(jù)和信息處理以后就會(huì)得到知識(shí)。而知識(shí)是數(shù)據(jù)和信息的更加高級(jí)和抽象的概念。知識(shí)具有系統(tǒng)性、規(guī)律性和可預(yù)測(cè)性。
數(shù)據(jù)、信息和知識(shí)這三者都是社會(huì)生產(chǎn)活動(dòng)中的一種基礎(chǔ)性資源,都可以采用數(shù)宇、文宇、符號(hào)、圖形、聲音、影視等多媒體來表示。而且,它們都同時(shí)具有客觀性、真實(shí)性、正確性、價(jià)值性、共享性,結(jié)構(gòu)性等特點(diǎn)。
比如我們通過觀察可以記錄星球的位置和出現(xiàn)的時(shí)間等原始數(shù)據(jù),再對(duì)得到的數(shù)據(jù)進(jìn)行分析和挖掘,就能夠計(jì)算出星球運(yùn)動(dòng)的規(guī)律,這就是信息,然后對(duì)信息進(jìn)行總結(jié)和提煉,就可以得到開普勒三定律,這就是知識(shí)。而得到的知識(shí),能夠使我們更加清晰的了解世界和生活,還能夠通過知識(shí)不斷改變我們周圍的世界。而所有的一切的基礎(chǔ)就是數(shù)據(jù)。
數(shù)據(jù)、信息和知識(shí)是知識(shí)工作者對(duì)客觀事物感知和認(rèn)識(shí)的3個(gè)連貫的階段。
(1)數(shù)據(jù)的組織階段。數(shù)據(jù)是一種將客觀事物按照某種測(cè)度感知而獲取的原始記錄,它可以直接來自測(cè)量儀器的實(shí)時(shí)記錄,也可以來自人的認(rèn)識(shí),但是大量的數(shù)據(jù)多是借助于數(shù)據(jù)處理系統(tǒng)自動(dòng)地從數(shù)據(jù)源進(jìn)行采集和組織的。數(shù)據(jù)源是指客觀事物發(fā)生變化的實(shí)時(shí)數(shù)據(jù)。
(2)信息的創(chuàng)造階段。信息是根據(jù)一定的發(fā)展階段及其目的進(jìn)行定制加工而生產(chǎn)出來的。信息系統(tǒng)就是用于加工、創(chuàng)造信息產(chǎn)品的人機(jī)系統(tǒng)。根據(jù)對(duì)象、目的和加工深度的不同,可以將信息產(chǎn)品分為一次信息、二次信息直至高次信息。
(3)知識(shí)的發(fā)現(xiàn)階段。知識(shí)是知識(shí)工作者運(yùn)用大腦對(duì)獲取或積累的信息進(jìn)行系統(tǒng)化的提煉、研究和分析的結(jié)果,知識(shí)能夠精確地反映事物的本質(zhì)。
從數(shù)據(jù)到信息再到知識(shí),3個(gè)階段是螺旋上升的循環(huán)周期。人們運(yùn)用信息系統(tǒng),對(duì)信息和相關(guān)的知識(shí)進(jìn)行規(guī)律性、本質(zhì)性和系統(tǒng)性的思維活動(dòng),創(chuàng)造新的知識(shí)。之后,新的知識(shí)又開辟了需要進(jìn)一步認(rèn)識(shí)的對(duì)象領(lǐng)域,然后使人們補(bǔ)充獲取新的數(shù)據(jù)和信息,進(jìn)人新一輪的上升式循環(huán)周期。