大數(shù)據(jù)之結(jié)構(gòu)化數(shù)據(jù)
掃描二維碼
隨時(shí)隨地手機(jī)看文章
數(shù)值計(jì)算是人類在科技能力低下時(shí)代的選擇,結(jié)構(gòu)化數(shù)據(jù)是大的進(jìn)步,其實(shí)并沒(méi)有多么超越過(guò)去。它要從我出發(fā),為世界設(shè)計(jì)一個(gè)框架,厘清對(duì)象的關(guān)系,以獲得問(wèn)題的求解。無(wú)論世界多么復(fù)雜,它都要抽取某些特征來(lái)研究,只關(guān)注最關(guān)鍵的點(diǎn)位;不管世界的變遷,它要維持一個(gè)穩(wěn)定的體系。
正如醫(yī)學(xué)上,不管個(gè)性化的生命,抽取一些顯著特征,展開(kāi)標(biāo)準(zhǔn)化的研究;不管豐富的內(nèi)外影響,用有限的關(guān)系去應(yīng)對(duì);不管生命如何變化,不管醫(yī)學(xué)需求如何改變,它都要維持一個(gè)靜態(tài)的模型。人類要進(jìn)步,醫(yī)學(xué)要發(fā)展,就應(yīng)當(dāng)脫離過(guò)去的溫柔約束,打破結(jié)構(gòu)化數(shù)據(jù)的框架,進(jìn)化到大數(shù)據(jù)模式。它有開(kāi)放的基因,基于互聯(lián)網(wǎng)運(yùn)作,一切力量都可加入進(jìn)來(lái),所有需要計(jì)算的都可以納入,任何需求都可以滿足。
以前的結(jié)構(gòu)化數(shù)據(jù)庫(kù)采用了集中的方法,以高效地提供運(yùn)算需要的數(shù)據(jù),比如把億萬(wàn)人的身高存到數(shù)據(jù)庫(kù)中,以快速計(jì)算平均值。現(xiàn)在我們進(jìn)步了很多,不使用這種數(shù)據(jù)存儲(chǔ)也是可以的,可存儲(chǔ)為文件系統(tǒng)中的一個(gè)個(gè)節(jié)點(diǎn),寄存于世界的每個(gè)傳感器中,放置到每個(gè)人的手機(jī)中,根據(jù)需要和權(quán)限,檢索了集中到一起進(jìn)行運(yùn)算。
最初,我們接觸的是分隔的,離散的,有限的數(shù)據(jù),要測(cè)量土地的面積,運(yùn)作帝國(guó)的稅收體系,我們發(fā)展了數(shù)值計(jì)算的方法,依靠籌碼、算盤、紙筆等完成任務(wù)。第二個(gè)階段隨著現(xiàn)代化而不斷開(kāi)啟,世界變得復(fù)雜,結(jié)構(gòu)化的數(shù)據(jù)應(yīng)用得以產(chǎn)生,并不斷發(fā)展壯大。所謂結(jié)構(gòu)化數(shù)據(jù),是定義某個(gè)研究目標(biāo)的特性,形成列,然后采集不同的個(gè)體,形成行,行和列就形成了矩陣的結(jié)構(gòu),可以有效地展開(kāi)各種工作。迄今為止,我們還享受著這一先進(jìn)信息化體系帶來(lái)的好處,全球聯(lián)網(wǎng)的股票交易系統(tǒng)、現(xiàn)代化的大生產(chǎn)體系,都得益于這強(qiáng)勁而有效的數(shù)據(jù)處理系統(tǒng)。第三個(gè)階段正在開(kāi)啟,我們正在擁有海量的、多類別的數(shù)據(jù),要求我們改進(jìn)認(rèn)識(shí),發(fā)展新的數(shù)據(jù)分析體系。
只要我們根據(jù)某種規(guī)則,能從某個(gè)端口獲得數(shù)據(jù),并且能滿足一定的響應(yīng)速度就可以,不管這個(gè)數(shù)據(jù)是如何來(lái)的,不管它是傳統(tǒng)數(shù)據(jù)庫(kù)的記錄,還是傳感器的測(cè)量值,還是X光片的識(shí)別結(jié)果。數(shù)據(jù)存放在世界各處,根據(jù)需求取用,這是互聯(lián)時(shí)代唯一可行的方案,以往的方案中,數(shù)據(jù)要運(yùn)轉(zhuǎn)到某個(gè)集中的地方,規(guī)范化地組織,顯然無(wú)法應(yīng)對(duì)海量的數(shù)據(jù)。
一切可能影響生命和疾病的因素都可參與進(jìn)來(lái),只要它能獲得人們的認(rèn)可,只要我們發(fā)展了相應(yīng)的測(cè)量方法。世上一切可以計(jì)算的單元都可參與進(jìn)來(lái)(比如調(diào)用每個(gè)空閑的運(yùn)算單元),只要它能正確地根據(jù)動(dòng)態(tài)邏輯輸出運(yùn)算結(jié)果。世界上一切能思考的存在都可參與進(jìn)來(lái)(包括人工智能),鼓勵(lì)民眾根據(jù)他們的理解組織數(shù)據(jù)運(yùn)算,集結(jié)民眾智慧來(lái)探索真知。這是對(duì)科學(xué)的擴(kuò)展,理解世界的主角就從科學(xué)時(shí)代的少數(shù)人擴(kuò)展到全體民眾。
這是要打造平臺(tái),以引入所有的智慧因素,鮮明區(qū)別于以往身先士卒的科學(xué)思路。這是當(dāng)下的生產(chǎn)力水平下,人類可能做到的最好。結(jié)構(gòu)化數(shù)據(jù)要求權(quán)威的團(tuán)隊(duì)定義一切,不允許其他人修改調(diào)整;大數(shù)據(jù)體系不一樣,允許每個(gè)人添加新的項(xiàng)目,定義各項(xiàng)目之間的關(guān)系,定義哪些項(xiàng)目需要整合了體現(xiàn)新特性。我們可提供圖形化的界面,便于每個(gè)人理解和操縱各種數(shù)據(jù)項(xiàng)目。只要這種改進(jìn)得到別人的認(rèn)可,就可流傳開(kāi)去。
結(jié)構(gòu)化數(shù)據(jù)體系在強(qiáng)化中心,存在一個(gè)數(shù)據(jù)中心,所有數(shù)據(jù)都匯總到中心,并從中心發(fā)出,哪怕數(shù)據(jù)可以映射到各地,也是要維護(hù)中心的威嚴(yán),不許可人們自由行事?,F(xiàn)在,這種中心消解了,數(shù)據(jù)之間的交互是人們自由發(fā)起的,涉及的數(shù)據(jù)范圍由人們自由定義,觸發(fā)條件也是個(gè)性化的。
結(jié)構(gòu)化數(shù)據(jù)要求專業(yè)人員的思考,體現(xiàn)了科學(xué)的價(jià)值觀和方法論,大數(shù)據(jù)方法要體現(xiàn)每個(gè)人的思維,它要復(fù)制人理解世界的模式,通過(guò)對(duì)世界的真實(shí)模擬來(lái)幫助思考,比如,列出最近一段時(shí)間的舌苔變化,同步顯示所有影響舌苔的因素,以啟發(fā)人的洞察力。
計(jì)算是人的本能,一切工具都是這個(gè)本能的擴(kuò)展,籌碼和算盤就是明顯例子,古時(shí)候能力有限,只能應(yīng)對(duì)關(guān)鍵需求,比如人口、田畝、兵力。計(jì)算機(jī)是大的進(jìn)步,它極大地?cái)U(kuò)展了數(shù)據(jù)量和運(yùn)算速度,完全超越人類,但它被征用來(lái)運(yùn)算結(jié)構(gòu)化數(shù)據(jù),這是統(tǒng)治時(shí)代的思維,凸顯少數(shù)人的重要性,只能應(yīng)對(duì)少數(shù)重要特征,如此做出關(guān)于人類命運(yùn)的決定。
回過(guò)頭去理解當(dāng)下的關(guān)于大數(shù)據(jù)的定義,就能明白,它們幾乎都是思維古板的科學(xué)時(shí)代的人們從自身角度出發(fā)的見(jiàn)解,比如能容納海量數(shù)據(jù),高并發(fā)低延時(shí)。這是發(fā)自技術(shù)思維的,一些庸俗化的認(rèn)識(shí),試圖把世界框進(jìn)過(guò)去的模式,根本沒(méi)有觸及互聯(lián)的精髓,不理解人類的未來(lái),也就低效于人類迫切需要解決的問(wèn)題。
在生機(jī)勃勃的互聯(lián)時(shí)代,大數(shù)據(jù)會(huì)快速進(jìn)化。它很可能是正確的方向,它是我們所能達(dá)到的最新認(rèn)識(shí),重大進(jìn)展還沒(méi)有取得,那是因?yàn)槲覀兊恼J(rèn)識(shí)還不夠深入。當(dāng)數(shù)據(jù)獲得方法、存儲(chǔ)方式、處理思路、和如何解讀結(jié)論等多個(gè)環(huán)節(jié)都有長(zhǎng)足進(jìn)展后,大數(shù)據(jù)將發(fā)揮其真正價(jià)值,推進(jìn)人類發(fā)展。
隨著大數(shù)據(jù)的發(fā)展,科技就從以自我為中心轉(zhuǎn)向以對(duì)象為中心。這種體系用于醫(yī)學(xué),能真正以生命為中心,看到生命的流淌,感知到每一次內(nèi)外刺激,體會(huì)生老病死,真正走入人的世界,感知喜怒哀樂(lè),協(xié)同每個(gè)人展開(kāi)。從數(shù)值化的計(jì)算,到傳統(tǒng)的統(tǒng)計(jì)分析,到大數(shù)據(jù);從孤立的數(shù)據(jù),到結(jié)構(gòu)化數(shù)據(jù),到非結(jié)構(gòu)化數(shù)據(jù),已經(jīng)昭示了科學(xué)的發(fā)展軌跡。