工業(yè)大數(shù)據(jù)的分類和挑戰(zhàn)
實(shí)際上,工業(yè)數(shù)據(jù)有三個(gè)特點(diǎn)。第一個(gè)特點(diǎn)是多模態(tài)。過去很簡單粗暴地將數(shù)據(jù)分成結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù),但工業(yè)企業(yè)不是這樣。今天看到的很多好像格式不一樣的、非結(jié)構(gòu)化的工程數(shù)據(jù),真正把它打開的時(shí)候是不一樣的。非結(jié)構(gòu)化數(shù)據(jù)的使用效率取決于結(jié)構(gòu)化的程度,只有結(jié)構(gòu)化才可以被高效利用;第二個(gè)特點(diǎn)是高通量,很多設(shè)備是不停機(jī)的,所有的數(shù)據(jù)是7*24小時(shí)連續(xù)產(chǎn)生的,量非常大;第三個(gè)特點(diǎn)是強(qiáng)關(guān)聯(lián),在工業(yè)的不同行業(yè),數(shù)據(jù)關(guān)聯(lián)遵循不同的規(guī)律而非簡單的聚合。
所以工業(yè)大數(shù)據(jù)本身的特點(diǎn)帶來了非常多的挑戰(zhàn)。除了數(shù)據(jù)獲取的挑戰(zhàn),隨之而來的就是數(shù)據(jù)分析、應(yīng)用的挑戰(zhàn)。這里邊最大的限制是因果關(guān)系,即數(shù)據(jù)驅(qū)動(dòng)的方法只能告訴我們關(guān)聯(lián)性,而無法不能告訴我們因果性。比如淘寶推薦商品,只知道推薦相關(guān)商品,卻不關(guān)心這個(gè)事情的因果——為什么用戶是這樣的人。但這在工業(yè)上是行不通的,尤其是控制方面,因此模型需要長時(shí)間的分析和驗(yàn)證。
工業(yè)領(lǐng)域存在白盒模型和灰盒模型,白盒模型即工業(yè)機(jī)理,企業(yè)會(huì)根據(jù)工業(yè)機(jī)理設(shè)計(jì)工序、產(chǎn)品結(jié)構(gòu)和工藝,這是第一步。當(dāng)它們被設(shè)計(jì)完之后,運(yùn)行中又會(huì)出現(xiàn)大量的不確定性,這些不確定性的消除靠的就是專家、工匠的經(jīng)驗(yàn),讓整個(gè)流程生產(chǎn)變得更加穩(wěn)定和高效,這是灰盒態(tài)。不再對(duì)機(jī)理和知識(shí)本身進(jìn)行分析和理解的數(shù)據(jù)模型,是一種黑盒模型。
工業(yè)大數(shù)據(jù)和工業(yè)智能的本質(zhì)就是,將這些經(jīng)驗(yàn)和知識(shí)量化學(xué)習(xí)出來,挖掘心中有口中無的隱性知識(shí),或者嘗試通過數(shù)據(jù)方法把統(tǒng)計(jì)關(guān)系找到,再交還給工匠分析。工業(yè)就是工業(yè),它存在的時(shí)間比信息化時(shí)間長,積淀比信息化多,而大數(shù)據(jù)和人工智能技術(shù)只是給工業(yè)上帶來小的變化,嘗試幫它去消除不確定性。