關(guān)于機(jī)器學(xué)習(xí)的三大類型分析
為了把機(jī)器學(xué)習(xí)技術(shù)應(yīng)用于工業(yè),須先了解機(jī)器學(xué)習(xí)分成哪里些種類,有哪里些不同的算法,以及實際應(yīng)用時有什么值得注意的地方。
據(jù)報導(dǎo),機(jī)器學(xué)習(xí)算法逐漸潛入我們?nèi)粘I?,但是工業(yè)應(yīng)用卻面臨不少瓶頸,不如消費(fèi)應(yīng)用那么普及,Inductive AutomaTIon的Kathy Applebaum指出,綜觀目前工業(yè)采用機(jī)器學(xué)習(xí)技術(shù)的情況,以預(yù)測性維護(hù)(PM)為大宗,其次是品管、需求預(yù)測和機(jī)器人訓(xùn)練。
機(jī)器學(xué)習(xí)主要分成三大類型。首先是資料分析,Applebaum指出,診斷性分析(diagnosTIc analysis)是為了找出問題的原因,預(yù)測性分析(predicTIve analysis)則根據(jù)過去的資料預(yù)測未來,建議性分析以預(yù)測性分析為基礎(chǔ),建議該如何解決問題。
至于算法的種類,第一種是分群算法(k-means),InducTIve Automation的Kevin McClusky指出,分群算法不清楚各個類別所代表的意義,只會計算每一個點到已設(shè)定的群集中心的最短距離,進(jìn)而決定下一個群集中心,很適合進(jìn)行資料分類,完成缺陷分析。
第二種算法稱為決策樹,Applebaum認(rèn)為很適合預(yù)測性維護(hù),也可以跟其它算法搭配使用。
第三種算法稱為回歸分析,McClusky認(rèn)為適合調(diào)整工作流程和預(yù)測產(chǎn)量,例如依照目前的變量來預(yù)測產(chǎn)量。至于神經(jīng)網(wǎng)絡(luò)算法,則是模擬人腦的運(yùn)行方式,工業(yè)最常見的應(yīng)用是在視覺系統(tǒng)。
無論何種機(jī)器學(xué)習(xí)應(yīng)用,都需要先收集優(yōu)質(zhì)的資料,首要之務(wù)便是找到適合的資料并加以處理,進(jìn)而確保資料質(zhì)量。McClusky也建議企業(yè)執(zhí)行機(jī)器學(xué)習(xí)計畫時,務(wù)必采用擷取、轉(zhuǎn)換和載物(ETL)來取得資料,把資料收集流程自動化。Applebaum則建議勇于多嘗試不同的算法,各家供應(yīng)商皆有提供分群、神經(jīng)網(wǎng)絡(luò)、回歸等各式各樣的算法。