數(shù)據(jù)機器學習在檢測故障中有什么可以應用的
前言:傳統(tǒng)工業(yè)中,維修時花費的大部分時間都在故障的診斷上,而不是進行實際的補救,因為故障診斷是機器維修中最具挑戰(zhàn)性的階段。在能源行業(yè)中,精確的故障診斷直接影響到供能的穩(wěn)定性。
隨著傳感器技術,數(shù)據(jù)存儲和互聯(lián)網(wǎng)的飛速發(fā)展,工廠變得越來越智能,并且生成更多的過程數(shù)據(jù)。針對大量數(shù)據(jù)的數(shù)據(jù)分析需求應運而生,通過基于數(shù)據(jù)的機器學習技術能有效改善故障診斷。
本文將簡要介紹幾種在故障診斷領域廣泛應用的機器學習技術及其各自的應用方向,并對每種技術的優(yōu)缺點進行簡單分析。包括:貝葉斯網(wǎng)絡(BN),人工神經(jīng)網(wǎng)絡(ANN),支持向量機(SVM)和隱馬爾可夫模型(HMM)技術。
貝葉斯網(wǎng)絡(BN,Bayesian Network)
貝葉斯網(wǎng)絡是故障檢測的一種常用的機器學習技術。BN是有向無環(huán)圖,即網(wǎng)絡結(jié)構要求節(jié)點之間不能形成任何閉環(huán),其節(jié)點表示隨機變量,其條件相關性由鏈接節(jié)點的有向弧表示。
BN是白盒模型,因為圖形表示使用戶可以直觀地輕松理解模型變量之間的交互。這對于建模不確定性十分有益,并且可以較容易地使用來自多個來源的數(shù)據(jù)(通常在制造系統(tǒng)中找到)來對多個原因和結(jié)果的層次級別進行建模。訓練BN的主要挑戰(zhàn)在于樹結(jié)構的構建。
BN廣泛應用于故障監(jiān)測及可靠性分析領域,1995年 Microsoft公司將 BN 運用于打印機的故障診斷,通過不斷計算在不同步驟下可能需要的維修方案的功效確定最優(yōu)的維修路徑。在半導體行業(yè),Yang&Lee和Nguyen等人使用BN評估工藝變量對晶圓質(zhì)量的影響,從而使用歷史工藝數(shù)據(jù)診斷缺陷晶圓的根本原因??煽啃苑治鲆话惆ǚ治龉收习l(fā)生的概率和時間、系統(tǒng)冗余,需要綜合考慮系統(tǒng)的多狀態(tài)單元、動態(tài)變化、運行條件等因素。在能源領域,例如電廠運行可靠性,核能系統(tǒng)的可行性中都有著成功應用。此外BN 還廣泛應用于發(fā)動機轉(zhuǎn)子、電網(wǎng)、車輛電源系統(tǒng)、液壓泵、電力變壓器、太陽能發(fā)電廠、移動通信網(wǎng)絡、制造過程的故障診斷。
人工神經(jīng)網(wǎng)絡(ANN, Artificial Neural Network)
人工神經(jīng)網(wǎng)絡是一種非參數(shù)的機器學習算法,受人類中樞神經(jīng)系統(tǒng)功能的啟發(fā)。自適應特性提供了強大的建模功能,適用于特征之間的非線性關系。
人工神經(jīng)網(wǎng)絡目前沒有一個統(tǒng)一的正式定義。不過,具有下列特點的統(tǒng)計模型可以被稱作是“神經(jīng)化”的:
具有一組可以被調(diào)節(jié)的權重(被學習算法調(diào)節(jié)的數(shù)值參數(shù))這些可調(diào)節(jié)的權重可以被看做神經(jīng)元之間的連接強度。
可以估計輸入數(shù)據(jù)的非線性函數(shù)關系
人工神經(jīng)網(wǎng)絡與生物神經(jīng)網(wǎng)絡的相似之處在于,它可以集體地、并行地計算函數(shù)的各個部分,而不需要描述每一個單元的特定任務。
單個神經(jīng)元示意圖,f為函數(shù)關系,w為權重
ANN的非參數(shù)性質(zhì)及其以高精度對非線性復雜問題進行建模的能力,使ANN可應用于故障診斷問題。該模型易于初始化,因為不需要像BN一樣指定網(wǎng)絡結(jié)構。但是,缺點包括“黑匣子”性質(zhì),這使得模型難以解釋。此外,人工神經(jīng)網(wǎng)絡通常無法處理輸入中的不確定性,并且計算量大,因此在訓練過程中收斂通常會較慢。人工神經(jīng)網(wǎng)絡容易過度擬合,需要大量的多樣化數(shù)據(jù)集進行訓練以防止出現(xiàn)此問題。
ANN以大規(guī)模并行能力,適應學習能力,分布式信息存儲、魯棒性等特點,在故障監(jiān)測及診斷領域大受關注。大量多樣的神經(jīng)網(wǎng)絡算法被開發(fā)及利用。神經(jīng)網(wǎng)絡算法可以說是機器學習技術中的明星。其應用范圍十分廣泛,在能源領域有著相對成熟的應用,包括負荷預測,各類故障診斷等等。
支持向量機(SVM, supportvector machine)
SVM使用不同的核函數(shù)(例如徑向基函數(shù)(RBF)或多項式內(nèi)核)來找到一種能將數(shù)據(jù)最好地分離的超平面,并且在與小型訓練集一起使用時具有良好的分類性能。支持向量機的成功應用領域包括面部識別,手寫字符識別,語音識別,圖像檢索,預測等。
SVM是建模線性和非線性關系的出色技術。與其他非參數(shù)技術(例如ANN)相比,計算時間相對較快。大型訓練數(shù)據(jù)集的可用性是機器學習中的一個挑戰(zhàn),但是,即使在訓練數(shù)據(jù)量有限的情況下,SVM也有不錯的效果。
支持向量機在故障定位中的應用不像BN和ANN常見。支持向量機是工業(yè)生產(chǎn)系統(tǒng)的非常有效的監(jiān)視和診斷工具,例如使用該技術來診斷在不同切削條件下的端面銑削過程中的刀具破損故障。以及SVM在風力發(fā)電機組中的故障監(jiān)測,此外在醫(yī)學領域,SVM被用于各種疾病的診斷,例如用于癌癥及糖尿病的監(jiān)測。在能源領域,支持向量機還被應用于負荷預測,例如房屋冷熱負荷預測,風電發(fā)電量預測及用戶負荷預測等。
隱馬爾可夫模型(HMM, Hidden Markov Model)
隱馬爾可夫模型是馬爾可夫鏈模型的擴展,用于估計動態(tài)過程中狀態(tài)轉(zhuǎn)換和測量輸出的概率分布,假定過程的狀態(tài)不可觀察。描述一個含有隱含未知參數(shù)的馬爾可夫過程,是一個雙重隨機過程(包括馬爾可夫鏈和一般隨機過程)。
HMM是一種概率模型,在建模過程中具有不可觀察的狀態(tài)(例如化學過程或設備的健康狀況)方面非常出色,因此非常適合故障診斷。但是,訓練過程通常需要大量計算。
HMM已用于連續(xù)和離散制造系統(tǒng)的故障診斷。例如,診斷軸承的磨損及故障,應用于復雜化工過程的故障監(jiān)測,感應電動機的故障診斷等。此外,HMM廣泛應用在語音識別,詞性自動標注,音字轉(zhuǎn)換,概率文法等各個自然語言處理、算術編碼、地理統(tǒng)計學、企業(yè)產(chǎn)品市場預測、人口過程、生物信息學(編碼區(qū)域或基因預測)等應用領域。在能源領域,也被應用于房屋負荷預測。