基于透平大數(shù)據(jù)的智能分析與自動診斷系統(tǒng)開發(fā)
引言
旋轉機械遠程在線診斷系統(tǒng)經(jīng)過十幾年的應用已經(jīng)形成較為成熟的體系。但由于早期網(wǎng)絡帶寬相對較窄,原始數(shù)據(jù)需壓縮才能保證實時傳輸,僅能盡量保證主要故障頻率成分保留。隨著4G、5G等高速網(wǎng)絡技術的不斷應用,原始數(shù)據(jù)的遠程傳輸與分析成為可能。利用包含振動信號非線性的異常細節(jié)特征,可以捕捉到更為精準的設備故障早期萌芽狀態(tài),同時,更大的數(shù)據(jù)量也對數(shù)據(jù)智能處理及其方法提出了更高的要求,僅憑傳統(tǒng)的人工方式進行篩選與分析已遠遠無法滿足。
1常用工業(yè)大數(shù)據(jù)處理方法
設備運行大數(shù)據(jù)處理,就是從海量的、模糊的、一般的數(shù)據(jù)中識別提取隱含在內需要人為分析查看分辨的信息。利用透平旋轉設備運行狀態(tài)數(shù)據(jù),基于知識圖譜,可以對設備故障現(xiàn)象與振動數(shù)據(jù)的數(shù)值特征建立對應管理,固化為診斷規(guī)則存入決策機中,設備運行時一旦再次出現(xiàn)相應特征數(shù)據(jù)或在其閾值區(qū)間內,則會產生故障的預警,從而實現(xiàn)計算機對故障的主動識別與判斷。
1.1優(yōu)化算法
大數(shù)據(jù)分析中常采用各類優(yōu)化算法進行數(shù)據(jù)與模型的處理,如采用隨機梯度下降)stochasticGradientDescent)進行算法模型的優(yōu)化。該方法將隨機與優(yōu)化相結合,屬于梯度下降法的一種,適用于數(shù)據(jù)量較大且分散度大的問題。對每個優(yōu)化問題定義一個目標函數(shù)f(w),梯度下降就是采用迭代的策略,從初始點w1開始,每一輪迭代沿著目標函數(shù)在當前點的負梯度方向增長特定的步長,直至最終下降到預設值,得到最優(yōu)解w。
1.2分類模型
隨機森林是一個包含多個決策樹的分類器,其基本思想是訓練多個決策樹,每個決策樹基于有放回抽樣的方式隨機形成的一組訓練集)bootstrap取樣),用未抽到的樣本作預測,進行誤差評估。對每個決策樹的節(jié)點,隨機選擇若干個基于此節(jié)點的特征,根據(jù)這些數(shù)據(jù)特征,計算最佳的分裂方式。這樣,每棵決策樹都會完整生長而不會出現(xiàn)剪枝)pruning)。這種方法的優(yōu)點在于:對于大量資料信息,可以產生高精確度的分類器,同時可以處理大量的數(shù)據(jù)。
1.3流形學習
流形學習的本質是從高維采樣數(shù)據(jù)中恢復出低維流形的結構,即找到高維空間中的低維流形,求出相應的嵌入映射,實現(xiàn)維數(shù)的約簡或者數(shù)據(jù)可視化。流形學習從觀測到的現(xiàn)象中尋找事實的本質描述,發(fā)現(xiàn)數(shù)據(jù)的內在規(guī)律。
1.4無參模型
傳統(tǒng)型數(shù)據(jù)挖掘模型一般都屬于有參模型,即模型中包含待定參數(shù)的函數(shù)形式。但對工業(yè)大數(shù)據(jù)而言,不設定參數(shù)的統(tǒng)計分析(無參分析,Non二parametricstatistics)會更有利于發(fā)現(xiàn)小概率的特殊事件。無參模型更加適用于海量數(shù)據(jù)母群體分布情況不明確的數(shù)據(jù)樣本,無參模型的特點在于減少或不更改建立的模型,具有一定的穩(wěn)健性。
2大數(shù)據(jù)人工智能算法的構建
對于透平設備的故障大數(shù)據(jù)分析,僅采用單一的算法無法滿足不同階段的數(shù)據(jù)識別、統(tǒng)計及篩選需求。在機組調試及初始運行階段,沒有標定的故障數(shù)據(jù),宜采用無參算法進行數(shù)據(jù)的分類與篩選,后期可采用隨機森林等決策樹輔助進行規(guī)則診斷。在設計搭建設備健康大數(shù)據(jù)平臺實現(xiàn)數(shù)據(jù)挖掘及自動診斷過程中,主要采用以下開發(fā)路線:
第一步,開發(fā)一套對機組運行數(shù)據(jù)的自適應監(jiān)測機制,能夠自動對采集到的數(shù)據(jù)進行無監(jiān)督學習,從數(shù)據(jù)本身的特征對設備運行是否平穩(wěn)、波動大小、趨勢變化、數(shù)據(jù)真?zhèn)?、干擾信號、振動與工藝參數(shù)的關聯(lián)關系等作出判斷與篩選標定。
第二步,依據(jù)故障原理和專家經(jīng)驗,將異常數(shù)據(jù)識別規(guī)則與大數(shù)據(jù)自學習得到的特征相結合,構建多個動態(tài)決策樹,應用隨機森林算法,實時對數(shù)據(jù)進行進一步的聚類與細分。
第三步,開發(fā)故障規(guī)則庫。根據(jù)機組自身結構參數(shù)、運行區(qū)域范圍與歷史運行數(shù)據(jù),采用機理模型仿真的方式補充完整故障數(shù)據(jù)空間,窮舉機組可能發(fā)生的故障類型,對這些故障類型進行定量描述)提取其典型數(shù)據(jù)特征),構建故障數(shù)據(jù)分類器。
第四步,對每類故障進行影響因素分析,即故障追溯研究,充分挖掘產生故障的各類關鍵影響因素,并根據(jù)影響因素關聯(lián)相關數(shù)據(jù)庫。
第五步,提取數(shù)據(jù)庫中各類故障對應的每項數(shù)據(jù),構建故障診斷模型,包括基于振動和工藝參數(shù)數(shù)值構建的數(shù)據(jù)分析模型、基于自適應包絡分析算法的圖譜識別模型等,并結合第一步建立的每類故障的規(guī)則庫和知識圖譜進行故障的診斷。
第六步,對故障進行統(tǒng)計與分布分析,并進行可視化展示,提供故障的解決措施,并為領導及管理層提供決策支持。
3應用效果
構建了陜鼓智能診斷系統(tǒng)平臺,對在線的300余套機組進行定期的數(shù)據(jù)監(jiān)測與分析,篩選出異常數(shù)據(jù)機組,并給出推測的診斷結果,如圖1所示。從200個典型故障測試用例結果統(tǒng)計,準確率達到85%以上。
圖1 陜鼓智能診斷系統(tǒng)診斷結果界面
4結語
隨著工業(yè)互聯(lián)網(wǎng)技術的不斷發(fā)展,工業(yè)數(shù)據(jù)體量將越來越龐大,傳統(tǒng)的監(jiān)測與診斷方法將逐步被基于人工智能的數(shù)據(jù)挖掘技術所替代。本文通過研發(fā)高通量數(shù)據(jù)專家診斷系統(tǒng),闡述了在工業(yè)大數(shù)據(jù)環(huán)境下專家診斷系統(tǒng)的開發(fā)路線,為工業(yè)互聯(lián)網(wǎng)的應用落地提供了借鑒思路。