無需數(shù)據(jù)科學專業(yè)知識即可輕松使用機器學習
希望明日保持盈利的公司,必須在今日設定方向。數(shù)字化是關鍵,因為基于數(shù)據(jù)的服務決定了未來的業(yè)務成功。這使得在工業(yè)生產(chǎn)中使用人工智能(AI)成為當今機器和工廠面臨的主要挑戰(zhàn)之一。從檢測異常,到分類和預測磨損或損壞,再到質(zhì)量控制,人工智能解決方案已用于許多領域。
人工智能從何用起?借助自動化機器學習(AML)工具,魏德米勒為用戶提供了合適的軟件。自動化機器學習工具使行業(yè)專家可以根據(jù)他們的應用知識獨立創(chuàng)建機器學習(ML)模型。如此一來,他們就可以將其對機器和工廠業(yè)務的專業(yè)知識應用到軟件工具中。在建模過程結(jié)束時,專家將獲得適合其應用的模型。
復雜的建模過程
如今,數(shù)據(jù)科學家可以分析數(shù)據(jù)并創(chuàng)建機器學習模型。這個過程主要涉及手動操作并具有探索性。這不僅創(chuàng)建了實際的模型,而且還創(chuàng)建了所謂的機器學習流程,其中,數(shù)據(jù)經(jīng)過許多處理步驟,最后顯示模型并輸出結(jié)果。創(chuàng)建模型和機器學習流程的過程非常復雜??偣灿卸噙_1040種可能的組合來構建機器學習解決方案。ML-Pipeline的具體設計在每種用例中都是獨一無二的。當然,數(shù)據(jù)科學家可以使用一些軟件工具來支持Pipeline的基本結(jié)構,從而簡化工作。但是,機器學習解決方案的大多數(shù)參數(shù)必須以創(chuàng)造性的方式手動確定,這是一項艱巨的工作。在Pipeline建模和構建過程中,數(shù)據(jù)科學家不斷與機器和過程專家討論數(shù)據(jù)中所體現(xiàn)的關系。共同解釋結(jié)果,從而最終確定模型參數(shù)并構建Pipeline。因此,行業(yè)專家的應用知識對于創(chuàng)造一個成功的機器學習解決方案而言至關重要。
使機器學習的使用民主化
魏德米勒的愿景是使機器學習的應用民主化,即,使每一位行業(yè)專家都能獲得機器學習知識,并且確保機器學習在工業(yè)中的應用不為數(shù)據(jù)科學家數(shù)量所限。如此便可充分利用行業(yè)專家的現(xiàn)有知識。因此,需要標準化、簡化機器學習在工業(yè)中的應用,以使行業(yè)專家無需數(shù)據(jù)科學領域的專業(yè)知識即可獨立創(chuàng)建機器學習解決方案。此外,還需要最大化地實現(xiàn)建模自動化,創(chuàng)建ML-Pipeline,以加快機器學習解決方案的創(chuàng)建。可以用“自動化機器學習”這一術語來描述上述流程背后的技術方法。盡管“自動化機器學習”確實是指完全自動化地創(chuàng)建機器學習解決方案,但行業(yè)專家應積極地將其知識與自動化機器學習過程聯(lián)系起來,以創(chuàng)建出色的機器學習解決方案。
指導分析
借助自動化機器學習軟件,行業(yè)專家可以創(chuàng)建機器學習模型。自動化機器學習軟件指導用戶完成模型開發(fā)過程,這就是為什么需要指導分析的原因。專家專注于研究機器和過程行為知識,并將這些知識鏈接到后臺運行的機器學習過程。這意味著自動化機器學習軟件巧妙地查詢現(xiàn)有知識并將其與后臺運行的機器學習過程結(jié)合起來,從而將現(xiàn)有的和有價值的應用知識傳輸?shù)娇煽康臋C器學習應用中并存檔。
行業(yè)專家獨立開發(fā)機器學習解決方案
自動化機器學習解決方案本質(zhì)上由兩個模塊組成,這些模塊用于模型的創(chuàng)建、執(zhí)行和優(yōu)化,以及在模型整個生命周期中對其進行管理。
使用建模模塊,行業(yè)專家可以基于訓練數(shù)據(jù)及其在異常檢測、分類和故障預測方面的應用知識,創(chuàng)建機器學習解決方案。
僅基于“良好數(shù)據(jù)”(即所謂的“無監(jiān)督”培訓)的異常檢測是目前較為先進的方法。這是一種根據(jù)歷史數(shù)據(jù)學習正常機器行為的典型數(shù)據(jù)模式的算法。在運行時,可以識別出實際情況與典型數(shù)據(jù)模式之間的偏差。檢測到的異常可能是由于效率低下、輕微故障或重大錯誤。借助這種方法,系統(tǒng)甚至可以在發(fā)生完全未知的錯誤情況時立即檢測到它們。建模過程的結(jié)果是一個完整配置的ML-Pipeline,包括模型。
此外,模型構建器用于在運行期間優(yōu)化機器學習模型。只需輕擊幾下鼠標,就可以將訓練數(shù)據(jù)中未包含的新事件(例如某些運行情況,機器運行時發(fā)生的異?;蝈e誤)包含在模型中。這使得模型可以在其生命周期中不斷改進。
自動化機器學習模型的第二個模塊是執(zhí)行環(huán)境,在云短或現(xiàn)場應用中運行機器學習模型。自動化機器學習工作室不依賴于某個平臺,而是根據(jù)要執(zhí)行的模型數(shù)量自動調(diào)整。另外,執(zhí)行環(huán)境以易于理解的方式呈現(xiàn)模型結(jié)果,便于用戶采取具體行動,例如避免錯誤。由于模型在生命周期中不斷改進,因此創(chuàng)建了新的模型版本,所以模型管理是執(zhí)行環(huán)境的另一個組成部分。其中,模型管理負責模型版本控制,模型恢復和模型監(jiān)控。
應用知識具有決定性意義
在自動建模中,首先根據(jù)應用知識以及用于分析任務的訓練數(shù)據(jù)的結(jié)構,自動選擇合適的機器學習過程。這樣,最多為原始數(shù)據(jù)中的每個數(shù)據(jù)磁道生成300個特性,從而覆蓋了相對較大的解決方案空間。然后,訓練具有不同特性組合的替代機器學習模型并優(yōu)化其超參數(shù)。最后,驗證模型并將其集成到并行生成的ML-Pipeline中。所有這些步驟都將完全自動運行。根據(jù)復雜程度,計算模型可能需要幾分鐘或幾小時。只需數(shù)分鐘就可使用第一個模型,以便用戶可以及時獲得有關模型質(zhì)量的反饋,繼而決定是繼續(xù)還是終止模型構建過程。
對于成功模型構建而言至關重要的是行業(yè)專家的應用知識,可利用這些知識來改進訓練數(shù)據(jù)集?;跈C器和過程知識,行業(yè)專家可以標記數(shù)據(jù),例如,在數(shù)據(jù)中標記期望的和不期望的機器行為。根據(jù)相同的原理,標記某些過程或生產(chǎn)步驟,比如典型的機器啟動行為。用戶還可以創(chuàng)建自己的特性,這些特性不包含在原始數(shù)據(jù)中,但仍有助于評估制造過程。
含有豐富應用知識的數(shù)據(jù)集為后續(xù)自動生成機器學習模型提供輸入變量。這樣得出的機器學習解決方案與數(shù)據(jù)科學家手動創(chuàng)建的解決方案相當。在建模過程結(jié)束時,用戶根據(jù)某些標準(例如模型質(zhì)量或執(zhí)行時間)選擇最適合其應用的模型??梢詫⑵珢鄣哪P蛯С霾⒈4婊蚣傻綀?zhí)行環(huán)境中。
重點在于用戶的應用專有技術
用戶的應用專有技術對于專注于機器學習應用的行業(yè)做出了巨大貢獻,這對于歐洲經(jīng)濟的成功至關重要。來自第一批機器制造商和操作員試點用戶的反饋表明,自動化機器學習工具對用戶友好,并且在功能和用戶指導方面最能滿足用戶的需求。
魏德米勒自動化機器學習工具:使用人工智能(AI)輔助創(chuàng)建模型。
無需數(shù)據(jù)科學領域的專業(yè)知識即可輕松應用機器學習——自動建模
易于操作,模型持續(xù)優(yōu)化——該軟件工具可指導用戶完成模型開發(fā)和優(yōu)化過程