AI工業(yè)應(yīng)用需要什么,MathWorks就造什么
本文將詳細(xì)聊一聊人工智能五大趨勢,以及MathWorks是如何順應(yīng)時代要求,做一個“AI時代造物者”的?“我們認(rèn)為2020年將成為‘AI驅(qū)動系統(tǒng)’年?!?
這句話出自MathWorks(邁斯沃克軟件)首席戰(zhàn)略師Jim Tung。乍一看,并無新奇。近幾年來,哪年不是AI年?整的比大年初一還要熱鬧。但這句話中關(guān)鍵詞是“系統(tǒng)”,隨著人工智能在多種工業(yè)應(yīng)用當(dāng)中的快速發(fā)展,作為“AI驅(qū)動系統(tǒng)”的關(guān)鍵2020年,MathWorks還預(yù)測了本年將有人工智能五大趨勢。分別是:
1. 勞動力技能和數(shù)據(jù)質(zhì)量壁壘開始消弭
2. AI 驅(qū)動系統(tǒng)的興起使設(shè)計復(fù)雜度進(jìn)一步提高
3. 將 AI 部署到低功耗、低成本的嵌入式設(shè)備的過程日益簡便
4. 強(qiáng)化學(xué)習(xí)開始從游戲領(lǐng)域轉(zhuǎn)向現(xiàn)實(shí)世界的工業(yè)應(yīng)用領(lǐng)域
5. 仿真可以降低成功采用 AI 所面臨的主要壁壘——數(shù)據(jù)質(zhì)量欠佳
本文將詳細(xì)聊一聊這五大趨勢,以及MathWorks是如何順應(yīng)時代要求,做一個“AI時代造物者”的?
怎樣的AI時代?
隨機(jī)找一位路人,問他“這是怎樣的AI時代?”不管專業(yè)還是非專業(yè)人士,一定給你一個類似“BOOM”的答案。這些年,說一次AI天上就掉下一粒沙,于是有了撒哈拉。但一切又像處于行業(yè)爆發(fā)前夕,據(jù)Gartner調(diào)查研究顯示,如下圖,從事人工智能或機(jī)器學(xué)習(xí)工作的企業(yè)平均有4個AI/ML項(xiàng)目到位。59%的受訪者表示他們已經(jīng)部署了人工智能。
受訪者們還希望在未來12個月內(nèi)再增加6個項(xiàng)目,在未來3年內(nèi)再增加15個項(xiàng)目。這意味著在2022年,這些機(jī)構(gòu)預(yù)計平均有35個AI或ML項(xiàng)目就位。
此外,Gartner這份調(diào)研還表示,目前這些企業(yè)在應(yīng)用人工智能和機(jī)器學(xué)習(xí)技術(shù)時面臨的如下圖顯示的三大挑戰(zhàn),其中首要解決的是員工技能、數(shù)據(jù)范圍和質(zhì)量以及AI優(yōu)勢的理解和應(yīng)用。團(tuán)隊(duì)技能和數(shù)據(jù)的可用性成了兩大壁壘。Jim Tung表示:“通過雇傭新的專家,能夠在一定程度上解決團(tuán)隊(duì)技能方面的問題,但現(xiàn)有團(tuán)隊(duì)成員的技能也需要提高。這兩大壁壘對于AI技術(shù)的成功應(yīng)用十分重要,亟待解決。”
“AI 的普及被什么東西拖累了?!盙artner 副總裁 Svetlana Sicular指出了AI大廈上方的烏云。而本文開頭所說的5大趨勢,似乎要撥開這團(tuán)云霧。
技能與數(shù)據(jù)
5大趨勢中的第一個關(guān)于勞動力技能與數(shù)據(jù)質(zhì)量的壁壘已打破。Jim Tung認(rèn)為,越來越多的工程師和科學(xué)家開始參與到AI項(xiàng)目中,他們可以很好獲取現(xiàn)有深度學(xué)習(xí)的預(yù)訓(xùn)練模型,以及一些公開的研究成果,能夠協(xié)助更廣泛地應(yīng)用AI技術(shù)。也就是說,AI領(lǐng)域已經(jīng)不再缺乏真正的領(lǐng)域高手。人們可以在AI模型中更多地利用傳感器數(shù)據(jù),包括時間序列數(shù)據(jù)、文本和雷達(dá)信號。這些工程師和科學(xué)家能夠充分利用自己對數(shù)據(jù)的了解,這將對AI項(xiàng)目的成功產(chǎn)生重大影響。
此外,自動標(biāo)注工具能夠加快高質(zhì)量大型數(shù)據(jù)集的準(zhǔn)備。MathWorks能夠提供一系列的應(yīng)用程序來幫助工程師、科學(xué)家和數(shù)據(jù)科學(xué)家快速標(biāo)注圖像數(shù)據(jù),以及用于其他數(shù)據(jù)的應(yīng)用程序。
當(dāng)然,天底下沒有那么多專家,非專家就不配做AI項(xiàng)目嗎?顯然不是,Jim Tung表示,MathWorks提供一系列的應(yīng)用程序來幫助他們更高效地完成工作。在應(yīng)用程序中,通過點(diǎn)擊的方式,引導(dǎo)工程師們完成工作流當(dāng)中的設(shè)計和分析等各個步驟。MathWorks所提供的諸如Deep Network Designer和Classification Learner等工具能使工程師們更加得心應(yīng)手。其中,Deep Network Designer 應(yīng)用程序可用于創(chuàng)建、可視化并編輯深度學(xué)習(xí)網(wǎng)絡(luò);Classification Learner 應(yīng)用程序可用于嘗試不同的分類器,以查找數(shù)據(jù)集的最佳擬合。
Deep Network Designer
Jim Tung表示:“應(yīng)用程序之所以重要,是因?yàn)樗鼈兡軌驇椭茿I領(lǐng)域?qū)<矣行褂孟嚓P(guān)技術(shù),例如在深度學(xué)習(xí)工作流中的應(yīng)用,用戶獲取模型,導(dǎo)入網(wǎng)絡(luò),訓(xùn)練圖像分類網(wǎng)絡(luò),并生成代碼用于訓(xùn)練,這都是以一種按鍵點(diǎn)擊的方式來執(zhí)行的?!?
另一個工具——MathWorks的Experiment Manager應(yīng)用程序,可以管理多組實(shí)驗(yàn)、記錄參數(shù)并分析并比較結(jié)果。
Experiment Manage
在垂直領(lǐng)域中,從 Diagnostic Feature Designer 應(yīng)用程序生成MATLAB 代碼,以實(shí)現(xiàn)信號處理,特征提取和特征排序任務(wù)的自動化,工程師們能夠快速提取關(guān)鍵特征,在系統(tǒng)因故障失效前,用于預(yù)測何時需要對系統(tǒng)進(jìn)行維護(hù)。
對于非數(shù)據(jù)科學(xué)領(lǐng)域?qū)<?,Classification Learner可以幫助用戶通過一鍵點(diǎn)擊的方式訓(xùn)練多種機(jī)器學(xué)習(xí)模型,通過并行計算的方式進(jìn)行模型訓(xùn)練,這樣他們能夠快速發(fā)現(xiàn)合適的模型。以及超參數(shù)調(diào)優(yōu)等高級功能。
同時MATLAB也為專家們提供了完整的軟件功能,為解決更多不同的問題進(jìn)行技術(shù)開發(fā),包括當(dāng)前領(lǐng)先的一些技術(shù),例如AutoML。
Jim Tung舉了一個最新的例子,復(fù)旦大學(xué)利用MATLAB來開發(fā)相應(yīng)的數(shù)學(xué)模型,用于預(yù)測新冠肺炎的傳染趨勢,為中國的政府提供相應(yīng)的公共措施方面的指導(dǎo)。MATLAB在這個項(xiàng)目當(dāng)中的主要應(yīng)用有:數(shù)據(jù)的可視化和預(yù)處理,模型的擬合還有開發(fā),以及參數(shù)的調(diào)優(yōu),數(shù)值仿真和測試,還有應(yīng)用程序的開發(fā),并最終以Web應(yīng)用的形式部署。
AI設(shè)計復(fù)雜度提高
MathWorks預(yù)測,如今AI 驅(qū)動系統(tǒng)的興起使設(shè)計復(fù)雜度進(jìn)一步提高。一方面來說,工程師正積極將 AI 推廣應(yīng)用于各種系統(tǒng),包括自動駕駛汽車、飛機(jī)引擎、工業(yè)廠房和風(fēng)力發(fā)電機(jī)。另一方面,AI模型的行為對于這些復(fù)雜多域系統(tǒng)的整體性能具有重大影響。此外,設(shè)計人員期望利用基于模型的設(shè)計工具,對這些 AI 驅(qū)動系統(tǒng)進(jìn)行仿真、集成和持續(xù)測試。
“工程師們期望使用基于模型的設(shè)計的方法,通過仿真、AI模型的集成以及持續(xù)測試?yán)斫馊绾蝿?chuàng)建魯棒的AI驅(qū)動系統(tǒng)?!盝im Tung如此說道,還舉了一個MathWorks客戶使用 Simulink 進(jìn)行快速開發(fā)迭代和測試的例子。
Voyage公司將自動駕駛算法嵌入車輛中,為老人護(hù)理機(jī)構(gòu)提供服務(wù),僅僅在3個月內(nèi),就非常快速地實(shí)現(xiàn)了level3的無人駕駛汽車開發(fā)。他們通過基于模型的設(shè)計集成AI功能和汽車的其他子系統(tǒng),從而快速地理解系統(tǒng)行為。
低功耗、低成本
Jim Tung表示,如今將AI 部署到低功耗、低成本的嵌入式設(shè)備的過程日益簡便。主要有三點(diǎn)原因1,AI 通常采用32位浮點(diǎn)運(yùn)算,這在 GPU、集群和數(shù)據(jù)中心等高性能計算系統(tǒng)中廣為應(yīng)用2,軟件工具的最新發(fā)展現(xiàn)已支持采用不同級別定點(diǎn)運(yùn)算的 AI 推理模型3,這使得在低功耗、低成本設(shè)備上部署 AI 成為可能,并為工程師將 AI 技術(shù)融入設(shè)計開辟了新天地。
如今,工程師可以使用軟件工具,特別是自動代碼生成功能,能夠在開發(fā)一次模型后,使用代碼生成功能將其部署到各種不同的平臺上,例如生成C++代碼,或生成CUDA代碼應(yīng)用于GPU上,例如NVIDIA,以及HDL代碼,應(yīng)用在FPGA上,一個來源,多個目標(biāo),全部自動實(shí)現(xiàn)。
MathWorks提供的Deep Network Quantizer工具,可以快速導(dǎo)入一個預(yù)訓(xùn)練好的模型,根據(jù)真實(shí)數(shù)據(jù)對模型進(jìn)行校準(zhǔn),校準(zhǔn)統(tǒng)計量范圍,并對網(wǎng)絡(luò)各層進(jìn)行量化,或創(chuàng)建定點(diǎn)運(yùn)算表達(dá),驗(yàn)證。
Jim Tung表示:“我們還支持其他傳統(tǒng)的機(jī)器學(xué)習(xí)算法的定點(diǎn)代碼生成,例如決策樹,支持向量機(jī)模型,這些模型的自動代碼生成是可靠性和速度的關(guān)鍵?!?
工業(yè)領(lǐng)域的強(qiáng)化學(xué)習(xí)
AI第四個趨勢則是強(qiáng)化學(xué)習(xí)開始從游戲領(lǐng)域轉(zhuǎn)向現(xiàn)實(shí)世界的工業(yè)應(yīng)用領(lǐng)域。Jim Tung認(rèn)為,強(qiáng)化學(xué)習(xí) (RL) 賦能現(xiàn)實(shí)世界的工業(yè)應(yīng)用,尤其是自動駕駛、自主系統(tǒng)、控制設(shè)計和機(jī)器人。
如今強(qiáng)化學(xué)習(xí)的實(shí)現(xiàn)需要大量的數(shù)據(jù),數(shù)據(jù)來源則是模型的仿真,在模型中將模擬一些在現(xiàn)實(shí)世界當(dāng)中難以復(fù)現(xiàn)的條件。
Jim Tung提到,MathWorks還開發(fā)了強(qiáng)化學(xué)習(xí)工具箱,支持內(nèi)置的和自定義的強(qiáng)化學(xué)習(xí)智能體的應(yīng)用。在MATLAB和Simulink當(dāng)中,用戶可以對環(huán)境進(jìn)行建模。同時,深度學(xué)習(xí)工具箱也支持一些強(qiáng)化學(xué)習(xí)策略的設(shè)計。還提供了GPU以及云端的訓(xùn)練加速功能。另外通過仿真,用戶可以驗(yàn)證強(qiáng)化學(xué)習(xí)策略是否合理。同時MathWorks也提供了嵌入式系統(tǒng)的代碼生成,以及之前提到的參考示例供用戶快速起步來進(jìn)行項(xiàng)目的開發(fā)。
在一個無人駕駛汽車案例中,Simulink模型中有車輛的模型以及軟件部分的控制器模型,此外還有感知算法部分的模型,根據(jù)車載攝像頭采集的圖像數(shù)據(jù),識別車道,感知周圍的路況。在強(qiáng)化學(xué)習(xí)部分,使用仿真數(shù)據(jù)訓(xùn)練智能體做出決策,改善行為。
數(shù)據(jù)質(zhì)量欠佳
Jim Tung認(rèn)為,目前采用 AI 所面臨的主要壁壘是數(shù)據(jù)質(zhì)量欠佳。所謂數(shù)據(jù)質(zhì)量,涉及兩個部分一個是數(shù)據(jù)的質(zhì)量,一個是數(shù)據(jù)的范圍。首先是故障問題數(shù)據(jù),這些對預(yù)測性維護(hù)非常有幫助,背后則需要故障模式的仿真。另外,各類數(shù)據(jù)不均衡。MathWorks可以提供數(shù)據(jù)可視化標(biāo)準(zhǔn)化的工具,數(shù)據(jù)質(zhì)量。
仿真可以解決這個難題。Jim Tung表示,一方面人們真正需要的是異常和嚴(yán)重故障狀態(tài)下的數(shù)據(jù)。另一方面,從物理設(shè)備中生成故障數(shù)據(jù)具有破壞性而且代價高昂,最佳做法是通過仿真呈現(xiàn)故障行為生成數(shù)據(jù),進(jìn)而運(yùn)用合成數(shù)據(jù)訓(xùn)練準(zhǔn)確的 AI 模型。
據(jù)了解,可以采用在基于模型設(shè)計的流程當(dāng)中開發(fā)的模型,對模型進(jìn)行些許調(diào)整,來模仿故障模式,而不是正常工作模式。這些故障模式的模型可以仿真生成大量的數(shù)據(jù)來描述故障狀態(tài),用于訓(xùn)練AI模型以及故障檢測。
Jim Tung表示:“使用Simulink提高訓(xùn)練數(shù)據(jù)質(zhì)量的場景很多,其中之一是,AI可以被用在多種產(chǎn)品中,而不僅僅是一種終端的解決方案,同樣它也是一系列的技術(shù),可用于多個領(lǐng)域,例如說雷達(dá)信號的仿真,以及無人駕駛汽車,還有激光雷達(dá)傳感器的感知算法,因此可以被MathWorks各類用戶使用?!?
月,MathWorks在Gartner 的《2020 年數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)平臺魔力象限》報告中被評為領(lǐng)導(dǎo)者。Gartner 對 MathWorks 的前瞻性和執(zhí)行能力進(jìn)行評估后,將該公司定位為 2020 年度領(lǐng)導(dǎo)者。
Jim Tung認(rèn)為:“在整個魔力象限中,MathWorks獨(dú)特點(diǎn)在于,我們主要服務(wù)工業(yè)用戶,即那些建造并提供實(shí)際的物理設(shè)備、機(jī)器、汽車的企業(yè)等。Gartner在評估的時候,他們也考慮到了這一點(diǎn),越來越多的數(shù)據(jù)來自于機(jī)器和硬件資產(chǎn),這也是將我們MathWorks認(rèn)定為在產(chǎn)品的完整度和遠(yuǎn)見性方面最強(qiáng)的一個供應(yīng)商的部分原因。因?yàn)槲覀冋J(rèn)識到AI的應(yīng)用前景不僅在數(shù)據(jù)挖掘上,更重要的是怎樣管理和優(yōu)化資產(chǎn)。這是我們區(qū)別于其他供應(yīng)商的一點(diǎn)。為什么說我們和象限中的其他廠商并不是競爭對手,因?yàn)槲覀冊诖蠖鄶?shù)情況下各自面向的是不同的市場?!?
MathWorks的想法很純粹,即盡量滿足AI工業(yè)應(yīng)用的需求。AI工業(yè)需要什么,MathWorks就制造什么。