【導(dǎo)讀】在人類的早期,當(dāng)我們邁入數(shù)學(xué)和數(shù)量的世界時,我們知道一個蘋果加一個蘋果等于兩個蘋果。我們開始學(xué)習(xí)實(shí)物計(jì)數(shù),直到后來才引入了零的概念,或者不妨說空盒子里的蘋果數(shù)。
在印度阿拉伯學(xué)者和意大利數(shù)學(xué)家斐波那契之后,“零”的概念徹底改變了數(shù)學(xué)界,將其引入了我們的現(xiàn)代編號系統(tǒng),今天我們可以自由自在地在數(shù)學(xué)運(yùn)算中使用“零”。但對人工智能而言,“零”或“無”仍然是一個尚未涉足的領(lǐng)域,
從某種意義上說,人工智能和深度學(xué)習(xí)仍然需要通過“零”或“無”學(xué)習(xí)識別和推理。
這是一個蘋果還是香蕉?都不是!
(圖源:Richard Drury/Getty Images)
傳統(tǒng)上,深度學(xué)習(xí)算法(例如深度神經(jīng)網(wǎng)絡(luò) DNN)以有監(jiān)督的方式進(jìn)行訓(xùn)練,以識別特定類別的事物。
在一個典型的任務(wù)中,可能會訓(xùn)練 DNN 以可視化的方式識別一定數(shù)量的類,例如蘋果和香蕉的圖片。深度學(xué)習(xí)算法在獲得大量數(shù)據(jù)和質(zhì)量的數(shù)據(jù)時,實(shí)際上非常擅長進(jìn)行精確、低錯誤率和可信的分類。
當(dāng)?shù)谌齻€未知對象出現(xiàn)時,DNN 識別就會出現(xiàn)問題。如果引入了訓(xùn)練集中不存在的未知對象(例如橙色),DNN 網(wǎng)絡(luò)將被迫“猜測”并將橙色分類為捕獲未知對象的最接近類別——一個蘋果!
基本上,用蘋果和香蕉訓(xùn)練的 DNN 的世界完全由蘋果和香蕉組成。它想不到水果籃里還有其他的水果。
進(jìn)入“零”的世界
盡管我們尚不清楚“無”或“零”是否在所有應(yīng)用中都能發(fā)揮作用,但是在訓(xùn)練和部署 DNN 時,“無”或“零”的想法在許多方面都非常有用。
在訓(xùn)練過程中,如果 DNN 能夠?qū)㈨?xiàng)目分類為“蘋果”,“香蕉”或“什么都沒有”,則算法的開發(fā)人員可以確定是否還有尚未有效學(xué)習(xí)識別的類別。就是說,如果水果圖片繼續(xù)反饋“零”,那么開發(fā)人員可能需要添加另一類“水果”來進(jìn)行識別,例如橘子。
但到目前為止,還沒有一個簡單的方法來訓(xùn)練 DNN 產(chǎn)生“無”的回應(yīng),能發(fā)出信號通知開發(fā)者它看到了偏離常規(guī)的東西。
同時,在部署場景中,經(jīng)過訓(xùn)練的 DNN 如果識別出與已經(jīng)學(xué)會的原型水果蘋果和香蕉有偏差的東西,則會回答“無”。從這個意義上講,DNN 可以被當(dāng)做一個異常檢測網(wǎng)絡(luò)——除了對蘋果和香蕉進(jìn)行分類之外,它還可以不經(jīng)進(jìn)一步更改就發(fā)出信號,通知它看到偏離規(guī)范的東西。
然而,現(xiàn)在還沒有簡單的方法來訓(xùn)練可以具備上述功能的標(biāo)準(zhǔn) DNN。
一種被稱為“ Lifelong DNN ”的新方法自然會將“無”的概念納入其體系中?!?Lifelong DNN 巧妙地利用反饋機(jī)制,通過過去學(xué)習(xí)到的知識來確定輸入是否匹配。
2017 年,AI 創(chuàng)業(yè)公司 Neurala 宣布在深度學(xué)習(xí)軟件方面取得重大進(jìn)展,其 Lifelong DNN 軟件能夠能夠在邊緣學(xué)習(xí)增量對象(incremental object)。在此之前,如果一個 AI 系統(tǒng)學(xué)會了一定數(shù)量的對象,并且需要再學(xué)習(xí)一次,那么它必須針對所有對象再訓(xùn)練一次。這種傳統(tǒng)方法需要利用強(qiáng)大的服務(wù)器,通常是云上的服務(wù)器。
Neurala 的 Lifelong DNN“既能在運(yùn)行中學(xué)習(xí),也能在邊緣學(xué)習(xí)的能力意味著 Neurala 的新方法可以直接在設(shè)備上學(xué)習(xí),從而不會有云上學(xué)習(xí)的所有缺點(diǎn)。此外,它消除了網(wǎng)絡(luò)延遲,提高了實(shí)時性能,并在需要時確保隱私。最重要的是,它將促進(jìn)一系列無云應(yīng)用(cloud-less applications)的開發(fā),”本文作者,同時是 Neurala CEO Max Versace 說道。當(dāng)時,吳恩達(dá)也評價了從云到“邊緣”轉(zhuǎn)化的技術(shù),認(rèn)為這會加速消費(fèi)級 IoT,帶來新的贏家。
Lifelong DNN 的機(jī)制和人類的學(xué)習(xí)方式類似:我們在潛意識中不斷檢查我們的預(yù)測是否符合現(xiàn)實(shí)世界。例如,如果有人跟你開玩笑調(diào)整了你辦公椅的高度,你馬上就能意識到。那是因?yàn)殡S著時間的推移,你學(xué)習(xí)到了辦公椅高度的“模型”——一旦模型有變,你會立即意識到異常。人類不斷檢查我們的分類是否符合實(shí)際情況。如果沒有,我們的大腦就會注意到并發(fā)出警報(bào)。對人來來說,我們不僅可以認(rèn)識蘋果、香蕉和蘋果,還可以推理“我還以為是蘋果,但實(shí)際上不是。”
Lifelong DNN 會在運(yùn)行中學(xué)會這種機(jī)制,因此,如果學(xué)到的模型有變,它會輸出“無”。
應(yīng)用前景
在以蘋果和香蕉為例對“無”有了基本了解之后,現(xiàn)在讓我們考慮一下除了水果識別之外,它在實(shí)際應(yīng)用中應(yīng)該如何發(fā)揮作用。
比如制造業(yè),機(jī)器負(fù)責(zé)生產(chǎn)大量產(chǎn)品。對傳統(tǒng)的計(jì)算機(jī)視覺系統(tǒng)進(jìn)行訓(xùn)練以識別產(chǎn)品中各種各樣的異常(例如表面劃痕)非常具有挑戰(zhàn)性。在運(yùn)作良好的生產(chǎn)線上,沒有多少“壞”產(chǎn)品的樣例,“壞”可以有無數(shù)種形式。很簡單,根本沒有大量可用于訓(xùn)練系統(tǒng)的不良產(chǎn)品數(shù)據(jù)。
但是,借助 Lifelong DNN,開發(fā)人員可以訓(xùn)練計(jì)算機(jī)視覺系統(tǒng)來識別“好”產(chǎn)品的不同示例。然后,當(dāng)系統(tǒng)檢測到與商品定義不符的商品時,可以將該商品歸類為異常,然后進(jìn)行適當(dāng)處理。
對于制造商而言, Lifelong DNN 和發(fā)現(xiàn)異常的能力可以節(jié)省時間并提高生產(chǎn)線的效率。對于無數(shù)其他越來越依賴人工智能的行業(yè)來說,可能會有類似的好處。
誰知道“無”竟然有這樣的重要性呢?
Neurala 是一家美國軟件公司,所開發(fā)的深度學(xué)習(xí)軟件 Neurala Brain 可以讓機(jī)器人、無人機(jī)、移動設(shè)備和相機(jī)更加智能,同時也為高端設(shè)備和日常應(yīng)用場景提供定制化的解決方案。Neurala 可以讓普通相機(jī)也能學(xué)習(xí)人物和目標(biāo),并實(shí)現(xiàn)視頻和視頻流中的識別和運(yùn)動追蹤功能?;?Neurala Brain 為 NASA、DARPA 和美國空軍所開發(fā)的技術(shù),它已成功部署在超過一百萬臺智能設(shè)備中。