深度學習想變革安防行業(yè) 首先要補齊深度學習的短板
目標識別、物體檢測、智能分析……隨著深度學習算法的進步,安防技術(shù)取得了突破性進展。深度學習被看做安防行業(yè)的革命性力量,大大加速了安防的發(fā)展過程。
在這樣的情境下,全球人工智能計算機視覺領(lǐng)域奠基人之一、約翰霍普金斯大學教授艾倫·尤爾拋出“深度學習(Deep learning)在計算機視覺領(lǐng)域的瓶頸已至”的觀點,引發(fā)業(yè)內(nèi)許多專家共鳴與熱議。
深度學習變革安防行業(yè)
目前,深度學習的研究領(lǐng)域主要集中在語音識別和計算機視覺方面,而計算機視覺作為人工智能落地過程中的“顯學”,被各行各業(yè)所重視。對擁有海量視頻圖像資源的安防行業(yè)而言,深度學習能夠?qū)@些資源進行分析,實現(xiàn)利用。
例如:在人臉識別方面,深度學習大幅提升了復(fù)雜任務(wù)分類的準確率,可以實現(xiàn)人臉檢測、身份對比、活體檢測等功能;在智能視頻分析方面,可以做到人、非機動車和機動車的視頻結(jié)構(gòu)化研究?;诖耍卜佬袠I(yè)一躍成為當紅“炸子雞”。
成也是“標注數(shù)據(jù)” 敗也是“標注數(shù)據(jù)”
然而,深度學習卻有很多局限性。眾所周知,深度學習需要基于大量的標注數(shù)據(jù),這些數(shù)據(jù)需要由人類進行標注,而人類的弱點則導(dǎo)致了深度學習的許多缺陷:
大量的數(shù)據(jù)需求使得研究人員的焦點過度集中于容易的任務(wù),回避重要且困難的任務(wù),因此,在基準數(shù)據(jù)集上,深度學習表現(xiàn)良好,但脫離數(shù)據(jù)集,進入真實世界后,就有出現(xiàn)重大失誤的風險,尤其是數(shù)據(jù)集中不常出現(xiàn)的情形,例如,在動物園監(jiān)控場景下,“相機出現(xiàn)在猴子手里”等情況。
此外,從組合學觀點來看,真實世界圖像的信息量無疑遠遠大于人工標注的圖片信息,這使得深度學習對圖像中的變化非常敏感,導(dǎo)致系統(tǒng)判斷出錯,這對訓練和應(yīng)用都提出了巨大的挑戰(zhàn)。
如何補齊深度學習的短板?
深度學習的短板要如何補齊?既然深度學習的關(guān)鍵在于大量人工標注的數(shù)據(jù),那么,解決數(shù)據(jù)帶來的問題,或許可以繼續(xù)從數(shù)據(jù)方面著手。
一種解決方案是簡單地擴大訓練數(shù)據(jù)的范圍,即通過更多的訓練數(shù)據(jù)使網(wǎng)絡(luò)自動吸取經(jīng)驗、已更快地學習新任務(wù)。這聽起來更像是人類的學習方法。
不過,人工智能是對人類智能的模仿,而深度學習只是眾多AI技術(shù)中的一種。人類本身并非主要依賴深度學習,并且可以收集多維度的數(shù)據(jù),借助“觸類旁通”的能力來進行認知,因此,在安防行業(yè),深度學習需要與知識圖譜、機器記憶、語義識別等不同維度的手段相結(jié)合,彌補自身短板。
結(jié)語:總而言之,在未來一段時間內(nèi),深度學習仍將對智慧安防行業(yè)的發(fā)展起著積極的推動作用,與此同時,業(yè)內(nèi)人士也已經(jīng)明晰了深度學習本身存在的局限,并對此進行探索,以彌補其不足。