人工智能或?qū)⒏淖兒椭匦滤茉彀卜佬袠I(yè)
目前,AI早已成為各行業(yè)熱點(diǎn)關(guān)鍵詞,物理安防行業(yè)也不例外,人工智能也是一股有可能改變和重新塑造行業(yè)的重要力量。
廣義的人工智能(AI)指的是關(guān)于機(jī)器計(jì)算的智能,而非人類本身。在安防行業(yè),我們所說的AI指的是機(jī)器模仿人類及其它生物認(rèn)知功能的技術(shù)應(yīng)用,即模仿人類大腦學(xué)習(xí)和解決問題的思路和方法。
人工智能推動(dòng)安防行業(yè)快速發(fā)展
當(dāng)前,計(jì)算機(jī)行業(yè)的三大趨勢(shì)正在推動(dòng)人工智能的快速增長。這三大趨勢(shì)分別是:
首先,計(jì)算機(jī)硬件的崛起能夠處理復(fù)雜的計(jì)算,尤其是圖形處理器(GPU, 其使用“并行處理”模式而不是我們熟悉的CPU“串行處理”模式)??梢酝瑫r(shí)并行處理多個(gè)計(jì)算任務(wù),效率遠(yuǎn)遠(yuǎn)高于“串行”模式。而且這是一種更具可擴(kuò)展性的方案:將大問題分為許多可以同時(shí)解決的小問題來處理。
其次,更有效“訓(xùn)練”系統(tǒng)編程方法的發(fā)展,特別是神經(jīng)網(wǎng)絡(luò),它能夠與GPU并行處理同時(shí)工作。神經(jīng)網(wǎng)絡(luò)是由許多簡單、高度互連的處理單元組成的計(jì)算系統(tǒng),通常以層的形式構(gòu)成,每層由互連的節(jié)點(diǎn)組成。每一層計(jì)算出的結(jié)果決定下一層的輸入。神經(jīng)網(wǎng)絡(luò)可能超過一百層,因此能夠?qū)⒋罅繌?fù)雜的數(shù)據(jù)。
第三,傳感器(包括攝像機(jī))的激增,產(chǎn)生足夠大的數(shù)據(jù),使系統(tǒng)能夠被有效地“訓(xùn)練”(例如“大數(shù)據(jù)”)?!按髷?shù)據(jù)”的激增提供了大量的訓(xùn)練數(shù)據(jù)。而安防視頻監(jiān)控?cái)?shù)據(jù)占據(jù)了大數(shù)據(jù)的60%,并且每年還在以20%的速度增長。這種數(shù)據(jù)的激增為人工智能發(fā)展提供了源動(dòng)力,并且增強(qiáng)了系統(tǒng)的功能。
人工智能系統(tǒng)訓(xùn)練
在GPU上運(yùn)行的神經(jīng)網(wǎng)絡(luò)中,學(xué)習(xí)規(guī)則不斷優(yōu)化調(diào)整連接的權(quán)重(重要性); 每一層都有不同的“權(quán)重”,反映了在前一層學(xué)到的東西。當(dāng)呈現(xiàn)數(shù)據(jù)模型(例如視頻圖像)時(shí),神經(jīng)網(wǎng)絡(luò)能夠通過分析模式判斷它可能是什么。
訓(xùn)練包括了確定初始結(jié)果與最終結(jié)果的過程,并對(duì)連接權(quán)重進(jìn)行適當(dāng)調(diào)整。用高度概括性的術(shù)語說,這就是AI系統(tǒng)的“學(xué)習(xí)”方式。不過整個(gè)“訓(xùn)練”過程分為多個(gè)階段,就像過濾器一樣,每個(gè)階段的結(jié)果都引導(dǎo)通往正確分析的路徑。
深度學(xué)習(xí)是更廣泛的機(jī)器學(xué)習(xí)方法的一種類型,也是與安防視頻行業(yè)最為相關(guān)的概念。深度學(xué)習(xí)需要使用大量來自能神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)的數(shù)據(jù)(例如,視頻圖像)。
視頻監(jiān)控系統(tǒng)中的深度學(xué)習(xí)
神經(jīng)網(wǎng)絡(luò)互相連接的處理單元與GPU并行工作,它們被設(shè)計(jì)成模仿人類大腦通過數(shù)十億個(gè)神經(jīng)元分析處理問題。人工智能深度學(xué)習(xí),正在成為新一代視頻監(jiān)控系統(tǒng)的基礎(chǔ),賦予了傳統(tǒng)系統(tǒng)卓越的性能表現(xiàn)。
這種方法極大改變視頻監(jiān)控系統(tǒng)的有效性。在此之前,計(jì)算機(jī)已使用視頻分析算法進(jìn)行編程。相比之下,深度學(xué)習(xí)系統(tǒng)才是更加“訓(xùn)練有素的”。如果你想識(shí)別一只貓,則提供大量貓的圖像,系統(tǒng)將之分解成較小的組件并尋找共性的數(shù)據(jù)。然后它就會(huì)“學(xué)習(xí)”這些案例中的共同特征。
為了最大程度地訓(xùn)練,系統(tǒng)呈現(xiàn)的數(shù)據(jù)越多,它就越精確,即“學(xué)習(xí)”到的越多。通過大量的案例數(shù)據(jù)學(xué)習(xí),深度學(xué)習(xí)系統(tǒng)便形成相應(yīng)的識(shí)別模式。
從訓(xùn)練到推理
雖然計(jì)算機(jī)程序員也可以花費(fèi)數(shù)月時(shí)間編寫指令來告訴計(jì)算機(jī)汽車長什么樣,但神經(jīng)網(wǎng)絡(luò)可以通過展示大量的示例來“學(xué)習(xí)”,不需要編程。另外,訓(xùn)練神經(jīng)網(wǎng)絡(luò)也很費(fèi)時(shí)間,可能需要數(shù)小時(shí)或數(shù)天。訓(xùn)練也屬于計(jì)算密集型工作。
然而,一旦訓(xùn)練了神經(jīng)網(wǎng)絡(luò),我們就可以用來“推斷”,協(xié)助決策,例如,判斷一張新拍攝到的圖片里面是否有貓。這使得我們能夠在諸如網(wǎng)絡(luò)視頻錄像機(jī)(NVR)之類的設(shè)備上,甚至在網(wǎng)絡(luò)邊緣的視頻攝像機(jī)中部署受過訓(xùn)練的系統(tǒng),從而能夠快速識(shí)別目標(biāo)物體,并快速做出相應(yīng)決策。
深度學(xué)習(xí)可以實(shí)現(xiàn)超人類模式識(shí)別準(zhǔn)確性,還具備抵抗干擾性,能分類和識(shí)別數(shù)千個(gè)不同特征。例如,最新的人臉識(shí)別、車牌識(shí)別系統(tǒng)準(zhǔn)確率都已經(jīng)接近100%,這些特性使得深度學(xué)習(xí)對(duì)視頻分析應(yīng)用具有很高的價(jià)值和意義。