淺談AI在視頻監(jiān)控中的運用
一、視頻監(jiān)控行業(yè)發(fā)展趨勢
隨著我國平安城市、智能交通等各項建設(shè)的持續(xù)開展,以及金融、教育、物業(yè)等各行業(yè)用戶安防意識的不斷增強,視頻監(jiān)控市場近5年來一直保持著18%左右的穩(wěn)定增長。然而,大多數(shù)攝像頭一直沒能擺脫人工監(jiān)控的傳統(tǒng)監(jiān)控方式,由此導(dǎo)致了大量視頻數(shù)據(jù)堆積占用存儲資源、視頻監(jiān)控實時性差、視頻檢索困難等問題,一旦有案件發(fā)生,海量攝像頭帶來的海量視頻數(shù)據(jù)檢索工作需要耗費大量警力。
為了解決這些問題,近年來,視頻監(jiān)控行業(yè)向“高清化、網(wǎng)絡(luò)化、智能化”趨勢加速演進。視頻監(jiān)控設(shè)備技術(shù)性極強,系統(tǒng)的創(chuàng)新升級同時也在引導(dǎo)市場需求的變化并創(chuàng)造了新的市場需求。
高清化:攝像頭高清化是實現(xiàn)攝像頭網(wǎng)絡(luò)化和智能化的重要前提,高清攝像頭不僅讓我們看得更清楚,也能讓機器“看”得更清楚,從而使得機器視覺技術(shù)有了用武之地,能夠更準確地提取重要的有效信息。此前,阻礙攝像頭向高清發(fā)展的重要原因是帶寬和存儲的成本,因此,提升編碼效率是實現(xiàn)視頻高清化的技術(shù)基礎(chǔ)。
網(wǎng)絡(luò)化:網(wǎng)絡(luò)通信技術(shù)的發(fā)展使得視頻監(jiān)控系統(tǒng)可以通過互聯(lián)網(wǎng)遠程傳輸視頻數(shù)據(jù),從而實現(xiàn)遠程監(jiān)控的功能,這極大的擴展了視頻監(jiān)控的范圍。當(dāng)然,網(wǎng)絡(luò)化的發(fā)展趨勢也使得視頻的數(shù)據(jù)量越來越大,要求系統(tǒng)具備更強的存儲、檢索和備份等功能。同時,海量的視頻數(shù)據(jù)也對視頻監(jiān)控系統(tǒng)的智能化發(fā)展提出了更高的要求。
?(AI在視頻監(jiān)控中的應(yīng)用)
智能化:智能視頻監(jiān)控技術(shù)近幾年來被廣泛研究并開始實際應(yīng)用,通過將機器視覺技術(shù)融入視頻監(jiān)控系統(tǒng),對視頻數(shù)據(jù)流進行圖像處理、目標(biāo)分析,實現(xiàn)自動檢測、目標(biāo)跟蹤等目的,對視頻監(jiān)控系統(tǒng)進行實時控制,變被動監(jiān)控為主動監(jiān)控。
“高清化、網(wǎng)絡(luò)化、智能化”的視頻監(jiān)控系統(tǒng)已經(jīng)開始應(yīng)用在實際生活中,具體來說,在智能交通系統(tǒng)中,重要關(guān)卡的攝像頭能夠智能化地檢測交通違規(guī),未來覆蓋所有道路交通的視頻打通后還可以構(gòu)建城市擁堵模型,并實時調(diào)整紅綠燈及道路行駛規(guī)則;在平安城市系統(tǒng)中,各點位視頻不僅被動監(jiān)控,還可以因地制宜運行安全檢測算法,并在事件發(fā)生時即主動報警,由原來的“事前震懾,事后追蹤”變?yōu)橹鲃颖O(jiān)測;而在民用市場上,通過在攝像頭基礎(chǔ)上附加的客流統(tǒng)計、人臉識別等功能,進一步拓展了視頻監(jiān)控的民用市場。
二、視頻監(jiān)控的核心技術(shù)--編碼技術(shù)
當(dāng)代視頻監(jiān)控系統(tǒng)主要包含五大類關(guān)鍵技術(shù):
數(shù)字視頻壓縮與編碼技術(shù)(編碼)
數(shù)字視頻的網(wǎng)絡(luò)傳輸技術(shù)(傳輸)
海量視頻數(shù)據(jù)的存儲和檢索技術(shù)(存儲)
視頻監(jiān)控場景中的人/物體的識別與跟蹤技術(shù)(視頻圖像處理和分析)
視頻監(jiān)控場景中的運動檢測與告警技術(shù)(視頻圖像處理和分析)
前三項是核心支撐技術(shù),由于視頻數(shù)據(jù)量的龐大與有限的存儲和網(wǎng)絡(luò)傳輸資源之間存在矛盾,因此視頻編碼就成為視頻監(jiān)控系統(tǒng)中最重要的核心技術(shù)。
國際電信聯(lián)盟電信標(biāo)準分局ITU-T與國際標(biāo)準化組織和國際電子委員會ISO/IEC是制定視頻編碼標(biāo)準的兩大組織,ITU-T的標(biāo)準包括H.261、H.263、H.264,主要應(yīng)用于實時視頻通信領(lǐng)域,如會議電視;MPEG系列標(biāo)準是由國際標(biāo)準化組織和國際電子委員會ISO/IEC制定的,主要應(yīng)用于視頻存儲(DVD)、廣播電視、因特網(wǎng)或無線網(wǎng)上的流媒體等。兩個組織也共同制定了一些標(biāo)準,比如H.262標(biāo)準等同于MPEG-2的視頻編碼標(biāo)準。目前,H.261與H.263在視頻通信中應(yīng)用比較廣泛,H.264標(biāo)準的推出,是視頻編碼標(biāo)準的一次重要進步,它與MPEG-2、MPEG-4及H.263相比,編碼效率更高。但是,更高的編碼效率也意味著更加復(fù)雜的編碼算法,隨著集成電路技術(shù)的快速發(fā)展,H.264的應(yīng)用已經(jīng)成為現(xiàn)實。
目前國際最新的視頻標(biāo)準是H.265,在同等清晰度下,H.265視頻標(biāo)準碼率是H.264碼率的一半,大幅提升傳輸和存儲效率,基于H.265標(biāo)準各大廠家也推出了更有效的編碼算法,如海康威視推出的Smart265,可以針對不同的場景設(shè)定不同的碼率,在人流量不密集的場景中碼率最高可降低70%以上。高效編碼算法的出現(xiàn)降低了高清傳輸?shù)某杀?,高清化為智能化奠定了基礎(chǔ)。
三、AI在視頻監(jiān)控中的應(yīng)用
升級后的攝像頭可以將清晰的視頻畫面實時傳輸?shù)胶蠖耍瑫r也帶來了海量非結(jié)構(gòu)化的視頻數(shù)據(jù)。因此,利用AI算法將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化、并進行智能化分析成為視頻監(jiān)控行業(yè)面臨的首要問題,在提高數(shù)據(jù)處理效率的同時也能為不同應(yīng)用場景充分挖掘數(shù)據(jù)價值。比如,人臉識別是當(dāng)前在智能化中應(yīng)用最為廣泛的技術(shù),現(xiàn)在通過基于深度學(xué)習(xí)的人臉識別算法,從抓拍嫌疑人到傳入后臺系統(tǒng)做出比對預(yù)警只需幾秒鐘。
視頻圖像處理和分析技術(shù)是實現(xiàn)監(jiān)控智能化的關(guān)鍵,目前主要的安防模式識別技術(shù)包括身份識別、軌跡識別和環(huán)境判斷補償識別等。
AI技術(shù)用于視頻監(jiān)控系統(tǒng)有前端和后端兩種方案,前者是利用前端攝像機自身的芯片和算法進行計算,而后者則是利用后端計算機進行分析。
(1)前端方案:是指在攝像頭等前端設(shè)備中內(nèi)置AI分析芯片,通過前置的智能分析可以有效降低需要傳輸?shù)臄?shù)據(jù)量,在車牌識別等應(yīng)用上已經(jīng)比較成熟,現(xiàn)在前端設(shè)備做車牌識別準確率已經(jīng)達到了99%。
(2)后端方案:普通攝像頭采集視頻信息后傳輸?shù)胶蠖?,用后端服?wù)器的方案進行智能分析,這是當(dāng)前主流的智能分析方案,多采用CPU+GPU架構(gòu),GPU集群服務(wù)器充分利用多GPU的并行處理能力,有效提高視頻結(jié)構(gòu)化處理效率。
前端方案需大量部署AI攝像頭,大規(guī)模替換現(xiàn)有的攝像頭,成本較大。另外,前端設(shè)備體積小,對芯片小型化的要求更高,芯片成本約是后端設(shè)備成本的兩倍,短期限于成本壓力,AI功能主要還是集中在后端進行。AI后端產(chǎn)品計算性能強大,一路智能NVR可以同時對幾十路攝像頭數(shù)據(jù)進行分析,實現(xiàn)特征提取、人臉識別等功能。
但是,前端智能化可以增強視頻監(jiān)控的及時性效果,同時將AI功能集成到前端可以減少了視頻信息上傳的帶寬壓力。隨著前端處理芯片性能的不斷提升,AI攝像頭可以運行更加復(fù)雜的算法,長期來看,智能分析前端化也會成為未來的發(fā)展趨勢之一。