智能視頻分析技術(shù)(VideoAnalytics)綜合了多學(xué)科的研究成果,主要包括圖像處理、跟蹤技術(shù)、模式識別、軟件工程、數(shù)字信號處理(DSP)等領(lǐng)域。從2001年911事件后,美國對視頻分析技術(shù)加大投入,數(shù)據(jù)表明,從2002年至2005年是視頻分析技術(shù)研究的一個高峰時期。國內(nèi)的視頻分析技術(shù)也得到迅速發(fā)展,但國內(nèi)的智能分析應(yīng)用應(yīng)該是從2005年以后開始,從早期的行為分析應(yīng)用到目前的各行業(yè)的深化應(yīng)用。隨著安防行業(yè)的迅速擴(kuò)張和發(fā)展,國內(nèi)的視頻分析得到了非常迅猛的發(fā)展。
一、視頻分析技術(shù)應(yīng)用的現(xiàn)狀
從技術(shù)角度來講,目前國內(nèi)智能分析技術(shù)主要還集中在兩大類:一類是采用畫面分割前景提取等方法對視頻畫面中的目標(biāo)進(jìn)行提取檢測,通過各種不同的規(guī)則來區(qū)分不同的事件,從而實現(xiàn)不同判斷并產(chǎn)生相應(yīng)的報警聯(lián)動等,例如:最早期的一些行為分析類功能(跨界、區(qū)域入侵、打架檢測、人員聚集等)、還有早期的交通事件檢測等都屬于這類算法技術(shù)的應(yīng)用。另一類是利用模式識別技術(shù),對畫面中特定的物體進(jìn)行建模,并通過大量樣本進(jìn)行訓(xùn)練,從而達(dá)到對視頻畫面中的特定物體進(jìn)行檢測及相關(guān)應(yīng)用。如車輛檢測、人臉檢測、人頭檢測(人流統(tǒng)計)等應(yīng)用。
從應(yīng)用角度來講,目前國內(nèi)智能分析技術(shù)主要有四大類:第一類是實時報警類。第二類是數(shù)據(jù)統(tǒng)計類,第三類是屬性識別類。第四類是圖像處理類。
第一類,實時報警類,主要是通過分析技術(shù)對實時視頻進(jìn)行內(nèi)容的分析和判斷,發(fā)現(xiàn)某種狀態(tài)達(dá)到報警規(guī)則的要求時,系統(tǒng)即可發(fā)出報警聯(lián)動。如最基礎(chǔ)的跨線報警、闖入報警、打架報警、聚眾報警等,當(dāng)然隨著應(yīng)用的深入,各行業(yè)應(yīng)用中也出現(xiàn)了很多帶有行業(yè)特征的實時報警應(yīng)用,如交通行業(yè)的擁堵報警、行人上高速報警;司法行業(yè)的攀高報警、離崗報警;金融行業(yè)的尾隨報警、貼假廣告報價等等。
第二類,數(shù)據(jù)統(tǒng)計類。主要是通過在特定的場景下,對視頻內(nèi)容中特定的內(nèi)容進(jìn)行統(tǒng)計,形成相關(guān)的報表和數(shù)據(jù)應(yīng)用。例如,通過視頻分析對公路上的車流量進(jìn)行自動統(tǒng)計,通過視頻分析對商場出入口等的人流量進(jìn)行統(tǒng)計等等。
第三類,屬性識別類,主要是對視頻中特定事務(wù)的屬性進(jìn)行自動識別,達(dá)到對視頻內(nèi)容的深入應(yīng)用和快速檢索等目的。如人臉識別、車牌識別、車標(biāo)識別、顏色識別、性別識別、身高識別、年齡識別、手勢識別等等。目前安防行業(yè)中應(yīng)用較多的主要還是人臉識別、車牌識別、車標(biāo)識別等。
第四類,圖像處理類。主要是對圖像整體進(jìn)行分析判斷及優(yōu)化處理以達(dá)到更好的效果或者將不清楚的內(nèi)容通過算法計算處理達(dá)到看得清的效果。如目前的視頻增強技術(shù)(去噪、去霧、銳化、加亮等)、視頻復(fù)原技術(shù)(去模糊、畸變矯正等)。
從產(chǎn)品形態(tài)來講,目前市場上主要有兩大類產(chǎn)品形態(tài),一類是前端智能產(chǎn)品。一類是后端服務(wù)器產(chǎn)品。這兩類產(chǎn)品各有優(yōu)缺點,根據(jù)不同的應(yīng)用和項目類型有不同的選擇。
目前市場上可以看到很多智能攝像機,即將一些視頻分析算法移植到網(wǎng)絡(luò)攝像機中,在攝像機中實現(xiàn)對實時視頻的分析和檢查,實現(xiàn)一些智能分析的功能(例如目前有實現(xiàn)車輛檢測的車輛抓拍攝像機、實現(xiàn)區(qū)域入侵等功能的目標(biāo)檢測報警的攝像機、有實現(xiàn)人類檢測抓拍的攝像機等等),智能攝像機自帶分析功能,系統(tǒng)架構(gòu)簡單,同時目前的攝像機DSP處理能力已經(jīng)完全能運行各種較為復(fù)雜的分析算法,分析效果和后端產(chǎn)品基本相同。
智能分析服務(wù)器在市場上應(yīng)該還算是主流產(chǎn)品,服務(wù)器產(chǎn)品有軟件開發(fā)周期短、項目應(yīng)用靈活、改造項目適用性強等特點。同時也還有相對比較復(fù)雜的智能分析功能需要的計算量還是很大,完全移植到攝像機中需要大量優(yōu)化和改進(jìn)算法性能和提高前端設(shè)備硬件成本。而基于x86的服務(wù)器是目前運行這些復(fù)雜算法的最好選擇,成本相對較低,能夠達(dá)到的分析效果也最好。
例如,目前客流統(tǒng)計分析、人臉檢索分析、人臉比對、交通事件檢測、視頻內(nèi)容檢索、視頻質(zhì)量診斷等應(yīng)用大部分還集中在服務(wù)器產(chǎn)品上,移植到攝像機中的較少,即使有也是將部分運算量較小的內(nèi)容移植到攝像機中處理。但是服務(wù)器產(chǎn)品有一個不爭的劣勢,那就是穩(wěn)定性。穩(wěn)定性方面肯定沒嵌入式產(chǎn)品好。所以很多廠家還是會在成本控制的前提下,盡力優(yōu)化算法將各種功能盡可能的移植到嵌入式設(shè)備中去,提高系統(tǒng)的穩(wěn)定性,特別是一些需要在室外環(huán)境中使用的設(shè)備(如交通事件檢測等應(yīng)用)。
二、智能分析技術(shù)應(yīng)用存在大問題
早期視頻分析應(yīng)用產(chǎn)品出現(xiàn)在市場上,著實引起了一段騷動,而且很多特殊的應(yīng)用場景和應(yīng)用環(huán)境,的確能給客戶帶來很大的價值。如商場的人流統(tǒng)計技術(shù),為商場的數(shù)據(jù)分析帶來了巨大的技術(shù)支撐。如車牌識別技術(shù),給公安交通管理帶來的價值是無法用數(shù)據(jù)來衡量的。但是,視頻分析技術(shù)還沒有完全成熟,目前應(yīng)該還屬于技術(shù)應(yīng)用的初級階段,還存在很多問題,這些問題可能也是限制視頻智能分析應(yīng)用快速發(fā)展的最主要的因素:
(一)、檢測準(zhǔn)確率達(dá)不到理想效果。視頻分析技術(shù)的準(zhǔn)確率基本達(dá)不到非常理想的效果,特別是實時報警類的應(yīng)用,誤報率和漏報率都是客戶最關(guān)心的問題,如果誤報太高,客戶也受不了,如果漏報,客戶更加受不了。特別是一些要求比較高的應(yīng)用,只要有漏的,實際作用就不大了。
(二)、受環(huán)境干擾大。視頻分析技術(shù)最大的一個問題就是受環(huán)境和視頻質(zhì)量的干擾太大,光線、雜物、惡劣天氣、晃動、飛蟲等的干擾,就會使應(yīng)用系統(tǒng)效果非常差,甚至失效,無法進(jìn)行正常工作。
(三)、安裝調(diào)試復(fù)雜。智能分析應(yīng)用產(chǎn)品幾乎都需要按每一個應(yīng)用場景進(jìn)行不同的參數(shù)調(diào)試,而且會涉及到非常多的專業(yè)的參數(shù)調(diào)試。非專業(yè)人員根本無法調(diào)試出理想效果。
三、智能分析技術(shù)應(yīng)用的發(fā)展趨勢
總體來看,限制智能分析技術(shù)應(yīng)用的最大因素就是準(zhǔn)確率問題。所以智能分析技術(shù)應(yīng)用的發(fā)展趨勢肯定是朝著提高準(zhǔn)確率的方向前進(jìn)的。同時另一方面,大家也會尋找一些不關(guān)心準(zhǔn)確率,而更多關(guān)注效率的一些應(yīng)用方向。
主要應(yīng)該有幾個方面的發(fā)展:
(一)、從源頭增加可判斷信息。雙目攝像機的推廣應(yīng)該是一個大方向,雙目攝像機帶有兩個鏡頭,獲取的視頻中帶有目標(biāo)的深度信息。分析算法計算能夠通過這些信息跟進(jìn),準(zhǔn)確的判斷物體之間的距離、深度、高度等信息,能夠提高整體算法的準(zhǔn)確性。
(二)、各種自學(xué)習(xí)和自適應(yīng)算法的研究和應(yīng)用。后續(xù)的智能分析產(chǎn)品應(yīng)該是帶有強大的自學(xué)習(xí)和自適應(yīng)功能的。能夠根據(jù)不同的復(fù)雜環(huán)境進(jìn)行自動學(xué)習(xí)和過濾,能夠?qū)⒁曨l中的一些干擾目標(biāo)進(jìn)行自動過濾。從而達(dá)到提高準(zhǔn)確率,降低調(diào)試復(fù)雜度的目的。例如,抗抖動算法、重復(fù)運動物體過濾、微小物體自動過濾、強光自動抑制、三維建模等技術(shù)的發(fā)展和深入應(yīng)用。
(三)、視頻數(shù)據(jù)深入挖掘應(yīng)用迅速發(fā)展。隨著視頻分析技術(shù)的快速發(fā)展,視頻數(shù)據(jù)量也非常大,如何讓視頻分析技術(shù)在大數(shù)據(jù)中發(fā)揮作用也成為人們關(guān)注的一個方向。利用各種不同的算法計算,將大量視頻數(shù)據(jù)中不同屬性的事物進(jìn)行檢索、標(biāo)注、識別等應(yīng)用,以達(dá)到對大量數(shù)據(jù)中內(nèi)容的快速查找檢索。大大降低人工成本,提高效率。甚至在有些方面讓一些人工無法完成的任務(wù)成為可能。如:人臉大數(shù)據(jù)庫檢索,身份證庫重復(fù)人員查找、視頻中穿某種衣服、某種顏色的車輛查找、車牌查找、甚至可以做到以圖搜圖等應(yīng)用(輸入一張圖片找到和圖片類似的片段)。