智能視頻識別如何讓物聯(lián)網(wǎng)立足在此
數(shù)據(jù)大爆炸的時代
每一天10萬3680小時視頻上傳到YouTube;20億小時電視與電影在Netflix上觀看,
智能手機、平板電腦、可穿戴設備和PC的普及化應用,加上通信網(wǎng)絡的升級,讓每一個人都成為了圖像視頻采集者。
而這些視頻信息還僅僅是互聯(lián)網(wǎng)與移動互聯(lián)網(wǎng)產(chǎn)生的非結構化數(shù)據(jù),如果算上非結構化數(shù)據(jù)來源的大頭——負責城市安全與公共管理的視頻監(jiān)控攝像機,這些視頻數(shù)據(jù)將會無法量化。
以某一個城市南京路為例,整條街道有45個攝像頭,其中有35個是1080P高清攝像機。一個高清攝像頭一秒鐘產(chǎn)生0.5MB大小的視頻,一分鐘為30MB,一小時為1800MB;如果算上一條街,一小時35個高清攝像頭將有63000MB大小的視頻。
如果是一個城市6000個高清攝像機,一小時的視頻大小將有10800000MB。而安防行業(yè)通常便是24小時運作,一天算下來,一個城市將有247TB的視頻數(shù)據(jù),一個月7416TB,而這僅僅是一個城市的數(shù)據(jù)量……
人工智能的軟肋
與文字、聲音相比,視頻承載了更豐富的信息量。要在短時間內(nèi)讀懂讀全視頻里的信息量,對人來說不是件容易的事。
機器沒有人類的大腦,沒有洞察力,但與人相比,它有強大的計算能力,如果用視頻科技的力量激活機器的神經(jīng),讓每一個攝像機都能識別出監(jiān)控畫面中的內(nèi)容,并通過后臺的云計算和大數(shù)據(jù)分析,來做出思考和判斷,并在此基礎上采取行動,我們就能夠真正的讓鏡頭代替人類去觀察世界。
如今,越來越多的行業(yè)開始關注智能視頻分析的應用,如公安、金融、監(jiān)管、交通、零售行業(yè)等。他們希望通過智能視頻分析技術,來解決對龐大的視頻數(shù)據(jù)的查詢與分析效率。
現(xiàn)在也有越來越多的國際頂級研究機構和學者在智能視頻分析領域大力投入,由此不斷涌現(xiàn)出性能更優(yōu)秀的算法,不斷提高產(chǎn)品中視覺分析技術的性能。
智能視頻技術的發(fā)展
智能視頻分析技術正式進入國內(nèi)安防市場,基本上是以后端服務器智能為主,由于成本太高,因此只能開展小規(guī)模的應用,無法真正成為大數(shù)據(jù)的基礎。
在2008年左右,智能逐漸的前端化,率先在智能交通攝像機中實現(xiàn)。幾年過去,前端的智能應用逐漸五花八門。到了2012年,以安防報警為主的攝像機出現(xiàn)在人們的視野之內(nèi),但這些攝像機并非真正意義上的智能攝像機,也無法打開前端視頻監(jiān)控與后端大數(shù)據(jù)之間的隔閡。
2014年10月,具備識別、思考、描述三個典型特征的感知型攝像機出現(xiàn)了,它能基于視頻的智能分析,識別出監(jiān)控畫面中的內(nèi)容,用語言與圖片進行描述,然后送入后端大數(shù)據(jù)的世界。它帶來了智能識別的新方向,也真正推開了視頻監(jiān)控與大數(shù)據(jù)之間的隱形門。
感知型攝像機與大數(shù)據(jù)的應用
擁有感知能力的感知型攝像機,相當于物聯(lián)網(wǎng)中的一個一個視覺傳感器,大量攝像機感知的海量信息,進入大數(shù)據(jù)和云計算平臺,進行二次運算,使我們不僅能從單個攝像機中識別內(nèi)容作出判斷,還能從海量的監(jiān)控數(shù)據(jù)中,做出深度分析和挖掘,從而讓公共安全、社會管理、交通管理的方式得以改變……
語義搜索
搶劫案目擊者提供車牌不明的犯罪車輛信息。直接輸入“3月1日”、“黑色”、“奧迪”,鎖定目標車輛。
人臉搜索
越獄犯身藏何處?將罪犯人臉照片輸入偵查系統(tǒng),人臉搜索功能將自動查找人員蹤跡。
實時布控
珠寶店盜竊案的犯罪車輛失蹤。在系統(tǒng)中輸入車牌信息,嫌疑車輛經(jīng)過任何監(jiān)控攝像頭,系統(tǒng)自動告警。
以圖搜圖
犯罪分子利用套牌、假牌掩蓋路徑。以圖搜圖功能利用車身圖片同樣可查到車輛的通行數(shù)據(jù)。
多點碰撞
連環(huán)盜竊案。比對每個案發(fā)地點在案發(fā)時間的所有車輛信息,發(fā)現(xiàn)全都出現(xiàn)過某輛車,即鎖定為嫌疑車輛。
人車關聯(lián)
違法違規(guī)駕駛。人車關聯(lián)智能比對駕駛員人臉與車輛信息,違法違規(guī)追責到具體人。