安防AI大數(shù)據(jù)流程的三個環(huán)節(jié)淺析
對于安防AI,看上去是AI,實(shí)際上最后是大數(shù)據(jù),大數(shù)據(jù)才是智能化的基礎(chǔ)。人工智能、深度學(xué)習(xí)、機(jī)器學(xué)習(xí)、大數(shù)據(jù)應(yīng)用在安防AI中, 說到底都是對大數(shù)據(jù)的采集、建模和應(yīng)用。本文大致說一下安防AI中,對于大數(shù)據(jù)的運(yùn)用過程與環(huán)節(jié),讓大家有個大致的印象。
安防AI大數(shù)據(jù)流程三個環(huán)節(jié)
數(shù)據(jù)采集
數(shù)據(jù)采集,有說數(shù)據(jù)獲取,這是數(shù)據(jù)的來源,安防AI中這個數(shù)據(jù)是來源于視頻監(jiān)控系統(tǒng)中的視頻流,當(dāng)然往大了說安防,還包括很多內(nèi)容,但是基本都是以視頻監(jiān)控為核心,這里主要指視頻監(jiān)控系統(tǒng)。
數(shù)據(jù)預(yù)處理
對于采集到的實(shí)時或者歷史視頻,是只能看不能應(yīng)用的,要調(diào)用就得結(jié)構(gòu)化,先給視頻流解碼,把視頻流還原成一張張圖片,再對圖片進(jìn)行預(yù)處理??赡懿煌墓緦︻A(yù)處理包含的步驟內(nèi)容說法不太一致,我是以安軟慧視的技術(shù)負(fù)責(zé)人介紹為準(zhǔn)。先對圖片進(jìn)行目標(biāo)清洗垃圾,清洗掉模糊的、不合尺寸的,目標(biāo)無法識別的、無目標(biāo)對象的等等。
當(dāng)然,有些場景可能只有這樣的圖像,這需要用到另外一些圖像處理方法,和我們的主題相關(guān)但不是一回事。這樣我們就可以得到基本符合要求的圖像。然后對這些圖像中的目標(biāo)對象進(jìn)行檢測和分割,并改變目標(biāo)的大小與標(biāo)準(zhǔn)圖片大小一致,目標(biāo)對象包括人形、人臉、車形等,這樣就可以拿去訓(xùn)練模型了。
模型訓(xùn)練
對圖片中的目標(biāo)對象進(jìn)行識別,提取和構(gòu)建模型,在安防AI中,需要的結(jié)構(gòu)化描述是比較具體的,比如對人的描述就包括性別、年齡、發(fā)型特征、發(fā)飾、上衣款式特征、下衣款式特征、鞋帽款式特征、交通工具特征、隨身物品特征、同行人特征等一系列描述。對車的描述包括車牌號碼、廠牌、車身顏色、車輛品牌、車輛類型、車輛特征物(如:年檢標(biāo)、掛飾、紙巾盒、遮陽板)等。
有了這些識別模型,就可以通過語義分析等技術(shù)對視頻數(shù)據(jù)進(jìn)行分類處理存儲,并通過后端服務(wù)器的智能分析功能進(jìn)行業(yè)務(wù)處理,將人、車、物的信息從數(shù)據(jù)中分離出來。這樣公安民警就可以進(jìn)行快速檢索、條件搜圖(人)、以圖搜圖,再配以圖片的拍攝地點(diǎn)、時間等數(shù)據(jù),就可以進(jìn)行軌跡查詢,再匹配一下大安防系統(tǒng)中的住宿、手機(jī)號碼、車票等大數(shù)據(jù),基本上嫌疑人就是插翅難逃,這對民警的破案效率將是百千倍的提升。這才是安防AI真正的價值所在。這在上一篇文章《安防AI大規(guī)模落地,解析一線場景及創(chuàng)新關(guān)鍵點(diǎn)》有過論述。
安防AI數(shù)據(jù)預(yù)處理技術(shù)及方法
目前常見的數(shù)據(jù)預(yù)處理技術(shù)
1)數(shù)據(jù)清理
數(shù)據(jù)清理例程就是通過填寫缺失值、光滑噪聲數(shù)據(jù)、識別或者刪除離群點(diǎn),并且解決不一致性來進(jìn)行“清理數(shù)據(jù)”。
2)數(shù)據(jù)集成
數(shù)據(jù)集成過程將來自多個數(shù)據(jù)源的數(shù)據(jù)集成到一起。
3)數(shù)據(jù)規(guī)約
數(shù)據(jù)規(guī)約是為了得到數(shù)據(jù)集的簡化表示。數(shù)據(jù)規(guī)約包括維規(guī)約和數(shù)值規(guī)約。
4)數(shù)據(jù)變換
通過變換使用規(guī)范化、數(shù)據(jù)離散化和概念分層等方法,使得數(shù)據(jù)的挖掘可以在多個抽象層面上進(jìn)行。數(shù)據(jù)變換操作是提升數(shù)據(jù)挖掘效果的附加預(yù)處理過程。
數(shù)據(jù)清理方法
1)缺失值
對于缺失值的處理,一般是能補(bǔ)的就想辦法把它補(bǔ)上,實(shí)在補(bǔ)不上的就丟棄處理。通常的處理方法有:忽略元組、人工填寫缺失值、使用一個全局變量填充缺失值、使用屬性的中心度量填充缺失值、使用與給定元組屬同一類的所有樣本的屬性均值或中位數(shù)、使用最可能的值填充缺失值。
2)噪聲數(shù)據(jù)
噪聲是被測量變量的隨機(jī)誤差或方差。去除噪聲、使數(shù)據(jù)“光滑”的技術(shù)有分箱、回歸、離群點(diǎn)分析等。
3)數(shù)據(jù)清理過程
這個環(huán)節(jié)主要包括數(shù)據(jù)預(yù)處理、清理方法、校驗(yàn)清理方法、執(zhí)行清理工具及數(shù)據(jù)歸檔。數(shù)據(jù)清理的原理是通過分析“無效數(shù)據(jù)”產(chǎn)生的原因和存在形式,利用現(xiàn)有的技術(shù)手段和方法去清理,將“無效數(shù)據(jù)”轉(zhuǎn)化為滿足數(shù)據(jù)質(zhì)量或應(yīng)用要求的數(shù)據(jù),從而提高數(shù)據(jù)集的數(shù)據(jù)質(zhì)量。常用的工具有Excel、Access、SPSS Modeler、SAS、SPSS StatisTIcs等。
4)模型構(gòu)建數(shù)據(jù)統(tǒng)計(jì)分析
數(shù)據(jù)統(tǒng)計(jì)為模型構(gòu)建提供基礎(chǔ),只有通過數(shù)據(jù)統(tǒng)計(jì)分析探索到了數(shù)據(jù)中隱藏的規(guī)律,深度學(xué)習(xí)才有意義,人工智能才有可能。數(shù)據(jù)統(tǒng)計(jì)又包括數(shù)據(jù)分析與結(jié)果分析,基本的分析方法有:對比分析法、分組分析法、交叉分析法、因素分析法、結(jié)構(gòu)分析法、漏斗圖分析法、矩陣關(guān)聯(lián)分析法、綜合評價分析法等。
高級的分析方法有:主成分分析法、因子分析法、對應(yīng)分析法、相關(guān)分析法、回歸分析法、聚類分析法、判別分析法、時間序列等。這些類別并不是獨(dú)一使用的,往往是混合使用的,然后再通過進(jìn)一步的分析對比從中挑選某些組合模型。
5)數(shù)據(jù)可視化
數(shù)據(jù)可視化,就是通過一些可視化圖形或者報(bào)表形式進(jìn)行展示,增強(qiáng)對分析結(jié)果的理解。再針對結(jié)果進(jìn)行進(jìn)一步的數(shù)據(jù)再分析,使得整個業(yè)務(wù)環(huán)節(jié)形成閉環(huán)。只有閉環(huán)的數(shù)據(jù)才能真正發(fā)揮出深度學(xué)習(xí)的效用。
安防AI大數(shù)據(jù)的應(yīng)用
安防大數(shù)據(jù)的應(yīng)用當(dāng)前是圍繞提升破案率和提升警務(wù)工作效率為中心的,要想在安防數(shù)據(jù)的基礎(chǔ)上開發(fā)出優(yōu)秀的應(yīng)用,必須要深入了解警務(wù)工作流程,從接處警、現(xiàn)場勘查、情報(bào)研判、應(yīng)急指揮、關(guān)聯(lián)碰撞、合成作戰(zhàn),再到各類型警用裝備間的互聯(lián)互通,再到各警種間的配合,再到各警種業(yè)務(wù)數(shù)據(jù)庫間的融合。這些都要有詳細(xì)地了解,才能發(fā)現(xiàn)針對刑偵破案、治安防控、交通管理的應(yīng)用間的差異。
舉例說,比如針對嫌疑人的追蹤,可能是臉,但是大部分時候視頻是識別不出臉的,這是事實(shí),人臉識別僅在車站、機(jī)場、銀行等卡點(diǎn)場景才有用。但是絕大多數(shù)逃犯都是有點(diǎn)反偵察能力的,不是看到攝像頭就繞著走,就是故意遮擋不讓看,或者干脆等到天黑再走。
這時候能運(yùn)用到的主要就是通過嫌疑人的外形特征進(jìn)行追蹤,以圖搜圖配上區(qū)域范圍選擇、時間段選擇,再配上同行人特征、隨行物品特征、工具特征,就可以有效地對嫌疑人進(jìn)行高效篩選,再通過綜合情報(bào)進(jìn)行軌跡研判,這種情況下,嫌疑人幾乎就是甕中之鱉,上天無路入地?zé)o門。如果再出現(xiàn)小朋友老年人走失,想找到就是分分鐘的事,再也不會出現(xiàn)讓發(fā)動大批警力沿街查找,動輒耗費(fèi)數(shù)十個小時的情況了。這樣,公安會不喜歡么?
說到底,大數(shù)據(jù)最終是為應(yīng)用服務(wù)的,只有最后真正提高了公安民警的工作效率和破案率,才能證明安防AI的價值和意義。這就要求我們既要懂AI業(yè)務(wù),又要懂公安業(yè)務(wù)。脫離了這兩者,想讓安防AI得到大面積推廣是連想都不要想的。