基于無(wú)人機(jī)的視覺(jué)傳感網(wǎng)和圖像識(shí)別中心的建設(shè)
掃描二維碼
隨時(shí)隨地手機(jī)看文章
無(wú)人機(jī)技術(shù)的發(fā)展十分迅速。從美軍無(wú)人機(jī)的使用,到現(xiàn)在無(wú)人機(jī)在研究、民用等多方面的普及,無(wú)人機(jī)已成為一種新的潮流[1-2]。隨之而來(lái)也帶來(lái)很多新問(wèn)題,此前無(wú)人機(jī)險(xiǎn)撞戰(zhàn)機(jī)事件的發(fā)生,就給人們敲響了警鐘。因此,無(wú)人機(jī)警察系統(tǒng)的搭建勢(shì)在必行。本文的研究重點(diǎn)為:建立視覺(jué)傳感網(wǎng),用于無(wú)人機(jī)的圖像捕捉和信息存儲(chǔ);引入深度學(xué)習(xí)對(duì)無(wú)人機(jī)進(jìn)行識(shí)別,及時(shí)發(fā)現(xiàn)“黑飛無(wú)人機(jī)”,并采取相應(yīng)報(bào)警措施,實(shí)現(xiàn)對(duì)無(wú)人機(jī)的全面監(jiān)管。
1、視覺(jué)傳感網(wǎng)
整個(gè)視覺(jué)傳感網(wǎng)(Visual Sensor Networks,VSNs)由多個(gè)節(jié)點(diǎn)組成,每個(gè)節(jié)點(diǎn)都將由攝像機(jī)陣列構(gòu)成,這將作為整個(gè)系統(tǒng)的基礎(chǔ)部分[3],如圖1。
城市環(huán)境下一個(gè)節(jié)點(diǎn)的安置示意圖如圖2。
為了減輕對(duì)居民的干擾,可以修改攝像機(jī)焦距參數(shù),從而限制攝像機(jī)的拍攝范圍。通過(guò)多臺(tái)攝像機(jī)交叉覆蓋,成功地將中間的空地區(qū)域全方位地納入監(jiān)控之中。
考慮到多節(jié)點(diǎn)所提供的龐大數(shù)據(jù)量以及優(yōu)化控制結(jié)構(gòu)的需要,將數(shù)據(jù)網(wǎng)絡(luò)設(shè)計(jì)成三層結(jié)構(gòu)。位于最底層的第三層由數(shù)量不等的節(jié)點(diǎn)構(gòu)成一系列簇組成,每個(gè)簇內(nèi)的節(jié)點(diǎn)統(tǒng)一將數(shù)據(jù)發(fā)往一臺(tái)次級(jí)處理服務(wù)器。整個(gè)網(wǎng)絡(luò)內(nèi)的次級(jí)處理服務(wù)器構(gòu)成網(wǎng)絡(luò)的第二層,將數(shù)據(jù)送往位于第一層的中央高級(jí)服務(wù)器。
2、基于深度學(xué)習(xí)的圖像識(shí)別中心
無(wú)人機(jī)警察系統(tǒng)中關(guān)鍵組成是圖像識(shí)別中心,其任務(wù)是將視覺(jué)傳感網(wǎng)中的圖像信息進(jìn)行分析和處理,從圖像中識(shí)別出無(wú)人機(jī),從而實(shí)現(xiàn)對(duì)無(wú)人機(jī)的監(jiān)控,屬于目標(biāo)識(shí)別領(lǐng)域。目前這一領(lǐng)域已經(jīng)有了大量的優(yōu)秀成果出現(xiàn)。最常見(jiàn)有行人檢測(cè)問(wèn)題,可用的特征包括:Haar、HOG、CSS、LBP等多種,這些特征表達(dá)了人體的各個(gè)重要部分,并且充分考慮了遮擋等情形。王曉剛和歐陽(yáng)萬(wàn)里更提出了基于深度學(xué)習(xí)的行人檢測(cè)手段,通過(guò)聯(lián)合學(xué)習(xí)行人檢測(cè)中的4個(gè)重要組成部分——特征提取、人體部件形變處理、遮擋處理和分類,最大化了各自的作用[4]。他們?cè)趥鹘y(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上,加入了形變處理層,最終習(xí)得的特征具有很強(qiáng)的判別力,優(yōu)于HOG等特征。王曉剛團(tuán)隊(duì)的方案,是深度學(xué)習(xí)在目標(biāo)識(shí)別領(lǐng)域的成功應(yīng)用,給本文的研究提供了研究參考。再比如人臉識(shí)別問(wèn)題[5-6],則具有更復(fù)雜的變化,因?yàn)槿四樖芊N族、膚色、表情、情緒、光照環(huán)境、物體遮擋等眾多因素的影響。推廣到各種特定物體的識(shí)別乃至場(chǎng)景識(shí)別、深度學(xué)習(xí)也有很多方案[7]。由于無(wú)人機(jī)警察系統(tǒng)中圖片信息量豐富,且無(wú)人機(jī)的飛行狀態(tài)多樣,因此識(shí)別難度較大。為此,本文將引入深度學(xué)習(xí)算法,并以卷積神經(jīng)網(wǎng)絡(luò)作為圖像識(shí)別中心。
2.1 卷積神經(jīng)網(wǎng)絡(luò)
2006年,Hinton等人首次提出深度學(xué)習(xí)的概念[8],并開(kāi)啟了深度學(xué)習(xí)的研究浪潮,其認(rèn)為:多隱層的人工神經(jīng)網(wǎng)絡(luò)能夠更好地模擬人腦的思考過(guò)程,具有更加優(yōu)異的學(xué)習(xí)能力,能夠?qū)?shù)據(jù)進(jìn)行更本質(zhì)的刻畫(huà),從而提高可視化或者分類的能力。
卷積神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)中第一個(gè)真正多層結(jié)構(gòu)學(xué)習(xí)算法,其在圖像識(shí)別領(lǐng)域優(yōu)勢(shì)明顯。它利用感受野、局部連接等概念極大地減少了參數(shù)量,降低了網(wǎng)絡(luò)模型的復(fù)雜度,提高了訓(xùn)練效率,且網(wǎng)絡(luò)對(duì)于平移、縮放的各種變形都具備高度不變性。
卷積神經(jīng)網(wǎng)絡(luò)屬于前饋多層神經(jīng)網(wǎng)絡(luò)的一種,每層由多個(gè)二維平面組成,多個(gè)神經(jīng)元組成了每個(gè)平面,其結(jié)構(gòu)如圖3所示。
卷積神經(jīng)網(wǎng)絡(luò)利用了一系列的卷積層,降采樣層構(gòu)建了多層網(wǎng)絡(luò),來(lái)模擬人腦感知視覺(jué)信號(hào)的逐層處理機(jī)制,從而提取圖像的多層次特征。
通過(guò)加入卷積層,可以實(shí)現(xiàn)局部連接網(wǎng)絡(luò),有效減少了需要訓(xùn)練的網(wǎng)絡(luò)參數(shù)。例如,對(duì)一張大的圖片輸入,其尺寸為r&TImes;c,隨機(jī)采樣為a&TImes;b的小圖片,如果隱含節(jié)點(diǎn)為k個(gè),那么最終學(xué)習(xí)到的特征數(shù)為:
卷積神經(jīng)網(wǎng)絡(luò)利用了一系列的卷積層,降采樣層構(gòu)建了多層網(wǎng)絡(luò),來(lái)模擬人腦感知視覺(jué)信號(hào)的逐層處理機(jī)制,從而提取圖像的多層次特征。