分布式傳感器網(wǎng)絡(luò)環(huán)境的多目標(biāo)跟蹤和特征管理設(shè)計
掃描二維碼
隨時隨地手機(jī)看文章
近來傳感器技術(shù)和無線通信技術(shù)的發(fā)展導(dǎo)致了一個新概念的誕生一傳感器網(wǎng)絡(luò),即一個由本地傳感器節(jié)點所組成的具有感知、處理和通信能力的一種廣泛應(yīng)用的網(wǎng)絡(luò)。為了更深入地挖掘傳感器網(wǎng)絡(luò)所具有的能力,筆者提出了一種可擴(kuò)展分布式的多目標(biāo)跟蹤和特征管理方法,該方法能夠通過一個傳感器網(wǎng)絡(luò)對多個目標(biāo)實現(xiàn)跟蹤和特征管理。
傳統(tǒng)的多目標(biāo)跟蹤方法,如MHT跟蹤器,不適用于傳感器網(wǎng)絡(luò)。而現(xiàn)有基于傳感器網(wǎng)絡(luò)的算法僅基于如下情況:所跟蹤目標(biāo)的數(shù)量已知不變,并且它們的運動軌跡對于本地傳感器已知。而在本文中,筆者放寬了以上假設(shè),形成對于分布式多目標(biāo)的跟蹤和特征管理算法DMTIM。文中在實現(xiàn)數(shù)據(jù)關(guān)聯(lián)和多目標(biāo)跟蹤運用了馬爾科夫鏈蒙特卡羅數(shù)據(jù)關(guān)聯(lián)MCMCDA的方法,實時對未知數(shù)量的多目標(biāo)進(jìn)行跟蹤。MCMCDA方法能夠獨立地對軌跡進(jìn)行起始和終止,并能夠跟蹤未知數(shù)量的多目標(biāo)。每個傳感器能夠運用MCMCDA有效地跟蹤一組未知數(shù)量的目標(biāo),并且能夠?qū)δ繕?biāo)的特征進(jìn)行分布式地管理。
本文結(jié)構(gòu)如下:分布式多目標(biāo)的跟蹤與特征管理算法概述;多目標(biāo)跟蹤問題及其概率模型;DMTIM關(guān)鍵算法敘述:馬爾科夫鏈蒙特卡羅數(shù)據(jù)關(guān)聯(lián)算法;DMTIM組成部分介紹,包括數(shù)據(jù)關(guān)聯(lián)、多目標(biāo)跟蹤、特征管理和信息融合;DMTIM算法仿真試驗及評估。
1 分布式多目標(biāo)跟蹤和特征管理
文中研究重點是傳感器網(wǎng)絡(luò)中多目標(biāo)的跟蹤和特征管理方法。每個傳感器擁有自己的觀測區(qū)域,且擁有與其鄰近傳感器通信的能力。如圖1所示一個簡單的二傳感器的系統(tǒng),大圓圈代表傳感器的觀測區(qū)域。每個傳感器能夠?qū)Χ嗄繕?biāo)進(jìn)行跟蹤并在觀測區(qū)域內(nèi)管理目標(biāo)特征。該問題的難點在于觀測區(qū)域內(nèi)目標(biāo)的數(shù)量會隨時間而變化,因此我們必須尋求一種可擴(kuò)展的,在相鄰傳感器中具有本地一致性的方法。
筆者提出的可擴(kuò)展的分布式多目標(biāo)跟蹤與特征管理DMTIM算法能對未知數(shù)量且數(shù)量隨時變化的機(jī)動目標(biāo)進(jìn)行跟蹤,對其特征進(jìn)行有效的管理。并能夠在一個分布式的傳感器網(wǎng)絡(luò)中進(jìn)行實現(xiàn)。對于每一個傳感器,DMTIM中的多目標(biāo)跟蹤算法負(fù)責(zé)估算如下量:目標(biāo)的數(shù)量,觀測區(qū)域內(nèi)所有目標(biāo)的運動軌跡,以及在特征管理算法中將用到的混合矩陣和本地信息。然后,相鄰的傳感器通過相互通信對本地狀態(tài)估算值和信任矩陣進(jìn)行交換。同時,通過信息融合實現(xiàn)了本地一致性,進(jìn)而實現(xiàn)全局一致性。
本文的剩余部分對DMTIM的算法模塊進(jìn)行了詳細(xì)描述并且還對多目標(biāo)跟蹤問題,以及馬爾科夫鏈蒙特卡洛數(shù)據(jù)關(guān)聯(lián)進(jìn)行了描述。
2 多目標(biāo)跟蹤
基于每個傳感器視野范圍內(nèi)的目標(biāo)數(shù)量會隨時間不斷變化,本章提出的DMTIM多目標(biāo)跟蹤適應(yīng)于此類多目標(biāo)數(shù)量不確定的情況。
2.1 問題模式
設(shè)T∈Z+為傳感器觀測持續(xù)的時間,K為該時間內(nèi)觀測范圍R中所出現(xiàn)的目標(biāo)數(shù)量。在某時間段
Y的集合,且ω∈Ω,有如下參數(shù):
分離的過程如圖2所示,其中K為軌跡數(shù)量,|Tk|為Tk的基數(shù),當(dāng)沒有軌跡互擾的情況下認(rèn)為Tk為一個正確的軌跡。假設(shè)一條軌跡至少包含兩個觀測值,因為不能由一個單一的觀察值確定一條軌跡。于是再假設(shè)e(t-1)為時刻t-1之后目標(biāo)的數(shù)量,z(t)為時刻t消失的目標(biāo)的數(shù)量,c(t)=e(t-1)-z(t)為時刻t-1到t未消失的數(shù)量。設(shè)a(t)為時刻t新出現(xiàn)的目標(biāo),d(t)為時刻t的實際目標(biāo),g(t)=c(t)+a(t)-d(t)為未識別的目標(biāo)。最后,設(shè)f(t)=n(t)-d(t)為錯誤報警數(shù)量,有:
其中P(ω|Y)是Y的相似概率。
本文采用了最大后驗MAP算法解決多目標(biāo)跟蹤問題。該算法對觀測目標(biāo)進(jìn)行分割,并根據(jù)分割對目標(biāo)狀態(tài)進(jìn)行估算。
3 馬爾科夫鏈蒙特卡洛數(shù)據(jù)融合
本節(jié)提出一種解決第二節(jié)中多目標(biāo)跟蹤問題的算法,該算法是離散多目標(biāo)跟蹤與識別算法模塊的核心。
3.1 馬爾科夫鏈蒙特卡洛模型
馬爾科夫鏈蒙特卡洛模型是已知唯一能在多項式時間復(fù)雜問題下實現(xiàn)估值計算的方法,同時,還是一種從位于空間Ω的分布π中提取抽樣值的普遍方法,該方法通過狀態(tài)值ω∈Ω和穩(wěn)定分布值π(ω)建立的馬爾科夫鏈M來實現(xiàn)其算法?,F(xiàn)在來描述該算法。在狀態(tài)ω∈Ω,假設(shè)ω’∈Ω服從分布q(ω,ω’)。而運動的感知服從感知慨率A(ω,ω’),其中:
N→∞。可以注意到公式(4)只需計算出π(ω’)/π(ω)的比值,而無需對π進(jìn)行標(biāo)準(zhǔn)化。
3.2 馬爾科夫鏈蒙特卡洛數(shù)據(jù)關(guān)聯(lián)
MCMCDA算法是馬爾科夫鏈蒙特卡洛算法的特殊形式,其狀態(tài)空間是上文在第2.2節(jié)中提到的,并且其平穩(wěn)分布服從公式(3)。對于MCMCDA的分布有5類動作組成。它們包括:1)發(fā)現(xiàn)/消失運動;2)分割/合并運動:3)擴(kuò)展/減少運動;4)跟蹤刷新運動;5)跟蹤切換運動。
MCMCDA的運動方式如圖3中所示,每個運動的詳細(xì)描述在此省略。MCMCDA的輸入是一系列觀測值Y,樣本觀測值的個數(shù)nmc,初始狀態(tài)ωinit,以及有界函數(shù)X:Ω→Rm。對于該算法的每一步,ω是馬爾科夫鏈的當(dāng)前狀態(tài)。其獲取概率A(ω,ω’)如公式(4),輸出接近MMSE的估計值EπX,且接近MAP的估計值arg maxP(ω|Y)。
4 分布式多目標(biāo)跟蹤與特征管理算法結(jié)構(gòu)
現(xiàn)在對分布式多目標(biāo)跟蹤與特征管理算法進(jìn)行詳細(xì)描述。運用一種信念向量來表示目標(biāo)的特征。對于多目標(biāo)的情況下,我們需要運用信念矩陣B(t),其各列由信念向量Bij(t)所組成。因此,向量表示目標(biāo)j能被t時刻的i所確定的概率。
4.1 多目標(biāo)跟蹤(數(shù)據(jù)關(guān)聯(lián))
DMTIM多目標(biāo)跟蹤(數(shù)據(jù)關(guān)聯(lián))模塊的輸出涉及到混合矩陣、狀態(tài)估計值和本地信息三者的計算。
首先需要求得混合矩陣。假設(shè)在觀測范圍內(nèi)有K個目標(biāo)具有K個特征,因此特征管理意味著對多目標(biāo)的特征進(jìn)行匹配。對此,運用Identi ty-Mass-Flow的方法?;旌暇仃囀且粋€KxK矩陣,其元素Mij(t)表示目標(biāo)i在t-1時刻變成目標(biāo)j的概率。而MCMCDA能夠在多項式時間下對混合矩陣進(jìn)行有效地估算。
然后需要對狀態(tài)估計值進(jìn)行計算。如上所述,MCMCDA能夠?qū)ξ粗獢?shù)量的多目標(biāo)進(jìn)行跟蹤,并且能夠?qū)崿F(xiàn)軌跡的發(fā)生與終止。在每一個采樣時間段,其測量值與前一段的測量值相疊加,從而構(gòu)造出測量值集合Y。MCMCDA能求出,其值接近多目標(biāo)跟蹤的MAP估計值,以及中所有軌跡的狀態(tài)估計值。對于每一個軌跡τ∈ω,將它與之前發(fā)現(xiàn)的目標(biāo)軌跡進(jìn)行比較。如果τ與之前目標(biāo)軌跡的測量值無任何相同之處,那么我們認(rèn)定其為新目標(biāo)。然后,當(dāng)前傳感器τ對于對相鄰傳感器進(jìn)行詢問,如果相鄰傳感器對τ已知,那么它的特征將被復(fù)制到當(dāng)前傳感器當(dāng)中。否則,將對τ創(chuàng)建新的特征。最后,當(dāng)軌跡結(jié)束時,對目標(biāo)特征進(jìn)行刪除。在第4.2節(jié),將對目標(biāo)數(shù)量變化情況下信任矩陣如何實現(xiàn)刷新進(jìn)行描述。
最后計算表示為信任向量的形式的本地信息。MCMCDA方法能夠通過最新的,以及之前的測量值有效地計算出本地信息。當(dāng)目標(biāo)和軌跡的數(shù)量處于估計值的情況下,本地信息能夠被同時計算出來。對于特征值k,定義Njk為時間點個數(shù),第j個最新觀測值與之前的觀測值合并,觀測值在之前的nbi個采樣值中由k表征,其中nbi為之前的采樣值數(shù)量。算法結(jié)束時對特征值k計算 。然后根據(jù)最新的觀測值來對向量進(jìn)行調(diào)整,進(jìn)而通過γk來形成本地信息。
4.2 特征管理
特征管理模塊包括信任矩陣刷新和本地信息關(guān)聯(lián),而多目標(biāo)跟蹤(數(shù)據(jù)關(guān)聯(lián))的混合矩陣和本地信息被用來刷新信任矩陣。
信任矩陣刷新模塊包含存儲在KxK信任矩陣B(t)中的特征信息。信任矩陣的刷新如下:
B(t)=B(t-1)M(t) (6)
可以看出,公式(6)使信任矩陣行、列之和保持不變。然而目標(biāo)數(shù)量的變化使該方法不適用于分布式特征管理。數(shù)量的變化有兩種情形:目標(biāo)離開和進(jìn)人觀測區(qū)域。目標(biāo)離開,對傳感器中混合矩陣的相應(yīng)列進(jìn)行刪除;目標(biāo)進(jìn)入,又有兩種情形:1)目標(biāo)從相鄰傳感器區(qū)域進(jìn)入,2)目標(biāo)從未知區(qū)域進(jìn)入。
而本地信息被運用來降低由香農(nóng)信息所得的信任矩陣的不確定性。LxK信任矩陣的香農(nóng)信息定義如下:
接下來的問題是將該信息關(guān)聯(lián)到信任矩陣。信任矩陣具有如下性質(zhì):各列之和等于1;各行之后保持不變;各列之和的和與各列之和的和相等。如果將某列替換為本地信息,將無法保證以上性質(zhì)。當(dāng)且僅當(dāng)本地信息能夠降低信任矩陣的不確定性時才能與信任矩陣進(jìn)行關(guān)聯(lián)。
4.3 信息融合
DMTIM算法通過信息融合來計算本地傳感器網(wǎng)絡(luò)的全局信息,具體包括來自不同傳感器的狀態(tài)估計值和特征信任向量的融合。
特征信息(信任向量)的融合能夠被表述為最優(yōu)化的問題。3個不同的成本函數(shù),香農(nóng)信息(Shannon information),切爾洛夫信息(Chemo ff information),以及萊布勒距離(Kullbaek-Leibler distances)之和代表了不同的性能指標(biāo)。本文場景中所有的傳感器都參與協(xié)同工作,因此我們采用香農(nóng)信息的方法。
假設(shè)本地傳感器提供了兩個信任向量
。香農(nóng)信息法用計算兩個信任向量的凸函數(shù)的方法求得一個融合信任向量:
鑒于每個目標(biāo)可能具有來自不同傳感器的多重軌跡,運用軌跡數(shù)據(jù)融合方法來對多重的軌跡進(jìn)行合并。設(shè)ωi為來自傳感器i的軌跡,NBi為包括i并與i相鄰的一系列傳感器。設(shè)Y’={τk(t):τk∈ωj,1≤t≤T,1≤k≤ω|ωj|,j∈NBi}為所有確定目標(biāo)的一系列觀測結(jié)果。通過重疊觀測區(qū)域,可以由Y’得到一系列合并觀測結(jié)果Y。于是得到一系列新的軌跡ωinit。然后對一系列合并觀測結(jié)果運行算法,以得出本地穩(wěn)定的跟蹤軌跡,其初始狀態(tài)為ωinit。
5 仿真結(jié)果
在該節(jié)中,提供一個簡單的場景來說明DMTIM算法的性能。環(huán)境中有兩個固定傳感器--空中交通管制雷達(dá),在二維空間中對多架飛機(jī)進(jìn)行跟蹤。假定每個傳感器觀測范圍的半徑為10 km,并且當(dāng)兩傳感器距離進(jìn)入20 km的通信范圍,它們之間可以實現(xiàn)相互通信。該場景中包含3架飛機(jī),如圖4所示。被標(biāo)注為A和B的飛機(jī)首先被預(yù)注冊,被標(biāo)注為的飛機(jī)對于特征管理系統(tǒng)是未知的。左側(cè)傳感器被傳感器1所標(biāo)注,右側(cè)傳感器被傳感器2所標(biāo)注。每個傳感器中的多目標(biāo)跟蹤模塊對目標(biāo)的數(shù)量進(jìn)行估算,并且對每個已知目標(biāo)的軌跡進(jìn)行估算。在圖5中,目標(biāo)數(shù)量改變的事件被垂直的點線所標(biāo)注。在時刻1,傳感器1感知到目標(biāo)1,并且其信任向量為是目標(biāo)k能夠被傳感器i所感知并標(biāo)定為j的概率;同時傳感器2感知到它的目標(biāo)1,并且其信任向量為。在時刻9,傳感器1發(fā)現(xiàn)新目標(biāo)(傳感器1的目標(biāo)2),并賦予新值X。同時,傳感器2感知到新目標(biāo)(傳感器2的目標(biāo)2),該目標(biāo)的特征值和狀態(tài)估計信息從傳感器1轉(zhuǎn)移過來。以此類推,在時刻30,傳感器2的目標(biāo)2離開了傳感器2的觀測范圍,其信息隨機(jī)從傳感器2刪除。
信息融合能夠降低目標(biāo)交叉運動所產(chǎn)生的不確定性。鑒于香農(nóng)信息效率的優(yōu)越性,在該試驗中我們運用了該方法來實現(xiàn)信息的融合。圖6所示為融合的信任向量,圖7為實現(xiàn)狀態(tài)估計融合后各傳感器所估算的軌跡。
6 結(jié)論
筆者主要對傳感器網(wǎng)絡(luò)下多目標(biāo)的跟蹤和特征管理方法進(jìn)行了研究。數(shù)據(jù)關(guān)聯(lián)和多目標(biāo)跟蹤的問題能夠由馬爾科夫鏈蒙特卡洛數(shù)據(jù)關(guān)聯(lián)算法有效地解決,該算法能夠?qū)?shù)量未知且數(shù)量隨時間變化的多目標(biāo)進(jìn)行跟蹤。文中還講述了一個可擴(kuò)展的分布式多目標(biāo)跟蹤和身份管理(DMTIM)算法,該算法能夠?qū)Χ嗄繕?biāo)進(jìn)行跟蹤,并在分布式傳感器網(wǎng)絡(luò)環(huán)境下能夠有效地管理目標(biāo)的特征。DMTIM算法由數(shù)據(jù)關(guān)聯(lián),多目標(biāo)跟蹤,特征管理,以及信息融合四部分所組成。DMTIM能夠?qū)δ衬繕?biāo)特征的本地信息進(jìn)行有效地整合,以降低系統(tǒng)的不確定性,并通過信息融合來保持相鄰傳感器的本地一致性。