視頻中目標(biāo)檢測與跟蹤算法綜述

時間：2021-10-06 13:04:19

關(guān)鍵字：視頻信息目標(biāo)檢測目標(biāo)跟蹤行為識別行為分析

手機(jī)看文章

掃描二維碼
隨時隨地手機(jī)看文章

[導(dǎo)讀]摘要：視頻中的目標(biāo)檢測與跟蹤是視頻行為分析與行為識別的技術(shù)基礎(chǔ)，該論文介紹了近10年來主流目標(biāo)檢測技術(shù)和目標(biāo)跟蹤技術(shù)的主要成果，對比了主流目標(biāo)跟蹤和目標(biāo)檢測技術(shù)的性能，并介紹了這兩項技術(shù)的未來發(fā)展方向。

引言

在視頻中人或運動物體行為理解的整個流程中，運動目標(biāo)的檢測與跟蹤非常關(guān)鍵。通常一個視頻監(jiān)控系統(tǒng)大體可分解為四個不同的功能單元，即目標(biāo)檢測，搜索系統(tǒng)感興趣的目標(biāo)區(qū)域；目標(biāo)跟蹤，捕獲感興趣區(qū)域的運動軌跡；目標(biāo)分類，將被跟蹤目標(biāo)分為人，汽車或其他移動物體；目標(biāo)行為識別，對跟蹤目標(biāo)進(jìn)行行為識別。目標(biāo)檢測作為視頻監(jiān)控的前提，屬于低層次的視覺問題，目前己有多種較為成熟的算法。而目標(biāo)跟蹤作為視頻監(jiān)控最基本的功能屬于中等層次的視覺問題，是當(dāng)前制約視頻監(jiān)控系統(tǒng)性能的主要瓶頸之一。

1 主流的目標(biāo)檢測方法介紹

1.1 背景分割法

背景分割法適用于運動場景固定且比較簡單的場合，通過建立背景模型，用圖像序列的特征參數(shù)與背景模型比較，分割出背景和前景，從而得到運動對象。背景差分圖像的主要原理是通過現(xiàn)有圖像對比已知背景圖像，且背景圖像中不含任何感興趣的對象，是背景模型 [1]。該對比過程被稱為前景檢測。該過程將觀測圖像分為兩個互補的像素集合，可覆蓋全部圖像，包括感興趣的運動對象及前景與前景的補集，即背景。

背景減除法最大的缺陷是，沒有成熟和高性能的規(guī)則來定義前景區(qū)域和對象，因此其使用范圍受限。有許多背景減除算法是針對特定需求提出來的，因此對模型和分割策略也提出了特殊要求。如文獻(xiàn) [2]，它必須適用于平緩或快速的光照變化，場景運動變化，復(fù)雜的背景或背景變化。由于部分場合要求由硬件承擔(dān)背景減除功能，因此算法負(fù)載成為最基本的要求。對于戶外視頻監(jiān)控系統(tǒng)而言，算法對噪聲的魯棒性以及算法對光照變化的適應(yīng)能力是最基本的要求。

1.2 相鄰幀間差分法

該方法選擇相鄰的兩幀進(jìn)行比對，選擇參數(shù)可以是直方圖，也可以是亮度或其他圖像的特征參數(shù)，兩個相鄰的圖像幀進(jìn)行減法運算，結(jié)果的矩陣值與預(yù)設(shè)的閾值進(jìn)行比較，通過差的絕對值與閾值大小來判斷是否有運動。在這個原理的框架下有更多的改進(jìn)算法被提出，比如基于亮度假設(shè)檢驗和高階統(tǒng)計量的相鄰幀差法等 [3]。

幀間差分法的優(yōu)點在于可以很好地適用于存在多個運動物體，或者當(dāng)攝像機(jī)移動的情況。但是該方法對噪音干擾的魯棒性較差。

1.3 光流法

光流法（Optical Flow or Optic Flow）通過檢測圖像像素點的強(qiáng)度隨時間的變化情況來推斷物體的移動速度及方向。對于每個像素點，每一個時刻均有一個二維或多維的向量集合，如（x，y，t），表示指定坐標(biāo)在 t 點的瞬時速度。設(shè) I（x，y， t）為 t 時刻（x，y）點的強(qiáng)度，在很短的時間Δt 內(nèi)，x，y 分別增加Δx，Δy，則光流變化的情況如公式（1）所示：

視頻中目標(biāo)檢測與跟蹤算法綜述

1.4 統(tǒng)計法

統(tǒng)計法通過建立統(tǒng)計模型來區(qū)分前景和后景。在魏波 [4] 的文章中，場景的統(tǒng)計，前景和后景的分布情況統(tǒng)計被作為基礎(chǔ)，建立了間斷點的分布模型，此模型被用來實現(xiàn)運動目標(biāo) 的檢測。王長安，朱善安 [5] 在其論文中提出了改進(jìn)的 GVF- Snake 模型與統(tǒng)計模型融合的算法思想，實驗表明，融合后的方法結(jié)合了 GVF-Snake 與統(tǒng)計模型的各自優(yōu)點，對靜態(tài)背景的目標(biāo)檢測有很好的效果。各種文獻(xiàn)資料都表明，統(tǒng)計法適合在復(fù)雜場景中檢測運動對象，且算法的時間復(fù)雜度低，易于硬件實現(xiàn)，但由于檢測效果受先驗知識的影響，統(tǒng)計法的準(zhǔn)確度并不高。

1.5 小波法

數(shù)學(xué)界有一種公認(rèn)的提法，即小波分析是近代數(shù)學(xué)的一項重要成就，它已經(jīng)發(fā)展成為一個新的數(shù)學(xué)分支，是多學(xué)科結(jié)合的產(chǎn)物，包括泛函數(shù)值計算、Fourier變換等，是一種多尺度，多分辨的分析技術(shù)，在信息融合、語音處理、信號處理、大氣模型、地震預(yù)測等諸多領(lǐng)域都有著廣泛的使用價值，在目標(biāo)檢測方面亦有廣闊的應(yīng)用。在李紅艷[6] 的文獻(xiàn)中， Haar 小波變換的低Signal-to-Noise微小目標(biāo)檢測方法被提出，仿真實驗結(jié)果表明，李紅艷提出的方法可以有效提高目標(biāo)的Signal-to-Noise。小波分析的優(yōu)勢在于檢測復(fù)雜場景下的微弱目標(biāo)，但大規(guī)模成熟應(yīng)用的情況還比較少。

2 主流的目標(biāo)檢測方法性能比較

幾種典型目標(biāo)檢測方法的性能比較情況見表 1 所列 [7-10]。

視頻中目標(biāo)檢測與跟蹤算法綜述

3 主流的目標(biāo)跟蹤方法介紹

目標(biāo)跟蹤是機(jī)器視覺的關(guān)鍵功能步驟，在機(jī)器視覺的所有應(yīng)用領(lǐng)域，如視頻監(jiān)控，視頻壓縮，人機(jī)交互，醫(yī)學(xué)圖像處理等領(lǐng)域都是極具挑戰(zhàn)性的課題。目標(biāo)跟蹤除要在圖像序列中檢測出目標(biāo)外，還需要獲取目標(biāo)的位置、速度、運動軌跡、加速度等運動參數(shù)，從而為下一步運動目標(biāo)的行為識別與理解提供技術(shù)參數(shù)。經(jīng)過多年的發(fā)展，出現(xiàn)了許多目標(biāo)跟蹤的方法，這些方法都各自有其優(yōu)缺點。

3.1 基于特征匹配的跟蹤方法

運動目標(biāo)總會有一些區(qū)別于其他事物的屬性，如幾何形狀，外形輪廓，子空間特征等屬性，這些屬性具有可靠性，獨立性，稀疏性和可區(qū)分性等特點，可被用作目標(biāo)跟蹤的依據(jù)。特征點提取是該算法的關(guān)鍵，目前常用的特征點提取算法有SIFT算法，Kanade Lucas Tomasi（KLT）算法，Harris 算法及 SURF 算法等。

3.2 基于貝葉斯的跟蹤方法

在文獻(xiàn) [11] 中，二階 AR 模型被用來跟蹤目標(biāo)運動，一階 AR 模型被用來跟蹤目標(biāo)尺度變化，理論推導(dǎo)和仿真實驗顯示，一階、二階融合的方法取得了較好的跟蹤效果。在貝葉斯跟蹤方法中，Kalman 濾波（KF）是最早被成熟應(yīng)用的方法， KF 具有準(zhǔn)確預(yù)測平穩(wěn)運動目標(biāo)下一個時間點位置的特性，因此在彈道目標(biāo)跟蹤中有成熟的產(chǎn)品應(yīng)用。但 KF 的缺陷是只能處理線性高斯模型，雖然 KF 有各種改進(jìn)模型，但都不能處理非高斯非線性模型。

3.3 基于動態(tài)輪廓的跟蹤方法

動態(tài)輪廓跟蹤方法的主要原理是先勾勒出運動目標(biāo)的輪廓，由后續(xù)幀不斷更新輪廓進(jìn)而達(dá)到跟蹤的目的。文獻(xiàn) [12] 中，視頻圖像中的汽車跟蹤就采用了動態(tài)輪廓跟蹤方法。該方法其實是基于區(qū)域方法的一個變形，它比區(qū)域跟蹤更具體，更高效，但對動態(tài)輪廓跟蹤方法初始值比較敏感，需要進(jìn)行人機(jī)交互，很難實現(xiàn)自動跟蹤。

3.4 基于模型的跟蹤方法

模型跟蹤法的核心是建立的已知跟蹤目標(biāo)的精細(xì)三維模型與待檢測圖像之間的匹配操作。其缺點是對模型過分依賴，計算復(fù)雜，不利于實時處理。但基于模型的跟蹤方法便于實現(xiàn)自動跟蹤，因此國內(nèi)外學(xué)者對 3D 模型的跟蹤方法和基于深度估計的跟蹤方法做了大量研究工作。VIEWS 系統(tǒng)是英國 Reading 大學(xué)開發(fā)研制的一種基于 3D 模型的道路車輛識別與跟蹤系統(tǒng)——VIE 系統(tǒng) [13]，基于 VIEWS 的研究經(jīng)驗，中科院自動化所模式識別實驗室自行設(shè)計了擁有自主版權(quán)的交通監(jiān) 控原型 VStar，該系統(tǒng)在 PC 環(huán)境下運行，用以對車輛進(jìn)行實時跟蹤，并對各種干擾因素如光線變化，斑馬線干擾，邊界遮擋等都顯示了較強(qiáng)的魯棒性。

4 主流的目標(biāo)跟蹤方法性能比較

幾種常見的目標(biāo)跟蹤方法的性能比較見表 2 所列 [14-16]。

視頻中目標(biāo)檢測與跟蹤算法綜述

5 結(jié) 語

就目標(biāo)檢測而言，其發(fā)展趨勢是尋找算法時間復(fù)雜度低、算法魯棒性強(qiáng)、算法成熟度高和受先驗知識影響小的算法。就目標(biāo)跟蹤算法而言，尋找自動化程度高、先驗知識依賴程度低、計算復(fù)雜度低和應(yīng)用成熟度高的算法是今后的發(fā)展趨勢。