基于無線數(shù)據(jù)傳輸?shù)倪h(yuǎn)程人臉追蹤
摘要:在此提出了一個(gè)有效的無線遠(yuǎn)程人臉追蹤系統(tǒng)實(shí)現(xiàn)方案,將人臉檢測(cè)技術(shù)、人臉識(shí)剮技術(shù)和窄帶通信技術(shù)有效結(jié)合,采用AdaBoost追蹤算法獲取圖像中可分辨的人臉,把各個(gè)點(diǎn)攝像終端的數(shù)據(jù)進(jìn)行壓縮后采用GPRS/CDMA無線傳輸發(fā)送至處理中心,采用Gabors特征提取算法和SVM分類算法對(duì)人臉數(shù)據(jù)庫進(jìn)行篩選,對(duì)實(shí)時(shí)傳輸?shù)娜四樳M(jìn)行識(shí)別,從而達(dá)到輔助尋找和追蹤特定人的目的。該方案通過實(shí)驗(yàn)證明是可行的。
關(guān)鍵詞:人臉檢測(cè);人臉識(shí)別;窄帶傳輸;支持向量機(jī)
0 引言
人臉作為圖像與視頻中最重要的視覺圖像之一,在計(jì)算機(jī)視覺、模式識(shí)別、多媒體技術(shù)研究中占有很重要的地位??梢暬治龊湍繕?biāo)識(shí)別研究中最具有挑戰(zhàn)性的任務(wù)之一就是理解人們?nèi)绾翁幚砗妥R(shí)別彼此的相貌,并進(jìn)行相應(yīng)的計(jì)算機(jī)建模來最終完成人臉的自動(dòng)識(shí)別。近年來,隨著計(jì)算機(jī)科學(xué)在人機(jī)交互領(lǐng)域的快速發(fā)展,作為人臉信息處理中的一項(xiàng)關(guān)鍵技術(shù),人臉檢測(cè)與識(shí)別現(xiàn)在已經(jīng)成為模式識(shí)別與計(jì)算機(jī)視覺領(lǐng)域內(nèi)一項(xiàng)受到普遍重視。無線視頻監(jiān)控系統(tǒng)將被監(jiān)控點(diǎn)實(shí)時(shí)采集的圖片、視頻文件通過無線網(wǎng)絡(luò)及時(shí)地傳輸給遠(yuǎn)程監(jiān)控中心,實(shí)時(shí)動(dòng)態(tài)地報(bào)告被監(jiān)測(cè)點(diǎn)的情況,及時(shí)發(fā)現(xiàn)問題并進(jìn)行處理。
本文提出了一種有效的無線遠(yuǎn)程人臉追蹤系統(tǒng)的解決方案。采用AdaBoost算法進(jìn)行人臉的檢測(cè),選擇了Haar特征方法,把訓(xùn)練得出的Haar特征轉(zhuǎn)換成弱分類器,通過一定的方法將弱分類器進(jìn)行組合構(gòu)成強(qiáng)分類器,對(duì)分類器進(jìn)行訓(xùn)練后應(yīng)用到圖像中進(jìn)行人臉區(qū)域的檢測(cè),從而得到較準(zhǔn)確的人臉信息;采用GPRS技術(shù)進(jìn)行人臉圖像數(shù)據(jù)的無線傳輸,通過GPRS/CDMA無線窄帶網(wǎng)絡(luò)連接Internet互聯(lián)網(wǎng)絡(luò),在無線視頻監(jiān)控終端對(duì)視頻信號(hào)進(jìn)行實(shí)時(shí)采集,無線傳送到遠(yuǎn)程服務(wù)器;采用Gabor小波進(jìn)行特征提取,獲得人臉圖像的Gabor特征;采用SVM進(jìn)行分類,對(duì)人臉圖像進(jìn)行分類識(shí)別,得出識(shí)別結(jié)果,對(duì)符合條件的人臉給出警報(bào)。本系統(tǒng)可以應(yīng)用于商場、機(jī)場、車站、地鐵站等場所。
1 視頻圖像處理
1.1 去噪處理
圖像在生成和傳輸過程中常受到各種噪聲的干擾和影響,使圖像質(zhì)量下降。所以在進(jìn)行圖像分析和處理之前都需要對(duì)圖像進(jìn)行去噪處理。噪聲的模型按照對(duì)圖像的影響可以分為加性噪聲模型和乘性噪聲模型兩大類。假設(shè),f(x,y)為原始圖像,g(x,y)為有噪聲的圖像,n(x,y)為噪聲。
加性噪聲模型為:
g(x,y)=f(x,y)+n(x,y) (1)
乘性噪聲模型為:
g(x,y)=f(x,y)[1+n(x,y)] (2)
空域中去噪方法包括:中值濾波、均值濾波等。中值濾波是基于排序統(tǒng)計(jì)理論的一種能有效抑制噪聲的非線性處理技術(shù)。其核心運(yùn)算是將模板中的數(shù)據(jù)進(jìn)行排序,這樣一個(gè)亮點(diǎn)(暗點(diǎn))的噪聲,就會(huì)在排序過程中被排在數(shù)據(jù)序列的最右側(cè)或最左側(cè),因此,最終選擇的數(shù)據(jù)序列中間位置上的值一般不是噪聲點(diǎn)的值。由此便可以達(dá)到抑制噪聲的目的;均值濾波實(shí)際上就是用該像素對(duì)應(yīng)的模板中各像素值的均值替代該像素的像素值,均值濾波的方法是,對(duì)待處理的當(dāng)前圖像,選擇一個(gè)模板,該模板為其近鄰的若干像素組成,用模板中像素的均值來替代原像素值。
1.2 亮度調(diào)整
由于采集圖像時(shí)的光照強(qiáng)度和相機(jī)自身性能的不同,使得采集到的圖像的亮度有許多不同。而本文的人臉檢測(cè)是基于特征的,特征值與圖像的灰度值有很大關(guān)系。所以即使圖像對(duì)應(yīng)的特征結(jié)構(gòu)相同,但是由于亮度不同,通常會(huì)被分類器認(rèn)為是不同的圖像。所以無論是在訓(xùn)練分類器階段還是在檢測(cè)階段都需要對(duì)圖像進(jìn)行亮度的調(diào)整,需要將不同亮度的圖像調(diào)整到同一范圍。常用的亮度調(diào)整技術(shù)包括:線性動(dòng)態(tài)范圍調(diào)整、非線性動(dòng)態(tài)范圍調(diào)整、直方圖均衡化等。線性動(dòng)態(tài)范圍調(diào)整的方法是其中比較簡單的一種,計(jì)算量也比較小。調(diào)整的計(jì)算公式如下:
1.3 圖像的形狀變換
圖像形狀變換是指用數(shù)學(xué)建模的方法對(duì)圖像形狀發(fā)生的變化進(jìn)行描述的過程。最基本的圖像變換包括圖像的縮小、放大、旋轉(zhuǎn)等。本文中的訓(xùn)練階段和檢測(cè)階段都需要對(duì)圖像進(jìn)行形狀的變換,比如在建立訓(xùn)練樣本庫的時(shí)候?qū)⒉煌叽绲膱D像歸一化到19×19的尺寸。圖像縮小從物理意義上來說,是將描述圖像的物理尺寸縮小相應(yīng)的倍數(shù)。數(shù)字圖像的縮小是通過減少像素個(gè)數(shù)來實(shí)現(xiàn)的,所以就需要根據(jù)所期望縮小的尺寸數(shù)據(jù),從原圖像中選擇合適的像素點(diǎn),使圖像縮小之后可以盡量保持原有的特征不丟失。
圖像放大,從物理含義上來講是指圖像縮小的逆運(yùn)算。但是圖像放大是從小數(shù)據(jù)量到大數(shù)據(jù)量的過程,因此需要對(duì)許多數(shù)據(jù)進(jìn)行估計(jì)。由于圖像相連像素之間的相關(guān)性很強(qiáng),所以可以利用這個(gè)相關(guān)性來實(shí)現(xiàn)圖像的放大。比較好的圖像放大的方法是雙線性插值法,該方法不是將原圖像的像素復(fù)制到子快中,而是只填寫在子快的某一個(gè)像素的位置上。采用雙線性插值的方法可以平緩像素塊之間的過度,有效的抑制了馬賽克現(xiàn)象的產(chǎn)生。本文采用了雙線性插值的方法。
2 基于AdaBoost算法人臉檢測(cè)
2.1 AdaBoost人臉檢測(cè)算法
AdaBcoost是一種基于分類器的算法,其基本思想是利用大量的分類能力較弱的弱分類器通過一定方法疊加起來形成分類能力很強(qiáng)的強(qiáng)分類器。理論證明,只要每個(gè)弱分類器分類能力比隨機(jī)猜測(cè)好,當(dāng)分類器的個(gè)數(shù)趨于無窮時(shí),強(qiáng)分類器的錯(cuò)誤率將趨于零。該算法根據(jù)人臉面部的主要灰度分布特征,選擇采用了Haar特征。Haar特征是一種基于積分圖像的特征,主要用于灰度圖像中,該特征計(jì)算比較簡單,提取速度相對(duì)較快。Adaboost算法首先提取樣本圖像中的Haar特征,然后通過在訓(xùn)練過程中選取出最優(yōu)的Haar特征,再將訓(xùn)練得出的Haar特征轉(zhuǎn)換成弱分類器,最終通過一定的方法將這些弱分類器進(jìn)行組合構(gòu)成強(qiáng)分類器。分類器訓(xùn)練完之后,就可以將其應(yīng)用到圖像中進(jìn)行人臉區(qū)域的檢測(cè)。由于人臉可能在圖像中的不同位置出現(xiàn),所以必須在被檢測(cè)的圖像中移動(dòng)搜索窗口。
對(duì)于一個(gè)訓(xùn)練集(xi,yi),…,(xL,yL),其中xi是輸入的訓(xùn)練樣本,yi是樣本類別標(biāo)志,yi∈(1,0)對(duì)應(yīng)真假樣本。在開始訓(xùn)練前,對(duì)所有訓(xùn)練樣本均賦予一個(gè)初始權(quán)值,然后用AdaBoost學(xué)習(xí)算法對(duì)訓(xùn)練樣本進(jìn)行T輪訓(xùn)練,在每一輪訓(xùn)練結(jié)束后,從若干個(gè)簡單分類器中選擇誤差最小的那個(gè)作為該輪選出的一個(gè)弱分類器hi。選好了弱分類器之后,將所有弱分類器進(jìn)行線性組合就構(gòu)成了強(qiáng)分類器。
訓(xùn)練過程主要包括以下幾個(gè)模塊:
(1)樣本的采集,對(duì)樣本進(jìn)行圖像預(yù)處理,形成樣本集;
(2)以樣本集作為輸入,計(jì)算并獲得矩形特征值集;
(3)對(duì)特征值集進(jìn)行優(yōu)化處理,選出分辨能力好的特征;
(4)采用AdaBoost算法,在每一輪迭代過程中采用窮舉搜索法確定每個(gè)特征對(duì)應(yīng)的簡單分類器的閾值,獲得簡單分類器集,并保存其對(duì)應(yīng)的參數(shù);
(5)選出錯(cuò)誤率最低的簡單分類器作為本輪最優(yōu)的弱分類器;
(6)將訓(xùn)練得到的弱分類器根據(jù)其分類能力賦予不同的權(quán)重,然后線性組合構(gòu)成強(qiáng)分類器。
2.2 AdaBoost檢測(cè)過程
級(jí)聯(lián)分類器應(yīng)用于人臉檢測(cè)是由Viola提出的,這使得人臉檢測(cè)能在很高檢測(cè)率下同時(shí)達(dá)到實(shí)時(shí)的檢測(cè)速度。級(jí)聯(lián)分類器由一系列強(qiáng)分類器的組合而成,圖像依次通過每一個(gè)強(qiáng)分類器,最終通過全部分類器的區(qū)域被檢測(cè)為人臉。每一層的強(qiáng)分類器由AdaBoost算法訓(xùn)練得到,但是組成強(qiáng)分類器的弱分類器個(gè)數(shù)隨著級(jí)數(shù)的增加而增加。通過參數(shù)的調(diào)整可以使前面幾層幾乎讓所有人臉通過,從而拒絕很大一部分非人臉,而后面幾層則對(duì)被前面幾層判斷為人臉的圖像進(jìn)行更加嚴(yán)格的檢測(cè)。由于前面幾層使用的弱分類器數(shù)目比較少,只是有幾個(gè)重要的特征組合而成,而且排除了大量非人臉區(qū)域?yàn)楹罄m(xù)的檢測(cè)減少了檢測(cè)對(duì)象數(shù)目,所以計(jì)算速度比較快。
假定級(jí)聯(lián)分類器由K個(gè)強(qiáng)分類器組成,第i級(jí)強(qiáng)分類器的誤檢率為fi,檢測(cè)率為di,則最終的誤檢率F和檢測(cè)率D分別為:
測(cè)試圖像來自生活中的實(shí)際數(shù)碼照片與從互聯(lián)網(wǎng)上收集的圖像,包括不同人種、不同年齡的正面圖像,人臉檢測(cè)結(jié)果如圖1所示。
3 基于GPRS技術(shù)的窄帶數(shù)據(jù)傳輸
通用無線分組業(yè)務(wù)(General Packet Radio Service,GPRS)作為第2代移動(dòng)通信技術(shù)GSM向第3代移動(dòng)通信(3G)技術(shù)的過渡技術(shù),是由英國BT Cellnet公司早在1993年提出的,是GSMPhase2+(1997)規(guī)范實(shí)現(xiàn)的內(nèi)容之一,是一種基于GSM的移動(dòng)分組數(shù)據(jù)業(yè)務(wù),面向用戶提供移動(dòng)分組的IP或者X.25連接。GPRS是一項(xiàng)高速數(shù)據(jù)處理的科技,它以分組交換技術(shù)為基礎(chǔ),用戶通過GPRS可以在移動(dòng)狀態(tài)下使用各種高速數(shù)據(jù)業(yè)務(wù)。
通過GPRS網(wǎng)絡(luò)建立TCP連接傳輸數(shù)據(jù)和指令有2種方式:
(1)監(jiān)控終端通過GPRS Modem與GSM基站通信,GPRS分組數(shù)據(jù)包從GSM基站發(fā)送到GPRS服務(wù)支持節(jié)點(diǎn)(Serving GSN,SGSN),再由SGSN送到GPRS網(wǎng)關(guān)支持節(jié)點(diǎn)(Gateway GPRS Supporting Node,GGSN),GGSN把收到的包進(jìn)行處理,轉(zhuǎn)換為可在Internet中傳送的格式,最終送給遠(yuǎn)程視頻服務(wù)器端。GGSN在GPRS網(wǎng)絡(luò)和公用數(shù)據(jù)網(wǎng)之間起關(guān)口站的作用,它可以把GSM網(wǎng)中的GPRS分組數(shù)據(jù)包進(jìn)行協(xié)議轉(zhuǎn)換,從而可以把這些分組數(shù)據(jù)包傳送到遠(yuǎn)端的TCP/IP或X.25網(wǎng)絡(luò)。
(2)監(jiān)控終端的GPRS Modem通過GPRS網(wǎng)絡(luò),直接與遠(yuǎn)程視頻服務(wù)器端的GPRS Modem進(jìn)行點(diǎn)對(duì)點(diǎn)通信,然后通過串口把數(shù)據(jù)發(fā)送給視頻服務(wù)器。
整個(gè)智能網(wǎng)絡(luò)視頻監(jiān)控系統(tǒng)分為現(xiàn)場視頻采集、處理模塊和遠(yuǎn)程視頻服務(wù)器2部分,現(xiàn)場視頻采集和處理模塊在上電后自動(dòng)尋找遠(yuǎn)程視頻服務(wù)器,而遠(yuǎn)程視頻服務(wù)器在與現(xiàn)場視頻采集和處理模塊建立TCP連接后,可通過發(fā)送指令來遠(yuǎn)程控制靜態(tài)圖像編碼的傳送。
本文無線視頻監(jiān)控通過無線視頻監(jiān)控終端對(duì)視頻信號(hào)進(jìn)行實(shí)時(shí)采集和壓縮,以壓縮圖片格式(JPEG,JPEG2000等)并通過無線網(wǎng)絡(luò)傳送到遠(yuǎn)程視頻服務(wù)器。實(shí)現(xiàn)發(fā)送實(shí)時(shí)壓縮圖片。視頻服務(wù)器使用套接字通信,應(yīng)用程序采用面向?qū)ο蟮姆椒āR曨l服務(wù)器與監(jiān)控終端之間使用C/S模型。程序中視頻服務(wù)器作為服務(wù)器,監(jiān)控終端作為客戶端。服務(wù)器端軟件主要完成監(jiān)聽客戶端發(fā)送的連接請(qǐng)求;同時(shí)接收來自多個(gè)監(jiān)控終端的壓縮圖像數(shù)據(jù);保存、查看和管理監(jiān)控終端的圖像數(shù)據(jù)。
在監(jiān)控端通過監(jiān)控設(shè)備監(jiān)測(cè),運(yùn)算并獲取人臉圖像數(shù)據(jù),并通過GPRS網(wǎng)絡(luò)通信技術(shù)對(duì)人臉圖像數(shù)據(jù)進(jìn)行無線傳輸,服務(wù)器終端進(jìn)行接收。為了減少傳輸流量負(fù)荷,人臉圖像大小歸一化為19×19,從而保證了每個(gè)攝像頭傳輸占用不超過20 Kb/s的帶寬,使得整個(gè)網(wǎng)絡(luò)保證在一個(gè)可以承受的范圍內(nèi)。
4 基于Gabor和支持向量機(jī)的人臉識(shí)別
4.1 Gabor小波特征提取
Gabor函數(shù)由Dennis Gabor于20世紀(jì)40年代提出的,后來被J Daugman首先用于表征圖像,并用于視覺方面的研究。隨著計(jì)算機(jī)的不斷發(fā)展,成為非常流行的圖像處理方法。二維Gabor濾波器是一種典型帶通濾波器,由于它具有良好的方向選擇性和頻率選擇性,因此Gabor濾波器被廣泛應(yīng)用于圖像分析、圖像理解等計(jì)算機(jī)視覺領(lǐng)域,以獲取圖像信號(hào)的空間頻率(尺度)、空間位置和方向選擇性的局部結(jié)構(gòu)信息。
人臉圖像的Gabor特征由人臉圖像和Gabor濾波器的卷積得到。通常的Gabor特征抽取方法是:設(shè)為人臉樣本圖像的灰度分布,則在選定Gabor慮波器參數(shù)后,對(duì)樣本圖像中抽樣點(diǎn)(x,y)提取的特征由下式表示:
式中:G為Gabor函數(shù)在點(diǎn)(x,y)處的離散值;(a,b)為Gabor濾波器窗口大??;(w,h)為圖像的尺寸大小。這樣得到的圖像在點(diǎn)(x,y)處的40個(gè)Gabor幅值特征對(duì)應(yīng)于以該位置為中心的局部區(qū)域的能量分布,將這40個(gè)幅值特征級(jí)聯(lián)起來構(gòu)成該位置的Gabor特征,通常稱為一個(gè)Jet,位置點(diǎn)(x,y)處的Jet表示為:
Jet(x,y)=(Jet(x,y)vμ) (7)
將所有抽取點(diǎn)提取的Gabor特征構(gòu)成一張人臉樣本的特征矢量:
F1={Jet(x,y)|0≤y≤h} (8)
顯然,對(duì)于一副19×19大小的人臉圖像如果按上述方法逐個(gè)象素抽取Gabor特征,得到的Gabor特征向量F的維數(shù)為19×19×40=14 440,遠(yuǎn)遠(yuǎn)高于原始圖像的維數(shù)19×19=361。如果直接利用這樣的高維Gabor特征矢量進(jìn)行分類器的訓(xùn)練和圖像識(shí)別,將產(chǎn)生通常所講的維數(shù)災(zāi)難。因此必須對(duì)高維Gabor特征矢量進(jìn)行適當(dāng)?shù)慕稻S。
4.2 支持向量機(jī)SVM
支持向量機(jī)(Support Vector Macine,SVM)是一種對(duì)線性分類器的最優(yōu)設(shè)計(jì)方法論。它對(duì)非線性、高維數(shù)的小樣本人臉識(shí)別問題有非常好的分類效果和學(xué)習(xí)推廣能力,是目前模式識(shí)別的常用的分類器。
SVM從線性可分情況下的最優(yōu)分類面發(fā)展而來。設(shè)2類可分樣本集(xi,yi),i=1,2,…,n;,xi∈Rd,yi∈|+1,-1|是類標(biāo)記。通過訓(xùn)練支持向量機(jī)可以找到一組參數(shù)(w,b)以定義樣本空間的一個(gè)超平面wx+b=0,使得同一類的樣本點(diǎn)分布在超平面的同側(cè)。離超平面最近的2類樣本到超平面的距離稱為樣本的分類間隔,當(dāng)分類間隔最大時(shí),就得到最優(yōu)分類超平面。離最優(yōu)分類超平面最近的樣本就是所謂的支持向量。
人臉識(shí)別屬于非線性問題,根據(jù)模式識(shí)別的理論,總可以將低維空間非線性可分得問題映射到高維空間,使其在高位空間線性可分。從而把非線性可分的問題轉(zhuǎn)化為線性可分問題。利用核函數(shù)K(xi,x)可將輸入向量x映射到高位空間進(jìn)行分類,此時(shí)最優(yōu)分類超平面的決策函數(shù)式變?yōu)椋?/p>
常用的核函數(shù)有:線性核函數(shù)K(xi,x)=(xix);多項(xiàng)式核函數(shù)K(xi,x)=[(xix)+1]d;徑向基核函數(shù);Sigmoid核函數(shù)。
對(duì)于多類模式識(shí)別問題,SVM可通過2類問題的組合來實(shí)現(xiàn)。通常有2種策略:“一對(duì)一”策略,即分類的每一步將其中的任意2類模式分開,這樣,對(duì)于N類問題,則需要N(n-1)/2個(gè)支持向量機(jī)分類器;另一種“一對(duì)多”策略,即分類的每一步將其中的一類模式和其它的所有模式分開,這樣,對(duì)于N類問題,則需要N個(gè)與每個(gè)類對(duì)應(yīng)的支持向量機(jī)分類器。本文采用“一對(duì)一”的策略來的人臉進(jìn)行分類識(shí)別。
人臉圖像庫來源于http://www.a(chǎn)i.mit.edu/projects/cbcl。訓(xùn)練集包括6 977個(gè)19×19圖像樣本,2 429張的人臉和4 548張非人臉。本文選用了庫中的1 000幅人臉圖像,2 000幅非人臉圖像。由于MITCBCL數(shù)據(jù)庫中的人臉都是國外的,所以筆者采集了500幅國內(nèi)的人臉圖像,并將其標(biāo)準(zhǔn)化為19×19的尺寸。所以人臉總數(shù)共1 500幅,非人臉圖像總數(shù)共2 000幅。實(shí)驗(yàn)結(jié)果如表1所示。
5 結(jié)語
本文采用AdaBoost算法進(jìn)行人臉的檢測(cè),根據(jù)人臉面部的主要灰度分布特征,選擇采用了Haar特征,通過在訓(xùn)練過程中選取出最優(yōu)的Haar特征,再將Haar特征轉(zhuǎn)換成弱分類器,最終組合構(gòu)成強(qiáng)分類器,應(yīng)用到圖像中進(jìn)行人臉區(qū)域的檢測(cè),得到較準(zhǔn)確的人臉信息。采用GPRS技術(shù)進(jìn)行人臉圖像數(shù)據(jù)的無線傳輸,通過無線視頻監(jiān)控終端對(duì)視頻信號(hào)進(jìn)行實(shí)時(shí)采集,并通過無線網(wǎng)絡(luò)傳送到遠(yuǎn)程視頻服務(wù)器。采用Gabor小波進(jìn)行人臉特征提取,采用SVM進(jìn)行分類,采用“一對(duì)一”的策略來的人臉進(jìn)行分類識(shí)別。
雖然本文從各方面都考慮了算法的有效性,但是在實(shí)際運(yùn)行中還是存在不足的地方,如攝像頭達(dá)到一定數(shù)量時(shí),傳輸速率受到一定影響,如何保證傳輸速率和圖像較少失真問題有待進(jìn)一步研究解決。