基于人臉識(shí)別技術(shù)的智能系統(tǒng)研究與開(kāi)發(fā)

時(shí)間：2012-04-18 13:26:52

關(guān)鍵字：人臉識(shí)別技術(shù) 智能系統(tǒng) 系統(tǒng)研究模板

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]1研究背景生物識(shí)別技術(shù)是目前最為方便與安全的識(shí)別系統(tǒng)。生物識(shí)別是依靠人體的身體特征來(lái)進(jìn)行身份驗(yàn)證的一種解決方案。由于與傳統(tǒng)的生物識(shí)別技術(shù)相比，人臉識(shí)別因具有更為簡(jiǎn)便、準(zhǔn)確、經(jīng)濟(jì)及可擴(kuò)展性良好等眾多優(yōu)勢(shì)而

1研究背景

生物識(shí)別技術(shù)是目前最為方便與安全的識(shí)別系統(tǒng)。生物識(shí)別是依靠人體的身體特征來(lái)進(jìn)行身份驗(yàn)證的一種解決方案。由于與傳統(tǒng)的生物識(shí)別技術(shù)相比，人臉識(shí)別因具有更為簡(jiǎn)便、準(zhǔn)確、經(jīng)濟(jì)及可擴(kuò)展性良好等眾多優(yōu)勢(shì)而普遍為人們所看好，被廣泛應(yīng)用于安全驗(yàn)證、監(jiān)控、控制等各個(gè)方面。但到目前為止，能夠滿足人們需求的理想系統(tǒng)尚未出現(xiàn)[1]。

根據(jù)FERET'97 測(cè)試報(bào)告[2],目前的人臉識(shí)別算法對(duì)于不同的攝像機(jī)、不同的光照條件和年齡變化的適應(yīng)能力非常差。FRVT'2000評(píng)測(cè)[3]結(jié)果表明，人臉識(shí)別系統(tǒng)的性能與FERET'97的測(cè)試相比有了一定的進(jìn)步，但其識(shí)別性能對(duì)各種條件，如光照、老化、距離、姿態(tài)等，仍然離人們的期望值較遠(yuǎn)。

2問(wèn)題的提出

本文僅考慮單人正面靜態(tài)灰度圖像，著重考慮人臉圖像的檢測(cè)和定位，不考慮頭部的俯仰、旋轉(zhuǎn)以及穿戴、遮蔽的情況，而且頭部的傾斜不超過(guò)15°。

本文的研究工作主要是提出了結(jié)合人臉模板和人臉特征進(jìn)行人臉檢測(cè)的方法，對(duì)現(xiàn)有的人臉檢測(cè)與定位的方法提出了改進(jìn)，進(jìn)而提取臉部特征，并在此基礎(chǔ)上實(shí)現(xiàn)了一個(gè)智能識(shí)別系統(tǒng)演示軟件。本文所采用的方法，主要是基于參數(shù)化的橢圓型人臉模板與基于眼睛及嘴巴幾何特征相結(jié)合的人臉定位方法，以及根據(jù)其眼睛、鼻部及嘴部的幾何特征參數(shù)，對(duì)實(shí)驗(yàn)人臉庫(kù)進(jìn)行監(jiān)督下的分類和統(tǒng)計(jì)的人臉識(shí)別方法。所采用的人臉數(shù)據(jù)庫(kù)是BioID人臉庫(kù)。

3基于人臉識(shí)別技術(shù)的智能系統(tǒng)設(shè)計(jì)方案

人臉自動(dòng)識(shí)別系統(tǒng)包括下列主要技術(shù)環(huán)節(jié)[4],首先是人臉檢測(cè)和定位，即從輸入圖像中找到人臉及人臉存在的位置，并將人臉從背景中分割出來(lái)，然后才是對(duì)歸一化的人臉圖像進(jìn)行特征提取與識(shí)別。這兩個(gè)環(huán)節(jié)的研究獨(dú)立性很強(qiáng)。由于在很多特定情況下，人臉檢測(cè)與定位的工作比較簡(jiǎn)單，因此“特征提取與識(shí)別”環(huán)節(jié)得到了更為廣泛和深入的研究；而近幾年來(lái)隨著人們?cè)絹?lái)越關(guān)心各種復(fù)雜情形下的人臉自動(dòng)識(shí)別系統(tǒng)，人臉檢測(cè)與定位才得到了較多的重視。

評(píng)價(jià)一個(gè)人臉自動(dòng)識(shí)別系統(tǒng)的標(biāo)準(zhǔn)，一個(gè)是誤識(shí)率即將某人錯(cuò)識(shí)別為其他人，另一個(gè)是虛警率即將其他人識(shí)別為這個(gè)人。這二者之間是存在矛盾的，所以在實(shí)際問(wèn)題中往往需要進(jìn)行某種折衷。這一點(diǎn)同樣適用于特征提取與識(shí)別環(huán)節(jié)，但是對(duì)于人臉檢測(cè)與定位，我們一般則要求誤識(shí)率要盡可能低，因?yàn)檫@樣才可以保證所要識(shí)別的人不會(huì)在這一步就丟失。

常用的人臉識(shí)別實(shí)驗(yàn)庫(kù)以美國(guó)軍方的FERET 庫(kù)最為權(quán)威。另外如MIT、ORL 等庫(kù)也可以用來(lái)驗(yàn)證算法在某些方面的能力。目前尚沒(méi)有專門(mén)測(cè)試人臉檢測(cè)和定位算法的圖像庫(kù)。

4基于人臉形狀特征的精確定位方法

4.1 人臉特征的檢測(cè)

特征檢測(cè)是人臉識(shí)別智能系統(tǒng)中的關(guān)鍵環(huán)節(jié)，因?yàn)檠劬?、鼻子和嘴巴等特征集中了人臉的人部分信息。?duì)于人臉建模來(lái)說(shuō)，不僅要檢測(cè)出這些特征，而且要準(zhǔn)確地加以定位。

假設(shè)人臉的姿態(tài)比較正，那么人臉上的特征是水平邊緣集中的區(qū)域。我們可以在低分辨率下提取水平邊緣，然后找到人臉區(qū)域內(nèi)富含這些邊緣的連通區(qū)，作為人臉特征的候選區(qū)域。這些區(qū)域的位置和大小并不準(zhǔn)確，因?yàn)檫吘墮z測(cè)本身容易出現(xiàn)位置偏移，連通區(qū)的大小也隨閾值而變化。所以還需要進(jìn)一步修正上面的結(jié)果。對(duì)正面的人臉來(lái)說(shuō)，眼睛、嘴巴等特征和整個(gè)人臉的尺寸之間存在先驗(yàn)的約束關(guān)系，這就是人臉結(jié)構(gòu)的恒常性，因此我們利用這些約束關(guān)系確定特征區(qū)域的大小。

4.2 雙眼和嘴巴的定位

可以充分利用先驗(yàn)知識(shí)，把眼睛和嘴巴表示為分段多項(xiàng)式曲線，然后用變形模板得到準(zhǔn)確的輪廓。眼睛輪廓的模型如圖1所示，由四段二次曲線組成，曲線的參數(shù)有8個(gè)：上半眼的中心（x0,y0）、連接內(nèi)外眼角的直線的傾角θ、上下半眼的高度h1和h2、內(nèi)眼角到上半眼中心的距離wl,外眼角到上半眼中心的距離w2,內(nèi)眼角到下半眼中心的距離w3。

圖1 眼睛輪廓模型

評(píng)價(jià)函數(shù)的選擇是關(guān)鍵。眼睛本身不具有—致的顏色信息，而邊緣信息比較豐富。因此，先對(duì)圖像進(jìn)行邊緣提取，然后作適當(dāng)尺度的閉運(yùn)算，就可以使眼睛內(nèi)部形成單一的高亮度區(qū)。在處理過(guò)的圖像中，眼睛內(nèi)部是高亮度區(qū)，外部是低亮度區(qū)。因此可以定義評(píng)價(jià)函數(shù)如式（1）所示。其中D表示眼睛區(qū)域，表示眼睛輪廓之外的帶狀區(qū)域，表示輪廓之內(nèi)的帶狀區(qū)域。根據(jù)4段曲線表達(dá)式得到的眼睛區(qū)域可以初始化眼睛的輪廓，然后用最陡下降法迭代直至該輪廓收斂。

（1）

嘴巴輪廓的模型如圖2所示。由兩段四次曲線組成，曲線的參數(shù)有7個(gè)：嘴巴的中心（x0,y0）、連接兩嘴角的直線傾角θ、上下半嘴的高度h1和h2、嘴角到嘴巴中心的距離w,以及上下半嘴的四次項(xiàng)系數(shù)q1和q2。

圖2 嘴巴輪廓的模型

嘴巴的評(píng)價(jià)函數(shù)比較容易確定，可以通過(guò)唇色和膚色的分割將嘴巴區(qū)分出來(lái)。評(píng)價(jià)函數(shù)的表達(dá)式如式（2）所示。各符號(hào)的含義與眼睛模型相似。

（2）

5人臉檢測(cè)與定位軟件系統(tǒng)的實(shí)現(xiàn)

5.1 系統(tǒng)工作流程

本系統(tǒng)的工作流程如下：在圖片輸入后，首先進(jìn)行圖象預(yù)處理，再利用橢圓模板匹配初步定位人臉。在對(duì)人臉?lè)较蜻M(jìn)行校正后，再基于外形特征尋找眼睛和嘴巴，并基于相關(guān)性進(jìn)行人臉區(qū)域驗(yàn)證，最后輸出檢測(cè)與定位結(jié)果。

在人臉識(shí)別階段，先對(duì)檢測(cè)定位輸出的圖片進(jìn)行特征提取，再在人工監(jiān)督下進(jìn)行特征值統(tǒng)計(jì)。然后根據(jù)模板參數(shù)與特征統(tǒng)計(jì)值構(gòu)造判據(jù)。對(duì)輸入的待識(shí)別圖象，經(jīng)檢測(cè)、定位并計(jì)算模板參數(shù)和特征值，再由判據(jù)進(jìn)行判別分類后輸出識(shí)別結(jié)果。

5.2 臉部檢測(cè)與定位結(jié)果

經(jīng)邊界檢測(cè)，臉部檢測(cè)與定位的結(jié)果如圖3所示。

圖3 同時(shí)考慮臉型、眼睛和嘴特征時(shí)的臉部定位結(jié)果

5.3 檢測(cè)與識(shí)別結(jié)果

本文利用BioID 人臉庫(kù)中的100幅靜止灰度圖片（BioID_0000.pgm- BioID_0099.pgm）作為素材進(jìn)行了實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果如表1所示。

表1 檢測(cè)與識(shí)別結(jié)果

5.4 結(jié)果分析

在上述3種方法中，參數(shù)橢圓模板結(jié)合眼睛、眉毛和嘴巴特征的定位方法顯示出較好的性能。

在采用基于膚色進(jìn)行圖像分割，進(jìn)而定位人臉的方法時(shí)，由于膚色受環(huán)境光照、背景中近似膚色物體的存在的影響，導(dǎo)致定位結(jié)果較差。在改變閾值大小時(shí)，對(duì)判斷的結(jié)果影響不大，這表明：第一，膚色與背景色混雜，以及強(qiáng)烈的光照的影響，是造成誤判的主要因素；第二，在一種上述問(wèn)題不太嚴(yán)重的比較“理想”的狀態(tài)下，膚色模型也的確能有效地發(fā)揮作用，以抵消來(lái)自于外形姿態(tài)等方面的影響。對(duì)膚色模型的改進(jìn)應(yīng)該集中在對(duì)于光照的處理和與背景的分離上，利用模板進(jìn)行檢測(cè)與定位即是有效分離背景干擾的一種方法。

在單純采用橢圓模板進(jìn)行檢測(cè)與定位時(shí)，檢測(cè)的正確率得到了一定的提高，但總的來(lái)說(shuō)還是很難令人滿意的。在通過(guò)改變橢圓的參數(shù)試驗(yàn)其性能時(shí)，其對(duì)參數(shù)變化的適應(yīng)性把高。經(jīng)分析，可以認(rèn)為是復(fù)雜的背景直接影響了橢圓模板的有效性。而對(duì)參數(shù)變化的適應(yīng)性差，主要是因?yàn)閳D像庫(kù)中的人臉外形多為長(zhǎng)橢圓形，表現(xiàn)在參數(shù)上差別不大。因而，僅僅通過(guò)橢圓模板進(jìn)行人臉的檢測(cè)與定位，其效果是難以令人滿意的。

在參數(shù)橢圓模板的基礎(chǔ)上，加入對(duì)眼睛、眉毛和嘴巴特征的參數(shù)描述，進(jìn)而利用改進(jìn)的模板進(jìn)行檢測(cè)與定位，取得了較好的結(jié)果。并且，在通過(guò)調(diào)節(jié)參數(shù)區(qū)分目標(biāo)人物時(shí)，也有較好的表現(xiàn)。經(jīng)分析，檢測(cè)與定位成功率的提高得益于對(duì)臉部器官外形參數(shù)的有效地描述，使其過(guò)濾了大多數(shù)的背景中的干擾，取得了較好的效果。在調(diào)節(jié)面部器官的外形參數(shù)時(shí)，模型取得了較好的區(qū)分效果，這可以認(rèn)為是各目標(biāo)人物的個(gè)人特征的真實(shí)反應(yīng)。其中仍然存在的問(wèn)題是，在人臉傾斜，或有眼鏡、大片頭發(fā)遮蓋等情況發(fā)生時(shí)，將對(duì)檢測(cè)與定位的效果產(chǎn)生嚴(yán)重的影響。

6 結(jié)論

人臉檢測(cè)與識(shí)別研究的趨勢(shì)是利用多種線索（頭發(fā)、膚色、器官、輪廓、模板等），綜合多種分類方法（混合高斯模型、概率模型、神經(jīng)網(wǎng)與支持向量機(jī)等），啟發(fā)式信息與統(tǒng)計(jì)學(xué)習(xí)方法相結(jié)合?？傊捎谌四槍?duì)象的非剛體性，以及姿態(tài)、光照、遮擋等各種變化因素的影響和實(shí)時(shí)性要求，高性能的人臉檢測(cè)仍是一個(gè)困難的問(wèn)題。

7本文作者創(chuàng)新點(diǎn)：

1采用基于參數(shù)化的橢圓型人臉模板與基于眼睛及嘴巴幾何特征相結(jié)合的人臉定位方法，根據(jù)其眼睛、鼻部及嘴部的幾何特征參數(shù)，對(duì)實(shí)驗(yàn)人臉庫(kù)進(jìn)行監(jiān)督下的分類。

2提出了結(jié)合人臉模板和人臉特征進(jìn)行人臉檢測(cè)的方法，并對(duì)現(xiàn)有的人臉檢測(cè)與定位的方法提出了改進(jìn)，進(jìn)而提取臉部特征，并在此基礎(chǔ)上實(shí)現(xiàn)了一個(gè)智能識(shí)別系統(tǒng)，經(jīng)檢驗(yàn)，模型取得了較好的區(qū)分效果。

3.本項(xiàng)目為作者所在學(xué)院智能機(jī)器人研究課題之子課題，該課題目前已初步實(shí)用化，產(chǎn)生經(jīng)濟(jì)效益累計(jì)達(dá)110萬(wàn)元。本項(xiàng)目實(shí)驗(yàn)數(shù)據(jù)，如FERET'97及FRVT 2000,以及BioID人臉庫(kù)等，均為互聯(lián)網(wǎng)上公開(kāi)資料，所采用的研究方法為實(shí)驗(yàn)法。

參考文獻(xiàn)

[1] 梁路宏，艾海舟。人臉檢測(cè)研究綜述[J].計(jì)算機(jī)學(xué)報(bào)，Vol.25,No.5

[2] P. Jonathon Phillips, Alvin Martin C.L. Wilson, Mark Przybocki. An Introduction to Evaluating Biometric Systems.IEEE 2000

[3] DoD Counterdrug Technology Development Program Office. FRVT 2000 Evaluation Report. Feb. 16 2001

[4] 陳莉，劉智明，周激流。一種基于顏色和幾何特征的人臉檢測(cè)方法[J].計(jì)算機(jī)工程與應(yīng)用，2003.27

[5] 邢藏菊，曲延鋒，王守覺(jué)。靜態(tài)灰度圖像中的人臉快速檢測(cè)[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào)。Vol.14,No.5,2002

[6] Kwok-Wai Wong,Kin-Man Lam,Wan-Chi Siu.An efficient algorithm for human face detection and facial feature extraction under different conditions.Pattern Recognition 34 （2001）

[7] 馮素玲。人臉識(shí)別常用方法研究[J].微計(jì)算機(jī)信息，2004,05: 45-47