基于本征空間的多姿態(tài)人臉識(shí)別方法
O 引 言
人類利用生物特征識(shí)別的歷史可追溯到古代埃及人通過(guò)測(cè)量人體各部位的尺寸來(lái)進(jìn)行身份鑒別,現(xiàn)代生物識(shí)別技術(shù)始于上世紀(jì)70年代中期,目前已經(jīng)成為發(fā)達(dá)國(guó)家普遍重視并大力發(fā)展的關(guān)鍵技術(shù)和產(chǎn)業(yè)。在生物認(rèn)證方面,人臉識(shí)別具有特定的優(yōu)勢(shì)。相比其他生物認(rèn)證技術(shù),如指紋識(shí)別,有一部分人是沒(méi)有指紋的,或者指紋無(wú)法錄入,僅靠指紋識(shí)別就會(huì)出現(xiàn)障礙;如虹膜識(shí)別,有些眼睛有障礙的人也是無(wú)法使用的;還有聲音識(shí)別,對(duì)于發(fā)音有障礙或者無(wú)法說(shuō)話的人群來(lái)說(shuō),這是毫無(wú)意義的。正是基于人臉的人人具備這一先天優(yōu)勢(shì),近年來(lái),作為生物特征認(rèn)證的重要分支——人臉及器官的檢測(cè)、定位和識(shí)別技術(shù)開(kāi)始受到廣泛重視。
多姿態(tài)人臉識(shí)別是目前人臉識(shí)別中的難點(diǎn),識(shí)別率普遍不是很高。國(guó)內(nèi)外許多學(xué)者已對(duì)多姿態(tài)人臉識(shí)別進(jìn)行了深入研究,提出了許多姿態(tài)判定和識(shí)別算法。
在多姿態(tài)人臉數(shù)據(jù)庫(kù)構(gòu)建的基礎(chǔ)上,利用PCA對(duì)不同姿態(tài)的人臉?lè)謩e建立特征空間,待識(shí)別人臉圖像向相應(yīng)的特征空間投影,進(jìn)而利用歐氏距離進(jìn)行分類識(shí)別,獲得了較高的多姿態(tài)人臉圖像識(shí)別率。
1 基于本征空間的多姿態(tài)人臉識(shí)別方法
Sirovich和Kirby首先使用PCA方法對(duì)人臉圖像進(jìn)行降維處理并實(shí)現(xiàn)了人臉圖像的重建,隨后,1991年,Turk和Pentland首先利用 PCA方法實(shí)現(xiàn)了人臉識(shí)別(稱為本征臉?lè)椒?。此后,基于本征空間的許多人臉識(shí)別方法被提出來(lái),PCA人臉識(shí)別方法也到了進(jìn)一步的發(fā)展。
1.1 利用本征臉建立多姿態(tài)人臉特征空間的步驟
(1)從已知的人臉圖像中按姿態(tài)選擇訓(xùn)練圖像M張,每人可以選同姿態(tài)的一張或多張照片(表情和光照有所變化)。
(2)計(jì)算M×M的矩陣的特征值和特征向量,選擇M’個(gè)主成份分量。
(3)計(jì)算得到該姿態(tài)的特征臉空間μ。
(4)重復(fù)步驟(1)~(3)得到各個(gè)姿態(tài)的特征臉空間。
1.2 歐氏距離分類器的設(shè)計(jì)
采用歐式距離分類器,對(duì)未知人臉圖像和特征空間各類別對(duì)應(yīng)的特征空間向量之間的歐式距離進(jìn)行計(jì)算,未知人臉圖像與哪一類別的距離最近就把其歸入該類。假設(shè)待分人臉圖像共有c類,分別為叫,w1,w2,…,wc,每類都有一個(gè)對(duì)應(yīng)的特征空間向量,則共有c個(gè)特征空間向量,記作T1,T2,…,Tc。
未知人臉圖像的特征向量x和wi類的特征空間向量Ti之間的歐氏距離為:
未知人臉圖像的特征向量x對(duì)已訓(xùn)練的c類人臉圖像的特征空間向量分別求距離后,得到一個(gè)距離集d1,d2,…,dc,對(duì)所有的i≠j,如果di(x)<dj(x),即di(x)是距離集d1,d2,…,dc中最小的值,則將x歸入第wi類。
1.3 識(shí)別步驟
得到多姿態(tài)人臉特征空間后,就可以采用歐氏距離分類器對(duì)待識(shí)別圖像進(jìn)行識(shí)別。識(shí)別步驟如下:
(1)將已知姿態(tài)的訓(xùn)練人臉圖像投影到相應(yīng)姿態(tài)的本征臉空間(計(jì)算本征向量μl和相應(yīng)M類訓(xùn)練圖像的內(nèi)積),得到M個(gè)人臉圖像的分類權(quán)重ΩTM=[Ω1,Ω2,…,ΩM];
(2)將待識(shí)別的屬于該姿態(tài)的人臉圖像(X)投影到對(duì)應(yīng)姿態(tài)的本征臉空間,得到權(quán)重向量Ω;
(3)計(jì)算待識(shí)別圖像權(quán)重向量和每一類圖像的分類權(quán)重的差值ε;
(4)如果εk小于固定的門限θe1,則待識(shí)別圖像屬于Ωk類。
上述步驟(2)可以按下面方法判斷待識(shí)別圖像是否為人臉圖像:
(1)計(jì)算待識(shí)別圖像和臉空間的距離ψ:
(2)如果ψ小于門限θe2,則認(rèn)為待識(shí)別圖像近似為人臉空間,否則,則認(rèn)為待識(shí)別圖像不是人臉圖像。
根據(jù)ε和ψ,待識(shí)別圖像可能存在4種情況:
①近似為人臉空間并且屬于已知的某一類別;
②近似為人臉空間但不屬于已知的某一類別;
③不像人臉空間但屬于已知的某一類別;
④不像人臉空間也不屬于已知的某一類別。
對(duì)于第一種情況,輸入待識(shí)別圖像可以被識(shí)別出來(lái);第二種情況說(shuō)明待識(shí)別人臉圖像是一副新圖像;后面兩種情況說(shuō)明輸入圖像不是人臉圖像,放棄處理。
[!--empirenews.page--]
2 實(shí) 驗(yàn)
這里的訓(xùn)練原始圖像取自O(shè)RL人臉數(shù)據(jù)庫(kù)。從建立的ORL人臉數(shù)據(jù)庫(kù)中,按類別分別選擇編號(hào)為R,L,U,D,F(xiàn)(分別對(duì)應(yīng)右、左、上、下、正面等五種姿態(tài))的人臉圖像各一幅進(jìn)行訓(xùn)練,共產(chǎn)生5個(gè)本征臉空間Ω1,Ω2,Ω3,Ω4,Ω5。
判定待識(shí)別人臉圖像的姿態(tài),根據(jù)判定結(jié)果選擇投影的本征臉空間。如果是從文獻(xiàn)已建立的ORL人臉數(shù)據(jù)庫(kù)中選擇測(cè)試圖像,則直接讀取其姿態(tài)編號(hào)即可,不需要再次進(jìn)行姿態(tài)判定。
把待識(shí)別圖像向訓(xùn)練過(guò)程產(chǎn)生的特征空間投影,根據(jù)投影距離判斷是否包含人臉,如無(wú)人臉,則退出識(shí)別過(guò)程,操作結(jié)束。
對(duì)待識(shí)別的人臉圖像進(jìn)行預(yù)處理,并向訓(xùn)練過(guò)程產(chǎn)生的特征空間投影,得到的權(quán)重向量如圖1所示。
投影結(jié)果利用歐式距離進(jìn)行分類,如圖2所示。由圖2可以看出,靠近紅線最近的點(diǎn)是ω3類(圖中雙圈的位置)。因此,認(rèn)為待識(shí)別人臉圖像屬于第3個(gè)人。
對(duì)無(wú)法歸入當(dāng)前任一類別的人臉圖像,保存到人臉庫(kù),增加一個(gè)新的類別,重新進(jìn)行訓(xùn)練樣本的選擇,獲取新的訓(xùn)練結(jié)果,以備下次識(shí)別使用。
實(shí)驗(yàn)一:從這里建立的ORL人臉圖像庫(kù)中隨機(jī)選擇40人(每類1人)的圖像進(jìn)行訓(xùn)練,得到本征臉空間。
實(shí)驗(yàn)二:從這里建立的0RL人臉圖像庫(kù)中按類別分別選擇編號(hào)為R,L,U,D,F(xiàn)的人臉圖像各一幅進(jìn)行訓(xùn)練,得到5個(gè)本征臉空間。任意選擇其他人臉圖像進(jìn)行識(shí)別。
兩個(gè)實(shí)驗(yàn)均采用歐式距離分類器進(jìn)行分類。
實(shí)驗(yàn)結(jié)果如表1所示。
從表1可以看出,改進(jìn)后的人臉識(shí)別實(shí)驗(yàn),識(shí)別率有了明顯的提高,說(shuō)明在樣本姿態(tài)多樣化的情況下,這種按姿態(tài)分別進(jìn)行訓(xùn)練的方法是切實(shí)有效的。
3 結(jié) 語(yǔ)
實(shí)驗(yàn)中發(fā)現(xiàn)該方法也存在一個(gè)需要進(jìn)一步改進(jìn)的問(wèn)題,即如果測(cè)試樣本均為正面人臉圖像,而待識(shí)別人臉圖像出現(xiàn)姿態(tài)變化,則識(shí)別效果很不理想。如何根據(jù)正面人臉圖像構(gòu)建相應(yīng)樣本的多姿態(tài)圖像是下一步的工作。