基于本征空間的多姿態(tài)人臉識別方法

時間：2009-04-21 01:59:19

關(guān)鍵字：人臉識別方法 BSP PC 歐氏距離

手機看文章

掃描二維碼
隨時隨地手機看文章

[導讀]基于本征空間的多姿態(tài)人臉識別方法

O 引言
    人類利用生物特征識別的歷史可追溯到古代埃及人通過測量人體各部位的尺寸來進行身份鑒別，現(xiàn)代生物識別技術(shù)始于上世紀70年代中期，目前已經(jīng)成為發(fā)達國家普遍重視并大力發(fā)展的關(guān)鍵技術(shù)和產(chǎn)業(yè)。在生物認證方面，人臉識別具有特定的優(yōu)勢。相比其他生物認證技術(shù)，如指紋識別，有一部分人是沒有指紋的，或者指紋無法錄入，僅靠指紋識別就會出現(xiàn)障礙；如虹膜識別，有些眼睛有障礙的人也是無法使用的；還有聲音識別，對于發(fā)音有障礙或者無法說話的人群來說，這是毫無意義的。正是基于人臉的人人具備這一先天優(yōu)勢，近年來，作為生物特征認證的重要分支——人臉及器官的檢測、定位和識別技術(shù)開始受到廣泛重視。
    多姿態(tài)人臉識別是目前人臉識別中的難點，識別率普遍不是很高。國內(nèi)外許多學者已對多姿態(tài)人臉識別進行了深入研究，提出了許多姿態(tài)判定和識別算法。
    在多姿態(tài)人臉數(shù)據(jù)庫構(gòu)建的基礎上，利用PCA對不同姿態(tài)的人臉分別建立特征空間，待識別人臉圖像向相應的特征空間投影，進而利用歐氏距離進行分類識別，獲得了較高的多姿態(tài)人臉圖像識別率。

1 基于本征空間的多姿態(tài)人臉識別方法
    Sirovich和Kirby首先使用PCA方法對人臉圖像進行降維處理并實現(xiàn)了人臉圖像的重建，隨后，1991年，Turk和Pentland首先利用 PCA方法實現(xiàn)了人臉識別(稱為本征臉方法)。此后，基于本征空間的許多人臉識別方法被提出來，PCA人臉識別方法也到了進一步的發(fā)展。
1．1 利用本征臉建立多姿態(tài)人臉特征空間的步驟
    (1)從已知的人臉圖像中按姿態(tài)選擇訓練圖像M張，每人可以選同姿態(tài)的一張或多張照片(表情和光照有所變化)。
    (2)計算M×M的矩陣的特征值和特征向量，選擇M’個主成份分量。
    (3)計算得到該姿態(tài)的特征臉空間μ。
    (4)重復步驟(1)～(3)得到各個姿態(tài)的特征臉空間。
1．2 歐氏距離分類器的設計
    采用歐式距離分類器，對未知人臉圖像和特征空間各類別對應的特征空間向量之間的歐式距離進行計算，未知人臉圖像與哪一類別的距離最近就把其歸入該類。假設待分人臉圖像共有c類，分別為叫，w1，w2，…，wc，每類都有一個對應的特征空間向量，則共有c個特征空間向量，記作T1，T2，…，Tc。
    未知人臉圖像的特征向量x和wi類的特征空間向量Ti之間的歐氏距離為：

未知人臉圖像的特征向量x對已訓練的c類人臉圖像的特征空間向量分別求距離后，得到一個距離集d1，d2，…，dc，對所有的i≠j，如果di(x)<dj(x)，即di(x)是距離集d1，d2，…，dc中最小的值，則將x歸入第wi類。
1．3 識別步驟
    得到多姿態(tài)人臉特征空間后，就可以采用歐氏距離分類器對待識別圖像進行識別。識別步驟如下：
    (1)將已知姿態(tài)的訓練人臉圖像投影到相應姿態(tài)的本征臉空間(計算本征向量μl和相應M類訓練圖像的內(nèi)積)，得到M個人臉圖像的分類權(quán)重ΩTM=[Ω1，Ω2，…，ΩM]；
    (2)將待識別的屬于該姿態(tài)的人臉圖像(X)投影到對應姿態(tài)的本征臉空間，得到權(quán)重向量Ω；

(3)計算待識別圖像權(quán)重向量和每一類圖像的分類權(quán)重的差值ε；

(4)如果εk小于固定的門限θe1，則待識別圖像屬于Ωk類。
上述步驟(2)可以按下面方法判斷待識別圖像是否為人臉圖像：
(1)計算待識別圖像和臉空間的距離ψ：

(2)如果ψ小于門限θe2，則認為待識別圖像近似為人臉空間，否則，則認為待識別圖像不是人臉圖像。
    根據(jù)ε和ψ，待識別圖像可能存在4種情況：
    ①近似為人臉空間并且屬于已知的某一類別；
    ②近似為人臉空間但不屬于已知的某一類別；
    ③不像人臉空間但屬于已知的某一類別；
    ④不像人臉空間也不屬于已知的某一類別。
    對于第一種情況，輸入待識別圖像可以被識別出來；第二種情況說明待識別人臉圖像是一副新圖像；后面兩種情況說明輸入圖像不是人臉圖像，放棄處理。

[!--empirenews.page--]
2 實驗
    這里的訓練原始圖像取自ORL人臉數(shù)據(jù)庫。從建立的ORL人臉數(shù)據(jù)庫中，按類別分別選擇編號為R，L，U，D，F(xiàn)(分別對應右、左、上、下、正面等五種姿態(tài))的人臉圖像各一幅進行訓練，共產(chǎn)生5個本征臉空間Ω1，Ω2，Ω3，Ω4，Ω5。
    判定待識別人臉圖像的姿態(tài)，根據(jù)判定結(jié)果選擇投影的本征臉空間。如果是從文獻已建立的ORL人臉數(shù)據(jù)庫中選擇測試圖像，則直接讀取其姿態(tài)編號即可，不需要再次進行姿態(tài)判定。
    把待識別圖像向訓練過程產(chǎn)生的特征空間投影，根據(jù)投影距離判斷是否包含人臉，如無人臉，則退出識別過程，操作結(jié)束。
    對待識別的人臉圖像進行預處理，并向訓練過程產(chǎn)生的特征空間投影，得到的權(quán)重向量如圖1所示。

投影結(jié)果利用歐式距離進行分類，如圖2所示。由圖2可以看出，靠近紅線最近的點是ω3類(圖中雙圈的位置)。因此，認為待識別人臉圖像屬于第3個人。

對無法歸入當前任一類別的人臉圖像，保存到人臉庫，增加一個新的類別，重新進行訓練樣本的選擇，獲取新的訓練結(jié)果，以備下次識別使用。
    實驗一：從這里建立的ORL人臉圖像庫中隨機選擇40人(每類1人)的圖像進行訓練，得到本征臉空間。
    實驗二：從這里建立的0RL人臉圖像庫中按類別分別選擇編號為R，L，U，D，F(xiàn)的人臉圖像各一幅進行訓練，得到5個本征臉空間。任意選擇其他人臉圖像進行識別。
    兩個實驗均采用歐式距離分類器進行分類。
    實驗結(jié)果如表1所示。

從表1可以看出，改進后的人臉識別實驗，識別率有了明顯的提高，說明在樣本姿態(tài)多樣化的情況下，這種按姿態(tài)分別進行訓練的方法是切實有效的。

3 結(jié) 語
實驗中發(fā)現(xiàn)該方法也存在一個需要進一步改進的問題，即如果測試樣本均為正面人臉圖像，而待識別人臉圖像出現(xiàn)姿態(tài)變化，則識別效果很不理想。如何根據(jù)正面人臉圖像構(gòu)建相應樣本的多姿態(tài)圖像是下一步的工作。