當前位置:首頁 > 嵌入式 > 嵌入式教程
[導(dǎo)讀]基于PCA算法的人臉識別研究

1 人臉識別的發(fā)展及現(xiàn)狀
    人臉識別的研究已經(jīng)有很長的歷史,在19世紀,法國人Galton就曾對此問題進行了研究,他用一組數(shù)字代表不同的人臉側(cè)面特征來實現(xiàn)對人臉側(cè)面圖像的識別。國內(nèi)外對于人臉識別的研究發(fā)展,分別經(jīng)歷了三個階段:傳統(tǒng)的人機交互式階段、機器自動識別初級階段、機器自動識別高級階段。
1.1 傳統(tǒng)的人機交互式階段
    第一階段是以Bertilion為代表,主要研究人臉識別所需要的面部特征,該階段的識別依賴于人的操作。這些人臉識別方法都需要利用操作員的某些先驗知識,仍然擺脫不了人的干預(yù)。
1.2 自動識別初級階段
    第二階段主要是采用機器自動識別的手段進行識別,20世紀90年代以來,隨著高速度高性能計算機的出現(xiàn),人臉識別方法有了重大突破,進入了真正的機器自動識別階段,人臉識別研究也得到了前所未有的重視。
1.3 機器自動識別高級階段
    第三階段是真正利用機器進行對人臉的自動識別,隨著計算機的大型化、高速化和人臉識別的方法的發(fā)展,提出了許多人臉自動識別的系統(tǒng)。


2 PCA算法的原理
    PCA(主成分分析)算法是人臉識別中比較新的一種算法,該算法的優(yōu)點是識別率高,識別速度快。
2.1 PCA算法介紹
2.1.1 PCA原理
    令x為表示環(huán)境的m維隨機向量。假設(shè)x均值為零,即:
    E[x]=O.
    令w表示為m維單位向量,x在其上投影。這個投影被定義為向量x和w的內(nèi)積,表示為:

而主成分分析的目的就是尋找一個權(quán)值向量w使得表達式E[y2]的值最大化:

根據(jù)線性代數(shù)的理論,可以知道滿足式子值最大化的訓(xùn)應(yīng)該滿足下式:

即使得上述式子最大化的w是矩陣Cx的最大特征值所對應(yīng)的特征向量。
2.1.2 主成分的求解步驟
    在PCA中主要的是要求出使得方差最大的轉(zhuǎn)化方向,其具體的求解步驟如下:
    (1)構(gòu)建關(guān)聯(lián)矩陣:Cx=E[x*xT],Cx∈Pn*n.
    在實際應(yīng)用中,由于原始數(shù)據(jù)的數(shù)學(xué)期望不容易求解,我們可以利用下式來近似構(gòu)造關(guān)聯(lián)矩陣:

(其中x1,x2,…,xN,是各個原始灰度圖像所有象素點對應(yīng)的向量,N是原始圖像的個數(shù))
    (2)先計算出Cx的各個特征值
    (3)把特征值按大小排序

(4)計算出前m個特征值對應(yīng)正交的特征向量構(gòu)成w。
    (5)將原始數(shù)據(jù)在特征向量w上進行投影,即可獲得原始圖像的主特征數(shù)據(jù)。[!--empirenews.page--]
2.1.3 主成分的求解方法
    通過上面的分析我們可以知道,對于主成分分析的問題最后轉(zhuǎn)化為求解協(xié)方差矩陣的特征值和特征向量的問題,主成分的正交化分解的算法或求XXT特征值問題的算法常用的有雅可比方法和NIPALS方法。
2.2 Eigenface算法
    在利用PCA進行特征提取的算法中,特征臉方法(Eigenface)是其中的一個經(jīng)典算法。特征臉方法是從主成分分析導(dǎo)出的一種人臉識別和描述技術(shù)。特征臉方法就是將包含人臉的圖像區(qū)域看作是一種隨機向量,因此可以采用K-L變換獲得其正交K-L基底。對應(yīng)其中較大特征值的基底具有與人臉相似的形狀,因此又稱為特征臉。利用這些基底的線性組合可以描述、表達和逼近人臉圖像,因此可以進行人臉識別與合成。識別過程就是將人臉圖像映射到由特征臉構(gòu)成的子空間上,比較其與己知人臉在特征空間中的位置,具體步驟如下:
    (1)初始化,獲得人臉圖像的訓(xùn)練集并計算特征臉,定義為人臉空間,存儲在模板庫中,以便系統(tǒng)進行識別;
    (2)輸入新的人臉圖像,將其映射到特征臉空間,得到一組關(guān)于該人臉的特征數(shù)據(jù);
    (3)通過檢查圖像與人臉空間的距離判斷它是否是人臉;
    (4)若為人臉,根據(jù)權(quán)值模式判斷它是否為數(shù)據(jù)庫中的某個人,并做出具體的操作。
2.2.1 計算特征臉
    設(shè)人臉圖像I(x,y)為二維N*N灰度圖像,用N維向量R表示。人臉圖像訓(xùn)練集為{Ri|i=1,…,M},其中M為訓(xùn)練集中圖像總數(shù),這M幅圖像的平均向量為:

每個人臉Ri與平均人臉ψ的差值向量是:

訓(xùn)練圖像的協(xié)方差矩陣可表示為:

 C=AAT.

    其中,A=[φ1,…φM].
    特征臉有協(xié)方差矩陣C的正交特征向量組成。對于N*N人臉圖像,協(xié)方差矩陣C的大小為N2*N2,對它求解特征值和特征向量是很困難的。一種取而代之的方法是令L=ATA.
    即協(xié)方差矩陣的轉(zhuǎn)置陣,則可以知道此矩陣是M*M(M是訓(xùn)練人臉的數(shù)量)的一個較小的矩陣。首先計算M*M矩陣L的特征向量vi(l=l,…,M),則矩陣C的特征向量ui(l=1,…,M)由差值圖像φi(i=1,…,M)與vi(l=l,…,M)線性組合得到:U=[u1,…,uM]=[[ψ1,…,ψM]T][v1.…,vM]。實際上,m(m<M)個特征值足夠用于人臉識別。因此,僅取L的前m個最大特征值的特征向量計算特征臉。


3 PCA算法在人臉識別中的應(yīng)用
    基于特征臉的人臉識別過程由訓(xùn)練階段和識別階段兩個階段組成。在訓(xùn)練階段,每個已知人臉Ri映射到由特征臉構(gòu)成的子空間上,得到m維向量

  在識別階段,首先把待識別的圖像R映射到特征臉空間。得到向量:

[!--empirenews.page--]

為了區(qū)分人臉和非人臉,還需計算原始圖像R與其由特征空間重建的圖像Rf之間的距離ε:

 采用最小距離法對人臉進行分類,分類規(guī)則如下:
    (1)若ε≥θc,則輸入圖像不是人臉圖像;
    (2)若則輸入圖像包含未知人臉;
    (3)若則輸入圖像為庫中第k個人的人臉。


4 實驗結(jié)果
    實驗在兩個圖庫上測試,首先是一個ORL人臉庫,該庫包含40個不同人物,每人有l(wèi)O張圖片,共400幅。用訓(xùn)練樣本進行測試,識別率為95%。一個是自建人臉庫,該庫包含20個不同人物,每人有5張不同表情和姿態(tài)下的圖片,總共100幅。隨著訓(xùn)練樣本的增加,識別率會有所提升,但是并不是越多越好,當超過一定的訓(xùn)練樣本數(shù)目時,識別率反而有所下降。


5 人臉識別未來的發(fā)展
    人臉識別是一個跨學(xué)科富挑戰(zhàn)性的前沿課題,人臉圖像中姿態(tài)、光照、表情、飾物、背景、時間跨度等因素的變化對人臉識別算法的魯棒性都有著負面的影響,單一的PCA方法識別率不高,今后的發(fā)展方向可以與其他方法(如:支持向量機、小波變化等)相結(jié)合來彌補單一方法的不足,讓身份識別更準確。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉