當前位置:首頁 > 智能硬件 > 智能硬件
[導讀]摘 要 本文綜述了人臉識別理論的研究現(xiàn)狀,根據(jù)人臉自動識別技術發(fā)展的時間進行了分類,分析和比較各種識別方法優(yōu)缺點,討論了其中的關鍵技術及發(fā)展前景。關鍵詞 人臉識別;特征提取1 人臉識別技術概述近年來,隨

摘 要 本文綜述了人臉識別理論的研究現(xiàn)狀,根據(jù)人臉自動識別技術發(fā)展的時間進行了分類,分析和比較各種識別方法優(yōu)缺點,討論了其中的關鍵技術及發(fā)展前景。

關鍵詞 人臉識別;特征提取

1 人臉識別技術概述

近年來,隨著計算機技術的迅速發(fā)展,人臉自動識別技術得到廣泛研究與開發(fā),人臉識別成為近30年里模式識別和圖像處理中最熱門的研究主題之一。人臉識別的目的是從人臉圖像中抽取人的個性化特征,并以此來識別人的身份。一個簡單的自動人臉識別系統(tǒng),包括以下4個方面的內容:

(1)人臉檢測(Detection):即從各種不同的場景中檢測出人臉的存在并確定其位置。

(2)人臉的規(guī)范化(Normalization):校正人臉在尺度、光照和旋轉等方面的變化。

(3)人臉表征(Face Representation):采取某種方式表示檢測出人臉和數(shù)據(jù)庫中的已知人臉。

(4)人臉識別(Recognition):將待識別的人臉與數(shù)據(jù)庫中的已知人臉比較,得出相關信息。

2 人臉識別算法的框架

人臉識別算法描述屬于典型的模式識別問題,主要有在線匹配和離線學習兩個過程組成,如圖1所示。

圖1 一般人臉識別算法框架

在人臉識別中,特征的分類能力、算法復雜度和可實現(xiàn)性是確定特征提取法需要考慮的因素。所提取特征對最終分類結果有著決定性的影響。分類器所能實現(xiàn)的分辨率上限就是各類特征間最大可區(qū)分度。因此,人臉識別的實現(xiàn)需要綜合考慮特征選擇、特征提取和分類器設計。

3 人臉識別的發(fā)展歷史及分類

人臉識別的研究已經有相當長的歷史,它的發(fā)展大致可以分為四個階段:

第一階段:人類最早的研究工作至少可追朔到二十世紀五十年代在心理學方面的研究和六十年代在工程學方面的研究。

J. S. Bruner于1954年寫下了關于心理學的The perception of people,Bledsoe在1964年就工程學寫了Facial Recognition Project Report,國外有許多學校在研究人臉識別技術[1],其中有從感知和心理學角度探索人類識別人臉機理的,如美國Texas at Dallas大學的Abdi和Tool小組[2、3],由Stirling大學的Bruce教授和Glasgow大學的Burton教授合作領導的小組等[3];也有從視覺機理角度進行研究的,如英國的Graw小組[4、5]和荷蘭Groningen大學的Petkov小組[6]等。

第二階段:關于人臉的機器識別研究開始于二十世紀七十年代。

Allen 和Parke 為代表,主要研究人臉識別所需要的面部特征。研究者用計算機實現(xiàn)了較高質量的人臉灰度圖模型。這一階段工作的特點是識別過程全部依賴于操作人員,不是一種可以完成自動識別的系統(tǒng)。

第三階段:人機交互式識別階段。

Harmon 和Lesk 用幾何特征參數(shù)來表示人臉正面圖像。他們采用多維特征矢量表示人臉面部特征,并設計了基于這一特征表示法的識別系統(tǒng)。Kaya和Kobayashi 則采用了統(tǒng)計識別方法,用歐氏距離來表征人臉特征。但這類方法需要利用操作員的某些先驗知識,仍然擺脫不了人的干預。

第四階段:20世紀90年代以來,隨著高性能計算機的出現(xiàn),人臉識別方法有了重大突破,才進入了真正的機器自動識別階段。在用靜態(tài)圖像或視頻圖像做人臉識別的領域中,國際上形成了以下幾類主要的人臉識別方法:

1)基于幾何特征的人臉識別方法

基于幾何特征的方法是早期的人臉識別方法之一[7]。常采用的幾何特征有人臉的五官如眼睛、鼻子、嘴巴等的局部形狀特征。臉型特征以及五官在臉上分布的幾何特征。提取特征時往往要用到人臉結構的一些先驗知識。識別所采用的幾何特征是以人臉器官的形狀和幾何關系為基礎的特征矢量,本質上是特征矢量之間的匹配,其分量通常包括人臉指定兩點間的歐式距離、曲率、角度等。

基于幾何特征的識別方法比較簡單、容易理解,但沒有形成統(tǒng)一的特征提取標準;從圖像中抽取穩(wěn)定的特征較困難,特別是特征受到遮擋時; 對較大的表情變化或姿態(tài)變化的魯棒性較差。

2)基于相關匹配的方法

基于相關匹配的方法包括模板匹配法和等強度線方法。

①模板匹配法:Poggio和Brunelli[10]專門比較了基于幾何特征的人臉識別方法和基于模板匹配的人臉識別方法,并得出結論:基于幾何特征的人臉識別方法具有識別速度快和內存要求小的優(yōu)點,但在識別率上模板匹配要優(yōu)于基于幾何特征的識別方法。

②等強度線法:等強度線利用灰度圖像的多級灰度值的等強度線作為特征進行兩幅人臉圖像的匹配識別。等強度曲線反映了人臉的凸凹信息。這些等強度線法必須在背景與頭發(fā)均為黑色,表面光照均勻的前提下才能求出符合人臉真實形狀的等強度線。

3)基于子空間方法

常用的線性子空間方法有:本征子空間、區(qū)別子空間、獨立分量子空間等。此外,還有局部特征分析法、因子分析法等。這些方法也分別被擴展到混合線性子空間和非線性子空間。

Turk等[11]采用本征臉(Eigenfaces)方法實現(xiàn)人臉識別。由于每個本征矢量的圖像形式類似于人臉,所以稱本征臉。對原始圖像和重構圖像的差分圖像再次進行K-L變換,得到二階本征空間,又稱二階本征臉[12]。Pentland等[13]提出對于眼、鼻和嘴等特征分別建立一個本征子空間,并聯(lián)合本征臉子空間的方法獲得了好的識別結果。Shan等[14]采用特定人的本征空間法獲得了好于本征臉方法的識別結果。Albert等[15]提出了TPCA(Topological PCA)方法,識別率有所提高。Penev等[16]提出的局部特征分析(LFA Local Feature Analysis)法的識別效果好于本征臉方法。當每個人有多個樣本圖像時,本征空間法沒有考慮樣本類別間的信息,因此,基于線性區(qū)別分析(LDA Linear Discriminant Analysis ),Belhumeur等[17]提出了Fisherfaces方法,獲得了較好的識別結果。Bartlett等[18]采用獨立分量分析(ICA,Independent Component Analysis)的方法識別人臉,獲得了比PCA方法更好的識別效果。

4)基于統(tǒng)計的識別方法

該類方法包括有:KL算法、奇異值分解(SVD)、隱馬爾可夫(HMM)法。

①KL變換:將人臉圖像按行(列)展開所形成的一個高維向量看作是一種隨機向量,因此采用K-L變換獲得其正交K-L基底,對應其中較大特征值基底具有與人臉相似的形狀。國外,在用靜態(tài)圖像或視頻圖像做人臉識別的領域中,比較有影響的有MIT的Media實驗室的Pentland小組,他們主要是用基于KL變換的本征空間的特征提取法,名為“本征臉(Eigenface)[19]。

②隱馬爾可夫模型:劍橋大學的Samaria和Fallside[20]對多個樣本圖像的空間序列訓練出一個HMM模型,它的參數(shù)就是特征值;基于人臉從上到下、從左到右的結構特征;Samatia等[21]首先將1-D HMM和2-D Pseudo HMM用于人臉識別。Kohir等[22]采用低頻DCT系數(shù)作為觀察矢量獲得了好的識別效果,如圖2(a)所示。Eickeler等[23]采用2-D Pseudo HMM識別DCT壓縮的JPEG圖像中的人臉圖像;Nefian等采用嵌入式HMM識別人臉[24],如圖2(b)所示。后來集成coupled HMM和HMM通過對超狀態(tài)和各嵌入狀態(tài)采用不同的模型構成混合系統(tǒng)結構[25]。

基于HMM的人臉識別方法具有以下優(yōu)點:第一,能夠允許人臉有表情變化,較大的頭部轉動;第二,擴容性好。即增加新樣本不需要對所有的樣本進行訓練;第三,較高的識別率。

(a) (b)

圖2 (a) 人臉圖像的1-D HMM (b) 嵌入式隱馬爾科夫模型

5)基于神經網絡的方法

Gutta等[26]提出了混合神經網絡、Lawrence等[27]通過一個多級的SOM實現(xiàn)樣本的聚類,將卷積神經網絡CNN用于人臉識別、Lin等[28]采用基于概率決策的神經網絡方法、Demers等[29]提出采用主元神經網絡方法提取人臉圖像特征,用自相關神經網絡進一步壓縮特征,最后采用一個MLP來實現(xiàn)人臉識別。Er等[30]采用PCA進行維數(shù)壓縮,再用LDA抽取特征,然后基于RBF進行人臉識別。Haddadnia等[31]基于PZMI特征,并采用混合學習算法的RBF神經網絡進行人臉識別。神經網絡的優(yōu)勢是通過學習的過程獲得對這些規(guī)律和規(guī)則的隱性表達,它的適應性較強。

6)彈性圖匹配方法

Lades等提出采用動態(tài)鏈接結構(DLA,Dynamic Link Architecture)[32]的方法識別人臉。它將人臉用格狀的稀疏圖如圖3所示。

圖3 人臉識別的彈性匹配方法

圖3中的節(jié)點用圖像位置的Gabor小波分解得到的特征向量標記,圖的邊用連接節(jié)點的距離向量標記。Wiskott等人使用彈性圖匹配方法,準確率達到97.3%。Wiskott等[33]將人臉特征上的一些點作為基準點,構成彈性圖。采用每個基準點存儲一串具有代表性的特征矢量,減少了系統(tǒng)的存儲量。Wurtz等[34]只使用人臉I(yè)CI部的特征,進一步消除了結構中的冗余信息和背景信息,并使用一個多層的分級結構。Grudin等[35]也采用分級結構的彈性圖,通過去除了一些冗余節(jié)點,形成稀疏的人臉描述結構。另一種方法是,Nastar等[36]提出將人臉圖像I(x,y)表示為可變形的3D網格表(x,y,I(x,y)),將人臉匹配問題轉換為曲面匹配問題,利用有限分析的方法進行曲面變形,根據(jù)兩幅圖像之間變形匹配的程度識別人臉。

7)幾種混合方法的有效性

(1)K-L投影和奇異值分解(SVD)相融合的分類判別方法。

K-L變換的核心過程是計算特征值和特征向量。而圖像的奇異值具有良好的穩(wěn)定性,當圖像有小的擾動時,奇異值的變化不大。奇異值表示了圖像的代數(shù)特征,在某種程度上,SVD特征同時擁有代數(shù)與幾何兩方面的不變性。利用K-L投影后的主分量特征向量與SVD特征向量對人臉進行識別,提高識別的準確性[37]。

(2)HMM和奇異值分解相融合的分類判別方法。

采用奇異值分解方法進行特征提取,一般是把一幅圖像(長為H)看成一個N×M的矩陣,求取其奇異值作為人臉識別的特征。在這里我們采用采樣窗對同一幅圖片進行重疊采樣(如圖4),對采樣所得到的矩陣分別求其對應的前k個最大的奇異值,分別對每一組奇異值進行矢量標準化和矢量重新排序,把這些處理后的奇異值按采樣順序組成一組向量,這組向量是惟一的[38]。

圖4 采樣窗采樣

綜合上述論文中的實驗數(shù)據(jù)表明[39],如表1:

表1 人臉識別算法比較

8)基于三維模型的方法

該類方法一般先在圖像上檢測出與通用模型頂點對應的特征點,然后根據(jù)特征點調節(jié)通用模型,最后通過紋理映射得到特定人臉的3D模型。Tibbalds[40]基于結構光源和立體視覺理論,通過攝像機獲取立體圖像,根據(jù)圖像特征點之間匹配構造人臉的三維表面,如圖5所示。

圖5 三維人臉表面模型 圖6 合成的不同姿態(tài)和光照條件下二維人臉表面模

Zhao[41]提出了一個新的SSFS(Symetric Shape- from-Shading)理論來處理像人臉這類對稱對象的識別問題,基于SSFS理論和一個一般的三維人臉模型來解決光照變化問題,通過基于SFS的視圖合成技術解決人臉姿態(tài)問題,針對不同姿態(tài)和光照條件合成的三維人臉模型如圖6所示。

三維圖像有三種建模方法:基于圖像特征的方法[42、43]、基于幾何[44]、基于模型可變參數(shù)的方法[45]。其中,基于模型可變參數(shù)的方法與基于圖像特征的方法的最大區(qū)別在于:后者在人臉姿態(tài)每變化一次后,需要重新搜索特征點的坐標,而前者只需調整3D 變形模型的參數(shù)。三維重建的系統(tǒng)框圖,如圖7所示。

圖7 三維建模的系統(tǒng)框圖

三維人臉建模、待識別人臉的姿態(tài)估計和識別匹配算法的選取是實現(xiàn)三維人臉識別的關鍵技術。隨著采用三維圖像識別人臉技術的發(fā)展,利用直線的三維圖像信息進行人臉識別已經成為人們研究的重心。

4 總結與展望

人臉自動識別技術已取得了巨大的成就,隨著科技的發(fā)展,在實際應用中仍然面臨困難,不僅要達到準確、快速的檢測并分割出人臉部分,而且要有效的變化補償、特征描述、準確的分類的效果,還需要注重和提高以下幾個方面:

(1) 人臉的局部和整體信息的相互結合能有效地描述人臉的特征,基于混合模型的方法值得進一步深入研究,以便能準確描述復雜的人臉模式分布。

(2) 多特征融合和多分類器融合的方法也是改善識別性能的一個手段。

(3) 由于人臉為非剛體性,人臉之間的相似性以及各種變化因素的影響,準確的人臉識別仍較困難。為了滿足自動人臉識別技術具有實時要求,在必要時需要研究人臉與指紋、虹膜、語音等識別技術的融合方法。

(4) 3D形變模型可以處理多種變化因素,具有很好的發(fā)展前景。已有研究也表明,對各種變化因素采用模擬或補償?shù)姆椒ň哂休^好的效果。三維人臉識別算法的選取還處于探索階段,需要在原有傳統(tǒng)識別算法的基礎上改進和創(chuàng)新。

(5) 表面紋理識別算法是一種最新的算法[52],有待于我們繼續(xù)學習和研究出更好的方法。

總之,人臉識別是極富挑戰(zhàn)性的課題僅僅采用一種現(xiàn)有方法難以取得良好的識別效果,如何與其它技術相結合,如何提高識別率和識別速度、減少計算量、提高魯棒性,如何采用嵌入式及硬件實現(xiàn),如何實用化都是將來值得研究的。

更多計算機與外設信息請關注21ic計算機與外設頻道

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內容真實性等。需要轉載請聯(lián)系該專欄作者,如若文章內容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或將催生出更大的獨角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉型技術解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產業(yè)博覽會開幕式在貴陽舉行,華為董事、質量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經營業(yè)績穩(wěn)中有升 落實提質增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數(shù)字經濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術學會聯(lián)合牽頭組建的NVI技術創(chuàng)新聯(lián)盟在BIRTV2024超高清全產業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術創(chuàng)新聯(lián)...

關鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術
關閉
關閉