當(dāng)前位置:首頁 > 工業(yè)控制 > 工業(yè)控制
[導(dǎo)讀]前有許多正面人臉的識(shí)別方法,當(dāng)有充分?jǐn)?shù)量的訓(xùn)練樣本時(shí),能取得較好的識(shí)別效果,然而當(dāng)處理單樣本人臉識(shí)別問題時(shí),效果則明顯下降。針對這種情況,提出了基于鏡像奇異值分解的單樣本人臉識(shí)別方法,通過采用鏡像的方法增加訓(xùn)練樣本信息。實(shí)驗(yàn)表明,在對人臉圖像進(jìn)行識(shí)別時(shí)取得了較好的效果,并且在一定程度上克服了單樣本條件下姿態(tài)變化對識(shí)別效果的影響。

自20世紀(jì)90年代以來,人臉識(shí)別技術(shù)已成為計(jì)算機(jī)視覺、模式識(shí)別和信息技術(shù)等領(lǐng)域研究的熱點(diǎn)課題之一,并且在此基礎(chǔ)上提出了主成分分析PCA(Principal Component Analysis)[1,2]、二維主成分分析2DPCA(Two-Dimensional Principal Component Analysis)[3]、雙方向的二維主成分分析[4]和線性鑒別分析LDA(Linear Discriminant Analysis)[5]等有效的識(shí)別方法。但是,現(xiàn)有的正面人臉圖像的識(shí)別方法,僅當(dāng)有充分?jǐn)?shù)量的有代表性的人臉圖像樣本時(shí)才能取得較好的識(shí)別效果。然而在一些特殊場合,如法律實(shí)施、海關(guān)護(hù)照驗(yàn)證和身份證驗(yàn)證等,每類(人)只能得到一幅圖像,此時(shí)就只能用這些數(shù)目有限的圖像去訓(xùn)練人臉識(shí)別系統(tǒng)。若用前面提到的那些方法處理這種訓(xùn)練樣本數(shù)目有限的人臉識(shí)別系統(tǒng),識(shí)別率會(huì)明顯下降,甚至變得不再適用。參考文獻(xiàn)[6]首先對原始人臉圖像利用奇異值分解,然后運(yùn)用分解得到的較大的幾個(gè)奇異值對原始人臉圖像近似重構(gòu),并且將重構(gòu)人臉圖像和原始圖像一起作為訓(xùn)練樣本,從而對原訓(xùn)練樣本個(gè)數(shù)進(jìn)行擴(kuò)展,再對增加了訓(xùn)練樣本后的樣本集運(yùn)用2DPCA方法進(jìn)行特征抽取,該方法可取得較好的識(shí)別效果。但是由于人臉圖像存在姿態(tài)、表情等變化,而且這個(gè)變化越大,算法的識(shí)別誤差也越大。基于此,本文提出了一種基于圖像鏡像和奇異值分解的鏡像奇異值分解方法。該方法首先對人臉圖像做鏡像變換,然后對原始人臉圖像和鏡像圖像分別做奇異值分解,接著用較大的幾個(gè)奇異值分別對原人臉圖像重構(gòu),將這些重構(gòu)圖像、原圖像以及鏡像圖像一起作為訓(xùn)練樣本運(yùn)用(2D)2PCA方法對其進(jìn)行特征抽取,最后使用基于最小歐氏距離的分類方法對樣本集進(jìn)行分類識(shí)別。由于考慮了人臉圖像的旋轉(zhuǎn)等姿態(tài)變化,在ORL人臉數(shù)據(jù)庫上的實(shí)驗(yàn)結(jié)果表明,該方法比參考文獻(xiàn)[6]中的方法有更好的識(shí)別性能。
1 方法的思想與實(shí)現(xiàn)
1.1 鏡像人臉圖像生成

    增加鏡像圖像可以部分消除由于頭部的旋轉(zhuǎn)對人臉識(shí)別造成的影響,而且人臉圖像是基本對稱的[7],則此時(shí)可以考慮將原始人臉圖像A以其垂直中心軸由式(1)作鏡像變換,從而對原始訓(xùn)練人臉圖像的個(gè)數(shù)進(jìn)行擴(kuò)展。
    A1=A×M  (1)
其中,M為反對角線元素為1、其余元素為0的方陣。
1.2 基于奇異值分解的人臉表示

1.3 基于(2D)2PCA的特征提取
 
    訓(xùn)練時(shí),將每張訓(xùn)練人臉圖像Ak(k=1,2,…,M)分別向Z和X投影,得到訓(xùn)練樣本的投影特征矩陣Ck(k=1,2,…,M);同時(shí),在測試時(shí),對于任一測試人臉圖像A,首先使用式(5)得到特征矩陣C,然后使用基于最小歐氏距離的最近鄰分類器對測試人臉圖像進(jìn)行分類識(shí)別。本文算法的結(jié)構(gòu)流程圖如圖1所示。

2 實(shí)驗(yàn)結(jié)果及分析
2.1 實(shí)驗(yàn)所用人臉庫

    本實(shí)驗(yàn)所用人臉數(shù)據(jù)庫為ORL人臉庫,該人臉數(shù)據(jù)庫由40人、每人分別由10幅大小均為112×92的256灰度級的正面人臉圖像組成,這些圖像是在不同時(shí)間、不同光照、不同表情和不同姿態(tài)下拍攝的。圖2給出了ORL人臉數(shù)據(jù)庫中的部分標(biāo)準(zhǔn)人臉圖像及其鏡像圖像。


2.2 實(shí)驗(yàn)方法及結(jié)果
    為了對各方法的識(shí)別效果進(jìn)行對比,本文分別對單樣本PCA算法、SVD+PCA算法、參考文獻(xiàn)[6]中提出的SVD+2DPCA算法、SVD+(2D)2PCA以及本文提出的方法在ORL人臉數(shù)據(jù)庫上進(jìn)行10組實(shí)驗(yàn),即分別將每個(gè)人的第1,2,3,...,10幅共40幅人臉圖像作為訓(xùn)練樣本,而其余的360幅圖像作為測試樣本進(jìn)行分類識(shí)別,然后取其平均識(shí)別率,測試結(jié)果如表1所示。以下(2D)2PCA方法中行方向降維維數(shù)為10,即只對其列方向維數(shù)做變化。

    不同的特征提取方法的確會(huì)對系統(tǒng)識(shí)別率的提高有一定的影響,為了驗(yàn)證本文方法識(shí)別率的提高不僅僅依賴于(2D)2PCA特征提取方法的選擇,而是由于鏡像人臉圖像樣本的增加,實(shí)驗(yàn)中分別對單樣本PCA算法、SVD+PCA算法、SVD+2DPCA算法、SVD+(2D)2PCA算法以及本文算法在ORL人臉庫上,同樣分別將每個(gè)人的第1,2,3,...,10幅圖像作為訓(xùn)練人臉圖像,而將其余的360幅作為測試樣本,取同一特征向量維數(shù)下的10組實(shí)驗(yàn)的平均識(shí)別率作為其最終識(shí)別率,測試結(jié)果如圖3所示。

    同時(shí),為了比較各參考文獻(xiàn)方法和本文方法在不同測試樣本數(shù)目情況下的穩(wěn)定性[9],做如下的測試實(shí)驗(yàn):在ORL人臉庫上分別取每個(gè)人的第1,2,3,...,10張圖像作為訓(xùn)練樣本,分10組實(shí)驗(yàn),同時(shí)在每組實(shí)驗(yàn)中分別以除訓(xùn)練樣本以外的前2,3,4,...,9張圖像作為測試樣本,計(jì)算每組實(shí)驗(yàn)的平均識(shí)別率,實(shí)驗(yàn)結(jié)果如圖4所示。

2.3 實(shí)驗(yàn)結(jié)果分析
    由表1可以看出,在不同的訓(xùn)練樣本條件下,本文提出的方法的識(shí)別效果明顯高于參考文獻(xiàn)中提出的其他幾種方法,這主要是由于加入鏡像信息后可以減小由于姿態(tài)變化對人臉識(shí)別的影響。從圖3中的實(shí)驗(yàn)數(shù)據(jù)也可以看出SVD+2DPCA和SVD+(2D)2PCA方法在特征維數(shù)增大時(shí),兩種方法的識(shí)別效果差不多,但是都不如本文所提方法,而且由SVD+(2D)2PCA方法和本文方法的比較曲線可以得知,本文方法識(shí)別率的提高主要是依賴于人臉圖像鏡像信息的加入,而不是僅僅由于(2D)2PCA特征提取方法的選擇。由圖4可知,隨著測試樣本個(gè)數(shù)的增加,特別是PCA方法的識(shí)別率較低而且其穩(wěn)定性較弱,與SVD+2DPCA以及SVD+(2D)2PCA方法相比,本文所提方法在保證識(shí)別率高于其他方法的同時(shí),也表現(xiàn)出了較強(qiáng)的穩(wěn)定性。
    通過對原始人臉圖像增加鏡像圖像來擴(kuò)充訓(xùn)練人臉樣本數(shù),提出了一種基于鏡像奇異值分解的新方法。實(shí)驗(yàn)表明,與其他單樣本人臉識(shí)別方法相比,本文所提出的方法具有較高的識(shí)別率,在一定程度上克服了由于人臉姿態(tài)的變化對識(shí)別結(jié)果的影響,并取得了較好的識(shí)別效果。但是,現(xiàn)有的基于單樣本人臉識(shí)別的方法其識(shí)別率一般都不高,有效算法的提出還有待進(jìn)一步的研究。
參考文獻(xiàn)
[1]  ZHAO W, CHELLAPPA R, ROSENFELD A, et al. Face recgnition: a literature survey[J]. ACM  Computing Surveys, 2003,35(4):399-458.
[1]  TURK M, PENTLAND A. Eigenfaces for recognition[J].Journal of Cognitive Neuroscience, 1991,3(1):71-86.
[2]  TURK M, PENTLAND A. Face recognition using eigenfaces[A]. Proceedings of IEEE Computer Vision and Pattern Recognition[C]. Hawaii, USA: IEEE CS Press, 1991:    586-591.
[3]  YANG J, ZHANG D. Two_dimensional PCA: a new approach to appearance-based face representation and  Recognition[J]. IEEE Transaction on Pattern Analysis and Machine Intelligence, 2004,26(1):131-137.
[4]  ZHANG Dao Qiang, ZHOU Zhi Hua. (2D)2PCA:Two-directional two-dimensional PCA for efficient face representation and recognition[J]. Neurocomputing,2005(69): 224-231.
[5]  BELHUMEUR V, HESPANHA J, KRIEGMAN D. Eigenfaces vs fisherfaces: recognition using class specific linear  projection[J]. IEEE Transactions on Pattern Analysis and  Machine Intelligence, 1997,19(7):711-720.
[6]  LU Chong, LIU Wan Quan, SEN Jian. An face recognition with only one training sample[J]. Proceedings of the 25th Chinese Control Conference 7-11 August, 2006
[7]  楊瓊,丁曉青.對稱主分量分析及其在人臉識(shí)別中的應(yīng)用[J].計(jì)算機(jī)學(xué)報(bào),2003,26(9):1146-1151.
[8]  ZHANG D, CHEN S, ZHOU Z H. A new face recognition method based on SVD perturbation for single example    image per person[J].Applied Mathematics and computation, 2005,163(2):895-907.
[9]  吳朋.基于虛擬信息的單樣本分塊人臉識(shí)別[J].計(jì)算機(jī)工程與應(yīng)用,2009,45(19):146-149.

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動(dòng)力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉