人臉識(shí)別技術(shù)
過去的2017年,手機(jī)的安全功能進(jìn)入了人臉識(shí)別技術(shù)時(shí)代,其實(shí)在我們生活中涉及安全范疇的領(lǐng)域,人臉識(shí)別技術(shù)已經(jīng)被廣泛使用了。
人臉識(shí)別是近年來模式識(shí)別、圖像處理、機(jī)器視覺、神經(jīng)網(wǎng)絡(luò)以及認(rèn)知科學(xué)等領(lǐng)域研究的熱點(diǎn)課題之一,被廣泛應(yīng)用于公共安全(罪犯識(shí)別等)、安全驗(yàn)證系統(tǒng)、信用卡驗(yàn)證、醫(yī)學(xué)、檔案管理、視頻會(huì)議、人機(jī)交互系統(tǒng)等各個(gè)方面。
人臉識(shí)別技術(shù)
計(jì)算機(jī)人臉識(shí)別技術(shù)也就是利用計(jì)算機(jī)分析人臉圖象, 進(jìn)而從中提取出有效的識(shí)別信息, 用來“辨認(rèn)”身份的一門技術(shù).雖然人類的人臉識(shí)別能力很強(qiáng), 能夠記住并辨別上千個(gè)不同人臉, 可是計(jì)算機(jī)則困難多了. 其表現(xiàn)在: 人臉表情豐富; 人臉隨年齡增長而變化; 人臉?biāo)蓤D象受光照、成象角度及成象距離等影響;人臉識(shí)別還涉及到圖象處理、計(jì)算機(jī)視覺、模式識(shí)別以及神經(jīng)網(wǎng)絡(luò)等學(xué)科, 也和人腦的認(rèn)識(shí)程度緊密相關(guān)。
所謂“人臉識(shí)別 (Face Recognition)”的研究范圍十分寬泛,大致可以被分為以下幾個(gè)方面的內(nèi)容:
1、人臉檢測(Face Detection):
即從各種不同的場景中檢測出人臉的存在并確定其位置。在大多數(shù)的場合中由于場景較復(fù)雜,人臉的位置是預(yù)先不知道的,因而首先必須確定場景中是否存在人臉,如果存在人臉,再確定圖像中人臉的位置。臉部毛發(fā)、化妝品、光照、噪聲、面部傾斜和人臉大小變化以及各種各樣遮擋等因素都會(huì)使人臉檢測問題變得更為復(fù)雜。人臉檢測的主要目的是在輸入的整幅圖像上尋找人臉區(qū)域,把圖像分割成兩個(gè)部分-人臉區(qū)域和非人臉區(qū)域,從而為后續(xù)的應(yīng)用作準(zhǔn)備。
2、人臉表征(Face Representation):
即采取某種表示方式表示檢測出的人臉和數(shù)據(jù)庫中的已知人臉。通常的表示法包括幾何特征(如歐氏距離、曲率、角度)、代數(shù)特征(如矩陣特征矢量)、固定特征模板、特征臉、云紋圖等。
3、人臉識(shí)別(Face Identification):
即將已檢測到的待識(shí)別的人臉與數(shù)據(jù)庫中的已知人臉進(jìn)行比較匹配,得出相關(guān)信息,這一過程的核心是選擇適當(dāng)?shù)娜四樀谋碚鞣绞脚c匹配策略,系統(tǒng)的構(gòu)造與人臉的表征方式密切相關(guān)。通?;蚴沁x擇全局的方法或是選擇基于特征的方法進(jìn)行匹配。顯然,基于側(cè)面像所選擇的特征和基于正面像的特征是有很大的區(qū)別的。
4、表情分析(Expression Analysis):
即對(duì)待識(shí)別人臉的表情信息(快樂、悲傷、恐懼、驚奇等)進(jìn)行分析,并對(duì)其加以歸類。
5、生理分類(Physical Classification):
即對(duì)待識(shí)別人臉的生理特征進(jìn)行分析,得出其種族、年齡、性別、職業(yè)等相關(guān)信息。顯然,完成這一操作需要大量的知識(shí)并且通常是非常困難和復(fù)雜的。
人臉識(shí)別技術(shù)的發(fā)展歷程
人臉識(shí)別的工程應(yīng)用始于20世紀(jì)60年代,經(jīng)過50多年的研究,大致可以分為以下三個(gè)階段:
第一階段是主要解決了人臉識(shí)別所需要的面部特征。
這一階段的研究以Bertillon、Allen和Parke為代表。在 Bertillon的系統(tǒng)中,用一個(gè)簡單的語句與數(shù)據(jù)庫中某一張臉相聯(lián)系,同時(shí)與指紋分析相結(jié)合,提供了一個(gè)較強(qiáng)的識(shí)別系統(tǒng)。而Allen則設(shè)計(jì)了一種有效的摹寫手段,并在其后由Parke用計(jì)算機(jī)實(shí)現(xiàn)。然而無論是哪種方式,該階段的識(shí)別過程仍然全部依賴于操作人員,需要許多人為干預(yù),無法實(shí)現(xiàn)自動(dòng)人臉識(shí)別。
第二階段是人機(jī)交互式識(shí)別階段。
研究人員用數(shù)學(xué)模型描述人臉圖像中的五官長度等主要幾何特征,并通過歐氏距離進(jìn)行相似性度量。Harmon和Lesk利用多維特征矢量表示人臉面部特征,并設(shè)計(jì)了基于這一特征表示法的識(shí)別系統(tǒng)。其后,Kaya、Kobayashi和T. Kanad也分別采用了各種不同的方式,對(duì)幾何特征計(jì)算進(jìn)行了研究[5][6]。但是,該方法依賴于操作員的知識(shí),仍無法擺脫人的干預(yù)。
第三階段是真正的機(jī)器自動(dòng)識(shí)別階段。
該階段人臉識(shí)別技術(shù)有了重大突破,很多經(jīng)典算法相繼出現(xiàn),如特征臉、子空間方法、彈性圖匹配法、基于統(tǒng)計(jì)外觀模型和神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別等。同時(shí),也出現(xiàn)很多用于算法性能測試的公開人臉庫,如ORL人臉庫、YaleB人臉庫、FERET人臉庫等。