當(dāng)前位置:首頁 > 嵌入式 > 嵌入式教程
[導(dǎo)讀]基于HMM的嵌入式人臉識別系統(tǒng)研究

摘要:系統(tǒng)選用S3C2410A處理器作為硬件平臺,Linux操作系統(tǒng)作為軟件平臺,采用OV7640+OV511的結(jié)構(gòu)實現(xiàn)圖像信息采集,使用基于V4L的方法編寫圖像處理、檢測和識別程序,實現(xiàn)了快速、準(zhǔn)確識別人臉的功能;并對相關(guān)浮點算法進行了改進,極大地提高了ARM處理器上圖像預(yù)處理的速度。采用基于隱馬爾可夫模型(HMM)的方法,簡化了人臉檢測和識別的過程。
關(guān)鍵詞:嵌入式系統(tǒng);HMM;ARM;人臉識別

0 引言
    嵌入式人臉識別系統(tǒng)與傳統(tǒng)鑒別身份的系統(tǒng)相比具有很強的優(yōu)勢,無需特殊的采集設(shè)備,成本低廉,使用簡單;同時,人臉識別不干擾使用者,不侵犯使用者的隱私,屬于非侵犯的主動識別,易于為用戶所接受。
    本文以嵌入式ARM9系統(tǒng)開發(fā)為主線,以HMM模型為理論基礎(chǔ),展示了完成圖像采集、人臉檢測與識別等功能相對應(yīng)的硬件平臺和軟件模塊的設(shè)計及實現(xiàn)過程;并對圖像預(yù)處理的浮點算法做了優(yōu)化,極大提高了嵌入式系統(tǒng)的速度。
    本系統(tǒng)軟件部分可直接應(yīng)用于帶有Linux操作系統(tǒng)的智能手機中,利用手機以及內(nèi)置的攝像頭,即可進行個人面部特征數(shù)據(jù)分析,然后對比最初存儲的人臉信息庫,完成身份識別功能。

1 系統(tǒng)架構(gòu)及其設(shè)計方案
    本系統(tǒng)采用了Samsung推出的以ARM 920T RISC為內(nèi)核的處理器——S3C2410A。其優(yōu)秀的處理性能理所當(dāng)然地成為便攜式設(shè)備開發(fā)的首選。同時為適應(yīng)智能手機對視頻圖像采集的需求,系統(tǒng)采用了基于USB總線的視頻采集模塊,與串行傳輸相比極大地提高了數(shù)據(jù)的采集速率。本系統(tǒng)涉及到數(shù)字圖像的采集、處理、存儲、傳輸和HMM算法等多種技術(shù)。其系統(tǒng)架構(gòu)如圖1所示。



2 圖像采集硬件設(shè)計
    鑒于傳統(tǒng)CCD圖像傳感器昂貴的成本、相對復(fù)雜的附加電路和較高的功耗,本系統(tǒng)采用OmniVision公司的OV7640 CMOS芯片作為圖像傳感器。OV7640是一款低電壓(2.5 V)、高靈敏度的CMOS圖像傳感器。
    實時采集存儲系統(tǒng)需要高速的數(shù)據(jù)傳輸,對系統(tǒng)硬件之問的配合提出較高的要求。本系統(tǒng)設(shè)計中,在采集部分和傳輸部分之間配有相應(yīng)的緩存區(qū)。實際中,采用OV7640及配套的芯片OV511擴展DRAM起緩存作用,實現(xiàn)將數(shù)字視頻圖像通過高速USB送入ARM處理器。OV511是一個專用的數(shù)字?jǐn)z像IC的USB接口芯片。

3 圖像采集程序
    本系統(tǒng)采用Linux做為操作系統(tǒng)平臺,操作系統(tǒng)的移植在此不做過多介紹。
    Video4 Linux(簡稱V4L)是Linux中關(guān)于視頻設(shè)備的內(nèi)核驅(qū)動,它為針對視頻設(shè)備的應(yīng)用程序編程提供一系列接口函數(shù),這些視頻設(shè)備包括現(xiàn)今市場上流行的TV卡、視頻捕捉卡和USB攝像頭等。Linux內(nèi)核提供Video4Linux應(yīng)用程序接口,在程序開發(fā)時,首先是基于Video4Linux API函數(shù)來設(shè)計程序。[!--empirenews.page--]
    基于Video4Linux圖像采集的程序流程如圖2所示。



4 圖像預(yù)處理與人臉識別算法及實現(xiàn)
    人臉識別過程首先判斷輸入的人臉圖像或者視頻中是否存在人臉,如果存在,則進一步給出每個人臉的位置、大小和各個主要面部器官的位置信息,并依據(jù)這些信息,進一步提取每個人臉中所蘊含的身份特征,將其與已有人臉庫中的人臉進行對比,從而識別人的身份。
    人臉識別的過程可以分為圖像預(yù)處理、人臉檢測和人臉識別三部分。
    人臉檢測是指從待識別矩陣中定位人臉區(qū)域中各特征區(qū)域,并將各個區(qū)域分割開。人臉識別是根據(jù)已有的人臉數(shù)據(jù)庫,輸出待測人臉對應(yīng)在人臉庫中的對象標(biāo)號。二者互為前提和目的。由于HMM既可完成人臉檢測,又可完成人臉識別,因此我們將人臉檢測與識別同時處理。
4.1 隱馬爾可夫模型(HMM)基本概念
    HMM是一組用于特征化信號的統(tǒng)計特性的模型,它包含兩個相關(guān)的過程:一個是隱含的、不可見的有限狀態(tài)馬爾可夫鏈,它具有初始狀態(tài)概率分布函數(shù)和狀態(tài)轉(zhuǎn)移概率矩陣,另外是一組與狀態(tài)有關(guān)的概率密度函數(shù)。
    一個HMM的構(gòu)成元素如下:

    一個HMM可以簡記為λ={A,B,∏},由于其輸入為有限字符集V={v1,v2,… vm},因此稱其為離散隱馬爾可夫模型。[!--empirenews.page--]
4.2 用于人臉識別的HMM模型
    根據(jù)狀態(tài)轉(zhuǎn)移的類型,HMM可分為遍歷的(ergodic)和從左到右的(left-right)。前者表示狀態(tài)轉(zhuǎn)移是任意的,可以到本身和其他所有狀態(tài),后者狀態(tài)轉(zhuǎn)移只限于本身和下一個狀態(tài)。人臉垂直方向由上至下和水平方向從左至右各個區(qū)域具有自然不變的順序,可以用1D-HMM來模擬人臉,如圖3所示。


4.3 人臉圖像特征提取
    設(shè)每一個人臉圖像寬度為W,高度為H,被劃分為互相重疊的塊。塊的高度為L,重疊深度為P。因此,從人臉圖像抽取的總分塊數(shù)為觀察矢量數(shù)T,且T=(H-L)/(L-P)+1。參數(shù)L和P的選擇將影響系統(tǒng)的識別率,大的重疊深度值P增加了垂直特征向量的數(shù)量,使系統(tǒng)的識別率提高。L的選擇比較微妙,較小的L使觀察矢量不能有效鑒別;而大的L使剪切相交特征概率增加。當(dāng)P大時,系統(tǒng)識別率對L的變化不敏感。分割算法流程如圖4所示。


4.4 人臉HMM模型的訓(xùn)練
    為人臉圖像庫中每一個人臉建立一個HMM模型,用同一個人的5張不同人臉照片進行訓(xùn)練。按照子塊劃分方法,得到的2D-DCT變換系數(shù)矢量形成觀察矢量序列。用觀察矢量序列O={o1,o2,…,oT}進行訓(xùn)練,得到HMM模型參數(shù)。
    首先對HMM模型λ={A,B,∏}進行初始化,通過自上而下均勻分割人臉圖像得到訓(xùn)練數(shù)據(jù)。模型狀態(tài)數(shù)N=6,與每一個狀態(tài)有關(guān)的觀察矢量序列用于得到觀察概率矩陣B的初始估計,A和∏的初始值按人臉模型自左到右的結(jié)構(gòu)給出。然后利用最大似然估計算法(Baum-Welch估計算法)重新估計模型參數(shù),檢測P(O|λ)的收斂條件。
    如果滿足式(3)條件,則模型已收斂,結(jié)束訓(xùn)練迭代過程;否則繼續(xù)進行下一次訓(xùn)練。
   
    此處,C為預(yù)先給定的閾值。
4.5 人臉圖像識別
    被識別的人臉圖像用于訓(xùn)練過程相同的方法提取觀察矢量序列,觀察矢量序列的概率由人臉圖像HMM模型計算出,即:
   
    當(dāng)滿足式(4)時,被識別人臉對應(yīng)人臉圖像庫中第k個人的人臉被識別出。
    實驗證明,此算法易于實現(xiàn)實時處理,不受臉部表情變化的影響,抗噪聲能力強,魯棒性好。但在人臉識別中的光照問題和姿態(tài)問題方面還有待于進一步的研究。

5 結(jié)論
    基于嵌入式ARM9和HMM算法的人臉識別系統(tǒng)具有體積小,計算量小,運算速度快,性能穩(wěn)定等特點,能夠滿足人們對識別設(shè)備小型化的需求。相信在不久的將來,基于嵌入式的人臉識別系統(tǒng)會在安檢、身份驗證、門禁系統(tǒng)、智能考勤等方面得到廣泛應(yīng)用。
    本文作者創(chuàng)新點:
    人臉識別是生物特征識別中一個重要的研究方向,是間接、無侵犯式身份識別的主要方法。在嵌入式系統(tǒng)進行人臉識別,能夠?qū)崿F(xiàn)人臉識別設(shè)備的便攜化,將會極大地拓展識別設(shè)備的使用范圍。識別使用HMM算法,有效地降低了識別算法的空間和時間復(fù)雜度,為實時識別提供了可能。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉