當(dāng)前位置:首頁 > 嵌入式 > 嵌入式硬件
[導(dǎo)讀]: 針對車牌漢字識別提出了一種基于二值圖形變動分析的模糊模板匹配的車牌漢字識別方案。介紹了該方法的具體實現(xiàn)算法和實驗流程及結(jié)果。字符識別是指對文本資料進行掃描,然

: 針對車牌漢字識別提出了一種基于二值圖形變動分析的模糊模板匹配的車牌漢字識別方案。介紹了該方法的具體實現(xiàn)算法和實驗流程及結(jié)果。

字符識別是指對文本資料進行掃描,然后對圖像文件進行分析處理,獲取文字及版面信息的過程。在識別并保留字體、字號、風(fēng)格、版面信息,實現(xiàn)版面恢復(fù)所見所得;可識別和恢復(fù)表格;自動判別和糾正文件的放置方向,便于成批處理和盲人操作;帶有圖像管理,允許用戶觀查、標(biāo)記和注解文件圖像。

人類的視覺感知系統(tǒng)是一個魯棒性很強的、能抵御實際中可能遇到的各種變形和噪聲干擾的文字識別系統(tǒng)。人們的認(rèn)字過程實際上是對漢字整體形象的把握,是對漢字圖像全局的處理過程[1]。因而,漢字的整體信息在無筆順識別中起著無法替代的重要作用。

統(tǒng)計模式識別借助概率論的知識,判斷或決策對象的特征類別,使得決策的錯誤率達到最小?;诮y(tǒng)計特征的識別方法先抽取識別對象的穩(wěn)定特征,組成特征矢量,然后在字符集的特征空間中進行特征匹配。基于以上認(rèn)識,在分析汽車牌照中漢字字符的特點后,采用了有別于結(jié)構(gòu)分析的一種基于字符圖像特征統(tǒng)計的模式識別方法進行漢字識別。同時針對統(tǒng)計方法無法區(qū)分的相似漢字,提取其微結(jié)構(gòu)信息進行特殊的校正識別。

1 特征統(tǒng)計匹配

統(tǒng)計決策論其要點是提取待識別模式的一組統(tǒng)計特征,然后按照一定準(zhǔn)則所確定的決策函數(shù)進行分類判決。漢字的統(tǒng)計模式識別是將字符點陣看作一個整體,從該整體上經(jīng)過大量統(tǒng)計得到所用特征,用盡可能少的特征模式來描述盡可能多的信息。所采用的方法有:特征統(tǒng)計的方法、整體變換分析法[3]、幾何矩特征、筆劃密度特征、字符投影特征、外圍特征、微結(jié)構(gòu)特征和特征點特征等。網(wǎng)格特征實際是結(jié)構(gòu)模式識別和統(tǒng)計模式識別相結(jié)合的產(chǎn)物。字符圖像被均勻或非均勻地劃分為若干區(qū)域,稱之為“網(wǎng)格”。具體應(yīng)用:將尺寸為34×66象素的漢字二值圖均勻分成32個正方形的小區(qū)域(不考慮外邊框的1個象素),統(tǒng)計每個8×8的小區(qū)域內(nèi)目標(biāo)象素(白色)所占的面積比例,就得到了歸一化的32維特征矢量。統(tǒng)計多幅相同漢字的32維特征矢量,取均值作為該漢字的標(biāo)準(zhǔn)網(wǎng)格特征模板。識別時,計算待識別漢字的32維網(wǎng)格特征矢量與模板矢量之間的Euclid距離,求得最小距離值,其對應(yīng)的漢字即為識別結(jié)果。在具體應(yīng)用中,由于外部原因常常會出現(xiàn)字符模糊、字符傾斜的情況,而網(wǎng)格特征匹配方法對字符模糊和傾斜較敏感,因此魯棒性不是很強,不適合實際應(yīng)用。

2 模板匹配

模板匹配是數(shù)字圖像處理的重要組成部分之一。把不同傳感器或同一傳感器在不同時間、

不同成像條件下對同一景物獲取的兩幅或多幅圖像在空間上對準(zhǔn),或根據(jù)已知模式到另一幅

圖中尋找相應(yīng)模式的處理方法就叫做模板匹配。簡單而言,模板就是一幅已知的小圖像。模板匹配就是在一幅大圖像中搜尋目標(biāo),已知該圖中有要找的目標(biāo),且該目標(biāo)同模板有相同的尺寸、方向和圖像,通過一定的算法可以

在圖中找到目標(biāo),確定其坐標(biāo)位置。以8 位圖像(其1 個像素由1 個字節(jié)描述)為例,模板T( m × n 個像素)疊放在被搜索圖S( W × H 個像素)上平移,模板覆蓋被搜索圖的那塊區(qū)域叫子圖Sij。i,j為子圖左上角在被搜索圖S 上的坐標(biāo)。而灰度模板由于色彩、光照等因素影響,難以找到普遍適用的模板形式實現(xiàn)直接的匹配計算。綜合以上二方面的問題,在引入統(tǒng)計模式識別思想的基礎(chǔ)上,提出了基于二值圖形變動分析的模糊模板匹配方案。

2.1 基于二值圖形變動分析的模糊模板匹配

在含有汽車牌照的圖像中,將漢字定位并提取出來以后,還要完成規(guī)格化、二值化等操作。即使是相同的漢字,由于車牌傾斜、模糊,特別是由于每次定位不可能完全精確一致等諸多因素的影響,導(dǎo)致在二值圖中字體的形狀、大小都會不同,字體位置也會發(fā)生不同程度的偏移。提出了求圖形整體變動量的統(tǒng)計方法,其優(yōu)點是不需要參照標(biāo)準(zhǔn)圖形,可以進行客觀評價,并構(gòu)造出用于匹配識別的模糊模板。

對每一個車牌的漢字字符,選取n幅質(zhì)量較好的參考圖。將這n幅參考圖規(guī)格化為17×33的標(biāo)準(zhǔn)大小后進行二值化處理,得到標(biāo)準(zhǔn)參考圖fi(x,y)。因此每個車牌漢字字符都有n幅由0、1所組成的二值圖像。將這n幅二值圖像對齊后疊加,再進行歸一化。得到的模糊圖形F(x,y)。四個漢字的模糊圖形模板(不同方向的視覺效果)如圖1所示。

同的應(yīng)用環(huán)境下,對匹配區(qū)域和實時性要求也不盡相同。光電探測設(shè)備需要在視頻圖像采集周期內(nèi)(20ms)完成數(shù)據(jù)實時處理。由于目標(biāo)在兩場視頻圖像之間的移動量較小、特征變化不大,匹配區(qū)域可以大大縮小。匹配區(qū)域太小會導(dǎo)致目標(biāo)動態(tài)特性變差,過大又會導(dǎo)致計算量大幅度增加,具體選擇需要權(quán)衡設(shè)備參數(shù)來決定。由于CCIR制式視頻信號是隔行掃描,系統(tǒng)出于實時性考慮,數(shù)據(jù)以場為單位處理,導(dǎo)致圖像比例為2:1狀態(tài)。為了保持水平、垂直方向的動態(tài)特性一致,圖像匹配區(qū)域也按2:1比例選擇。

該模糊圖形上每一象素點實際上都對應(yīng)著一個概率值,該概率值代表白色目標(biāo)(漢字筆劃)在該點出現(xiàn)的可能性。例如在模糊模板中若某一點值為1,表明在所有參加統(tǒng)計的二值圖形上漢字筆劃都經(jīng)過該點,其為白色目標(biāo)象素的可能性是100%,為黑色背景象素的可能性是0;反之亦然。進行匹配識別時,對一幅切分后的待識別漢字灰度圖,將其規(guī)格化、二值化,然后計算每一象素點與模板的吻合程度,即每一象素點正確匹配的置信度con(x,y)。引入置信度的公式:

f(x,y)為得到的二值化后的待識別圖像,把所有點的置信度平均后得到總的置信度con作為判別依據(jù)。最大置信度con所對應(yīng)的模板漢字作為匹配識別輸出的結(jié)果。

公式中的width和height分別是歸一化后標(biāo)準(zhǔn)圖像的長和寬。通過對實驗結(jié)果的分析發(fā)現(xiàn),識別錯誤的圖像,往往嚴(yán)重變形、模糊,二值化效果差。

2.2 基于二值圖形變動分析的模糊模板匹配的改進算法

針對以上問題,提出了一種簡單的改進算法。將切分后不同大小的灰度字符圖像規(guī)格化為17×33的標(biāo)準(zhǔn)尺寸以后,將各象素點的灰度值線性變換到[0,1]區(qū)間,再與模糊圖形模板匹配,計算Euclid距離,其最小距離值對應(yīng)的模板漢字作為匹配識別輸出的結(jié)果。該方法的優(yōu)點是不用對灰度圖像作二值化處理,避免了由于二值化操作帶來的圖像信息損失。特別是對一些模糊圖像,若直接采用二值化效果較差,影響匹配準(zhǔn)確度。因此使用該方法在一定程度上提高了識別正確率。

實驗中發(fā)現(xiàn),對少數(shù)明暗程度變化大或?qū)Ρ榷炔粡姷哪:龍D像,該方法也產(chǎn)生了少量識別錯誤。這是由于將待識別圖像的各點灰度值線性拉伸到[0,1]區(qū)間后,原始圖像明暗程度不同導(dǎo)致其平均值與對應(yīng)模板的平均值并不一致,直接用Euclid距離進行匹配,帶來了計算誤差。因此引入了歸一化相關(guān)性度量公式:

3 試驗結(jié)果的進一步校正

模板匹配表現(xiàn)的主要是漢字的整體特征,但是有些漢字存在著一定程度上整體的相似性,因此必須對相似的字符進行進一步的校正才能提高識別的正確率。對相似漢字的區(qū)分,往往是尋找其特有的筆劃結(jié)構(gòu),這也是在統(tǒng)計模式識別中引入結(jié)構(gòu)方法的必要之處。例如在車牌漢字識別中,“粵”字與其他省份漢字的最大區(qū)別是底部的鉤狀結(jié)構(gòu)。為此對預(yù)處理后的17×33二值圖像的底部1/4部分作水平和垂直方向的投影,水平投影17個特征值,垂直投影33個特征值,形成50維的微結(jié)構(gòu)投影特征矢量?!盎洝弊治⒔Y(jié)構(gòu)特征及其統(tǒng)計41幅圖像后的微結(jié)構(gòu)投影特征直方圖如圖2所示。經(jīng)統(tǒng)計平均后作為區(qū)分相似漢字的依據(jù)。實際校正時,計算微結(jié)構(gòu)特征的匹配距離。若小于預(yù)先設(shè)定的閾值,則直接返回該漢字作為識別結(jié)果。

4 實驗流程及結(jié)果

對識別300幅切分后的質(zhì)量較好的漢字灰度圖進行識別,實驗流程如圖3所示。實驗結(jié)果表明,外圍面積特征匹配法正確率達88%,網(wǎng)格特征匹配法86%,簡單模板匹配法91%,改進算法的正確率達到了93%。如果對識別結(jié)果進一步校正,正確率將提高到95%。若再進一步增加訓(xùn)練集,完善模板,相信正確率還可以繼續(xù)提高。



LIDY

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉