淺談車牌漢字識(shí)別方法

時(shí)間：2018-10-10 11:50:01

關(guān)鍵字：嵌入式開(kāi)發(fā) 方法漢字淺談車牌

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]：針對(duì)車牌漢字識(shí)別提出了一種基于二值圖形變動(dòng)分析的模糊模板匹配的車牌漢字識(shí)別方案。介紹了該方法的具體實(shí)現(xiàn)算法和實(shí)驗(yàn)流程及結(jié)果。字符識(shí)別是指對(duì)文本資料進(jìn)行掃描，然

：針對(duì)車牌漢字識(shí)別提出了一種基于二值圖形變動(dòng)分析的模糊模板匹配的車牌漢字識(shí)別方案。介紹了該方法的具體實(shí)現(xiàn)算法和實(shí)驗(yàn)流程及結(jié)果。

字符識(shí)別是指對(duì)文本資料進(jìn)行掃描，然后對(duì)圖像文件進(jìn)行分析處理，獲取文字及版面信息的過(guò)程。在識(shí)別并保留字體、字號(hào)、風(fēng)格、版面信息，實(shí)現(xiàn)版面恢復(fù)所見(jiàn)所得；可識(shí)別和恢復(fù)表格；自動(dòng)判別和糾正文件的放置方向，便于成批處理和盲人操作；帶有圖像管理，允許用戶觀查、標(biāo)記和注解文件圖像。

人類的視覺(jué)感知系統(tǒng)是一個(gè)魯棒性很強(qiáng)的、能抵御實(shí)際中可能遇到的各種變形和噪聲干擾的文字識(shí)別系統(tǒng)。人們的認(rèn)字過(guò)程實(shí)際上是對(duì)漢字整體形象的把握，是對(duì)漢字圖像全局的處理過(guò)程[1]。因而，漢字的整體信息在無(wú)筆順識(shí)別中起著無(wú)法替代的重要作用。

統(tǒng)計(jì)模式識(shí)別借助概率論的知識(shí)，判斷或決策對(duì)象的特征類別，使得決策的錯(cuò)誤率達(dá)到最小。基于統(tǒng)計(jì)特征的識(shí)別方法先抽取識(shí)別對(duì)象的穩(wěn)定特征，組成特征矢量，然后在字符集的特征空間中進(jìn)行特征匹配?；谝陨险J(rèn)識(shí)，在分析汽車牌照中漢字字符的特點(diǎn)后，采用了有別于結(jié)構(gòu)分析的一種基于字符圖像特征統(tǒng)計(jì)的模式識(shí)別方法進(jìn)行漢字識(shí)別。同時(shí)針對(duì)統(tǒng)計(jì)方法無(wú)法區(qū)分的相似漢字，提取其微結(jié)構(gòu)信息進(jìn)行特殊的校正識(shí)別。

1 特征統(tǒng)計(jì)匹配

統(tǒng)計(jì)決策論其要點(diǎn)是提取待識(shí)別模式的一組統(tǒng)計(jì)特征，然后按照一定準(zhǔn)則所確定的決策函數(shù)進(jìn)行分類判決。漢字的統(tǒng)計(jì)模式識(shí)別是將字符點(diǎn)陣看作一個(gè)整體，從該整體上經(jīng)過(guò)大量統(tǒng)計(jì)得到所用特征，用盡可能少的特征模式來(lái)描述盡可能多的信息。所采用的方法有：特征統(tǒng)計(jì)的方法、整體變換分析法[3]、幾何矩特征、筆劃密度特征、字符投影特征、外圍特征、微結(jié)構(gòu)特征和特征點(diǎn)特征等。網(wǎng)格特征實(shí)際是結(jié)構(gòu)模式識(shí)別和統(tǒng)計(jì)模式識(shí)別相結(jié)合的產(chǎn)物。字符圖像被均勻或非均勻地劃分為若干區(qū)域，稱之為“網(wǎng)格”。具體應(yīng)用：將尺寸為34×66象素的漢字二值圖均勻分成32個(gè)正方形的小區(qū)域（不考慮外邊框的1個(gè)象素），統(tǒng)計(jì)每個(gè)8×8的小區(qū)域內(nèi)目標(biāo)象素（白色）所占的面積比例，就得到了歸一化的32維特征矢量。統(tǒng)計(jì)多幅相同漢字的32維特征矢量，取均值作為該漢字的標(biāo)準(zhǔn)網(wǎng)格特征模板。識(shí)別時(shí)，計(jì)算待識(shí)別漢字的32維網(wǎng)格特征矢量與模板矢量之間的Euclid距離，求得最小距離值，其對(duì)應(yīng)的漢字即為識(shí)別結(jié)果。在具體應(yīng)用中，由于外部原因常常會(huì)出現(xiàn)字符模糊、字符傾斜的情況，而網(wǎng)格特征匹配方法對(duì)字符模糊和傾斜較敏感，因此魯棒性不是很強(qiáng)，不適合實(shí)際應(yīng)用。

2 模板匹配

模板匹配是數(shù)字圖像處理的重要組成部分之一。把不同傳感器或同一傳感器在不同時(shí)間、

不同成像條件下對(duì)同一景物獲取的兩幅或多幅圖像在空間上對(duì)準(zhǔn)，或根據(jù)已知模式到另一幅

圖中尋找相應(yīng)模式的處理方法就叫做模板匹配。簡(jiǎn)單而言，模板就是一幅已知的小圖像。模板匹配就是在一幅大圖像中搜尋目標(biāo)，已知該圖中有要找的目標(biāo)，且該目標(biāo)同模板有相同的尺寸、方向和圖像，通過(guò)一定的算法可以

在圖中找到目標(biāo)，確定其坐標(biāo)位置。以8 位圖像（其1 個(gè)像素由1 個(gè)字節(jié)描述）為例，模板T（ m × n 個(gè)像素）疊放在被搜索圖S（ W × H 個(gè)像素）上平移，模板覆蓋被搜索圖的那塊區(qū)域叫子圖Sij。i，j為子圖左上角在被搜索圖S 上的坐標(biāo)。而灰度模板由于色彩、光照等因素影響，難以找到普遍適用的模板形式實(shí)現(xiàn)直接的匹配計(jì)算。綜合以上二方面的問(wèn)題，在引入統(tǒng)計(jì)模式識(shí)別思想的基礎(chǔ)上，提出了基于二值圖形變動(dòng)分析的模糊模板匹配方案。

2.1 基于二值圖形變動(dòng)分析的模糊模板匹配

在含有汽車牌照的圖像中，將漢字定位并提取出來(lái)以后，還要完成規(guī)格化、二值化等操作。即使是相同的漢字，由于車牌傾斜、模糊，特別是由于每次定位不可能完全精確一致等諸多因素的影響，導(dǎo)致在二值圖中字體的形狀、大小都會(huì)不同，字體位置也會(huì)發(fā)生不同程度的偏移。提出了求圖形整體變動(dòng)量的統(tǒng)計(jì)方法，其優(yōu)點(diǎn)是不需要參照標(biāo)準(zhǔn)圖形，可以進(jìn)行客觀評(píng)價(jià)，并構(gòu)造出用于匹配識(shí)別的模糊模板。

對(duì)每一個(gè)車牌的漢字字符，選取n幅質(zhì)量較好的參考圖。將這n幅參考圖規(guī)格化為17×33的標(biāo)準(zhǔn)大小后進(jìn)行二值化處理，得到標(biāo)準(zhǔn)參考圖fi（x，y）。因此每個(gè)車牌漢字字符都有n幅由0、1所組成的二值圖像。將這n幅二值圖像對(duì)齊后疊加，再進(jìn)行歸一化。得到的模糊圖形F（x，y）。四個(gè)漢字的模糊圖形模板（不同方向的視覺(jué)效果）如圖1所示。

同的應(yīng)用環(huán)境下，對(duì)匹配區(qū)域和實(shí)時(shí)性要求也不盡相同。光電探測(cè)設(shè)備需要在視頻圖像采集周期內(nèi)（20ms）完成數(shù)據(jù)實(shí)時(shí)處理。由于目標(biāo)在兩場(chǎng)視頻圖像之間的移動(dòng)量較小、特征變化不大，匹配區(qū)域可以大大縮小。匹配區(qū)域太小會(huì)導(dǎo)致目標(biāo)動(dòng)態(tài)特性變差，過(guò)大又會(huì)導(dǎo)致計(jì)算量大幅度增加，具體選擇需要權(quán)衡設(shè)備參數(shù)來(lái)決定。由于CCIR制式視頻信號(hào)是隔行掃描，系統(tǒng)出于實(shí)時(shí)性考慮，數(shù)據(jù)以場(chǎng)為單位處理，導(dǎo)致圖像比例為2:1狀態(tài)。為了保持水平、垂直方向的動(dòng)態(tài)特性一致，圖像匹配區(qū)域也按2:1比例選擇。

該模糊圖形上每一象素點(diǎn)實(shí)際上都對(duì)應(yīng)著一個(gè)概率值，該概率值代表白色目標(biāo)（漢字筆劃）在該點(diǎn)出現(xiàn)的可能性。例如在模糊模板中若某一點(diǎn)值為1，表明在所有參加統(tǒng)計(jì)的二值圖形上漢字筆劃都經(jīng)過(guò)該點(diǎn)，其為白色目標(biāo)象素的可能性是100％，為黑色背景象素的可能性是0；反之亦然。進(jìn)行匹配識(shí)別時(shí)，對(duì)一幅切分后的待識(shí)別漢字灰度圖，將其規(guī)格化、二值化，然后計(jì)算每一象素點(diǎn)與模板的吻合程度，即每一象素點(diǎn)正確匹配的置信度con（x，y）。引入置信度的公式：

f（x，y）為得到的二值化后的待識(shí)別圖像，把所有點(diǎn)的置信度平均后得到總的置信度con作為判別依據(jù)。最大置信度con所對(duì)應(yīng)的模板漢字作為匹配識(shí)別輸出的結(jié)果。

公式中的width和height分別是歸一化后標(biāo)準(zhǔn)圖像的長(zhǎng)和寬。通過(guò)對(duì)實(shí)驗(yàn)結(jié)果的分析發(fā)現(xiàn)，識(shí)別錯(cuò)誤的圖像，往往嚴(yán)重變形、模糊，二值化效果差。

2.2 基于二值圖形變動(dòng)分析的模糊模板匹配的改進(jìn)算法

針對(duì)以上問(wèn)題，提出了一種簡(jiǎn)單的改進(jìn)算法。將切分后不同大小的灰度字符圖像規(guī)格化為17×33的標(biāo)準(zhǔn)尺寸以后，將各象素點(diǎn)的灰度值線性變換到[0，1]區(qū)間，再與模糊圖形模板匹配，計(jì)算Euclid距離，其最小距離值對(duì)應(yīng)的模板漢字作為匹配識(shí)別輸出的結(jié)果。該方法的優(yōu)點(diǎn)是不用對(duì)灰度圖像作二值化處理，避免了由于二值化操作帶來(lái)的圖像信息損失。特別是對(duì)一些模糊圖像，若直接采用二值化效果較差，影響匹配準(zhǔn)確度。因此使用該方法在一定程度上提高了識(shí)別正確率。

實(shí)驗(yàn)中發(fā)現(xiàn)，對(duì)少數(shù)明暗程度變化大或?qū)Ρ榷炔粡?qiáng)的模糊圖像，該方法也產(chǎn)生了少量識(shí)別錯(cuò)誤。這是由于將待識(shí)別圖像的各點(diǎn)灰度值線性拉伸到[0，1]區(qū)間后，原始圖像明暗程度不同導(dǎo)致其平均值與對(duì)應(yīng)模板的平均值并不一致，直接用Euclid距離進(jìn)行匹配，帶來(lái)了計(jì)算誤差。因此引入了歸一化相關(guān)性度量公式：

3 試驗(yàn)結(jié)果的進(jìn)一步校正

模板匹配表現(xiàn)的主要是漢字的整體特征，但是有些漢字存在著一定程度上整體的相似性，因此必須對(duì)相似的字符進(jìn)行進(jìn)一步的校正才能提高識(shí)別的正確率。對(duì)相似漢字的區(qū)分，往往是尋找其特有的筆劃結(jié)構(gòu)，這也是在統(tǒng)計(jì)模式識(shí)別中引入結(jié)構(gòu)方法的必要之處。例如在車牌漢字識(shí)別中，“粵”字與其他省份漢字的最大區(qū)別是底部的鉤狀結(jié)構(gòu)。為此對(duì)預(yù)處理后的17×33二值圖像的底部1/4部分作水平和垂直方向的投影，水平投影17個(gè)特征值，垂直投影33個(gè)特征值，形成50維的微結(jié)構(gòu)投影特征矢量?！盎洝弊治⒔Y(jié)構(gòu)特征及其統(tǒng)計(jì)41幅圖像后的微結(jié)構(gòu)投影特征直方圖如圖2所示。經(jīng)統(tǒng)計(jì)平均后作為區(qū)分相似漢字的依據(jù)。實(shí)際校正時(shí)，計(jì)算微結(jié)構(gòu)特征的匹配距離。若小于預(yù)先設(shè)定的閾值，則直接返回該漢字作為識(shí)別結(jié)果。

4 實(shí)驗(yàn)流程及結(jié)果

對(duì)識(shí)別300幅切分后的質(zhì)量較好的漢字灰度圖進(jìn)行識(shí)別，實(shí)驗(yàn)流程如圖3所示。實(shí)驗(yàn)結(jié)果表明，外圍面積特征匹配法正確率達(dá)88％，網(wǎng)格特征匹配法86％，簡(jiǎn)單模板匹配法91％，改進(jìn)算法的正確率達(dá)到了93％。如果對(duì)識(shí)別結(jié)果進(jìn)一步校正，正確率將提高到95％。若再進(jìn)一步增加訓(xùn)練集，完善模板，相信正確率還可以繼續(xù)提高。

LIDY