數(shù)據(jù)融合技術(shù)在車牌字符識別中的應(yīng)用研究
摘要: 在車牌字符識別中,針對單一識別方法識別率不高的問題,提出了應(yīng)用數(shù)據(jù)融合技術(shù),將不同的識別方法有機地結(jié)合起來構(gòu)成融合型識別系統(tǒng),有效地、綜合地提高整個系統(tǒng)的識別性能。數(shù)據(jù)層選擇了加權(quán)平均算法,特征層選擇了人工神經(jīng)網(wǎng)絡(luò)算法,決策層采用了模糊推理算法實現(xiàn)對車牌字符的最終識別。應(yīng)用MATLAB 進行了仿真,并與單獨使用BP 神經(jīng)網(wǎng)絡(luò)算法的識別率進行了比較,結(jié)果證明采用數(shù)據(jù)融合技術(shù)系統(tǒng)的識別率得到了較大提高,達到90%以上。
車牌識別系統(tǒng)是圖像模式識別領(lǐng)域的一個經(jīng)典研究課題。對車牌識別技術(shù)的研究不但會極大促進數(shù)字圖像處理、計算機視覺、模式識別與人工智能等相關(guān)領(lǐng)域理論與實踐的發(fā)展,而且其在公共安全、交通管理、軍事部門等的實際應(yīng)用價值也不可估量。一個典型的車牌識別系統(tǒng)由圖像采集、圖像預(yù)處理、車牌定位、字符分割以及字符識別幾部分組成。其中字符識別是車牌識別系統(tǒng)中的關(guān)鍵環(huán)節(jié),識別方法的好壞直接影響到整個車牌最終的識別效果。在字符識別模塊,針對單一識別技術(shù)識別率較低的問題提出了從數(shù)據(jù)融合理論的角度出發(fā),有效地、綜合地應(yīng)用多種識別技術(shù)來提高系統(tǒng)的識別率。
1 數(shù)據(jù)融合的基本原理
數(shù)據(jù)融合技術(shù)實際上是對人腦綜合處理復(fù)雜問題的一種功能模擬。在多傳感器系統(tǒng)中由于各種傳感器提供的信息具有不同的特征:時變的或者非時變的;實時的或者非實時的;快變的或者緩變的;模糊的或者確定的;精確的或者不完整的;可靠的或者非可靠的;相互支持的或者互補的;也可能是相互矛盾或沖突的。而數(shù)據(jù)融合系統(tǒng)能充分利用多個傳感器資源、對各種傳感器及其觀測信息合理支配與使用,將各種傳感器在空間或時間上的互補或冗余信息依據(jù)某種優(yōu)化準(zhǔn)則組合起來,產(chǎn)生對觀測環(huán)境的一致性解釋和描述。因此,數(shù)據(jù)融合的目標(biāo)是基于各種傳感器分離觀測信息,再通過對信息的優(yōu)化組合導(dǎo)出更多的有效信息,它的最終目的是利用多個傳感器共同或聯(lián)合操作的優(yōu)勢, 提高整個系統(tǒng)的有效性,消除單個或少量傳感器的局限性。
數(shù)據(jù)融合技術(shù)與經(jīng)典信號處理方法有本質(zhì)的區(qū)別,數(shù)據(jù)融合所處理的多傳感器信息不但具有更為復(fù)雜的形式,而且還可以在不同的信息層次上出現(xiàn), 這些信息表征層次包括:數(shù)據(jù)層、特征層和決策層。直接在采集到的原始數(shù)據(jù)層上進行的融合稱為數(shù)據(jù)層融合, 數(shù)據(jù)層融合是最低層次的融合,它的優(yōu)點在于能保持盡可能多的現(xiàn)場數(shù)據(jù),提供其他融合層次所不能提供的細微信息, 但其局限性也是比較明顯的,主要原因在于數(shù)據(jù)層融合是在信息的最底層進行的,由于傳感器原始信息的不確定性、不完全性和不穩(wěn)定性,對融合結(jié)果影響較大,穩(wěn)定性較差。因此,數(shù)據(jù)層上的融合具有很大的盲目性,原則上不贊成直接在數(shù)據(jù)層上進行數(shù)據(jù)融合,而且數(shù)據(jù)層融合通常要求選用的傳感器必須是同類型傳感器或相同量級的傳感器。數(shù)據(jù)層上通常采用的融合方法有加權(quán)平均法、像素灰度值選擇融合方法、基于區(qū)域特征的融合方法、小波變換法、金字塔分解方法等。特征層融合是先對來自傳感器的原始信息進行特征提取,然后再對特征信息進行綜合分析和處理,特征層融合屬于中間層次的融合,也是最成熟、發(fā)展最完善的融合理論,它的優(yōu)點是通過特征提取既實現(xiàn)了信息壓縮,又保留了最重要的信息。特征層融合通常采用的算法有參量模板法、聚類分析法、人工神經(jīng)網(wǎng)絡(luò)等。決策層融合是一種高層次融合, 它能充分利用特征層融合的最終結(jié)果,采用適當(dāng)?shù)娜诤霞夹g(shù)給出最終的檢測、控制、指揮、決策的依據(jù),決策層融合的最大優(yōu)點是具有容錯性,當(dāng)一個或幾個傳感器出現(xiàn)錯誤時,通過適當(dāng)?shù)娜诤?,系統(tǒng)最終還能獲得正確的結(jié)果。決策層融合通常所采用的方法有貝葉斯推斷、D-S證據(jù)理論、模糊集理論、專家系統(tǒng)等。總地說來,數(shù)據(jù)融合本質(zhì)上是一個由底層至頂層,對多元信息進行融合,逐層抽象的信息處理過程。
2 基于數(shù)據(jù)融合理論的車牌字符識別
數(shù)據(jù)融合是一種對數(shù)據(jù)的綜合和處理技術(shù),是許多傳統(tǒng)學(xué)科和新技術(shù)的繼承和應(yīng)用,而對數(shù)據(jù)的綜合和處理能力反應(yīng)在所選用的融合算法上。因此,在一個融合系統(tǒng)中,核心的問題是選擇合適的融合算法。經(jīng)過對各種融合算法原理及優(yōu)缺點的研究比較之后,最終確定了各層上所采用的融合算法: 數(shù)據(jù)層選擇了加權(quán)平均算法; 特征層選擇了人工神經(jīng)網(wǎng)絡(luò)算法;決策層采用了模糊推理算法以實現(xiàn)對車牌字符的最終識別。圖1 為應(yīng)用數(shù)據(jù)融合技術(shù)識別車牌字符的流程框圖。
2.1 數(shù)據(jù)層融合
加權(quán)平均融合算法,是通過融合各源圖像的冗余信息提高檢測的可靠性和融合后圖像的信噪比。而且它對來自不同傳感器的多幅源圖像進行數(shù)據(jù)層融合時,無需考慮各源圖像像素之間的相關(guān)性及配準(zhǔn)技術(shù),因此也是最簡單、最方便的數(shù)據(jù)層融合算法。
以3 幅圖像為例對加權(quán)平均算法進行敘述:設(shè)融合結(jié)果為FUS(i,j),輸入圖像為A(i,j)、B(i,j)和C(i,j),(i,j)是圖像中某點像素的坐標(biāo)位置,該算法的表達式如式1 所示:
設(shè)計中對同一車輛采集了3 幀圖像,通過定位、字符分割、歸一化后,針對同一個車牌字符得到了3 個樣本,對這3個樣本的像素值進行平均融合, 得到融合以后的字符樣本,再將融合結(jié)果送往特征層進行下一步處理。與以往只用單幀圖像作為識別對象的識別算法比較,數(shù)據(jù)融合技術(shù)彌補了因單幀圖像拍攝效果不佳而造成無法識別的不足,這也是本設(shè)計的創(chuàng)新處之一。
2.2 特征層融合
神經(jīng)網(wǎng)絡(luò)具有很強的容錯性和自學(xué)習(xí)、自組織及自適應(yīng)能力, 能夠模擬復(fù)雜的非線性映射, 恰好滿足多傳感器信息融合技術(shù)處理的要求,在數(shù)據(jù)融合理論研究中受到高度重視,具有廣闊的應(yīng)用前景。另外,在數(shù)據(jù)融合系統(tǒng)中要將來自不同類型傳感器的數(shù)據(jù)進行非線性關(guān)聯(lián)并形成一個融合矢量是非常困難的, 而神經(jīng)網(wǎng)絡(luò)則能實現(xiàn)這一特殊功能。因此, 神經(jīng)網(wǎng)絡(luò)分類器是本設(shè)計特征層融合首先考慮采用的算法。在諸多的神經(jīng)網(wǎng)絡(luò)分類器中BP神經(jīng)網(wǎng)絡(luò)算法數(shù)學(xué)意義明確、學(xué)習(xí)步驟分明, 而且網(wǎng)絡(luò)經(jīng)訓(xùn)練收斂之后進行識別時還具有計算量小、速度快等優(yōu)勢。所以, 最終確定采用BP 神經(jīng)網(wǎng)絡(luò)分類器作為特征層的融合算法。
具有單隱層的3 層BP 網(wǎng)絡(luò)能夠逼近任何有限函數(shù),也能使處理的問題簡單化,而且車牌識別系統(tǒng)屬于一個小類別分類問題, 故采用3 層BP 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)符合實際應(yīng)用的要求。首先對經(jīng)過數(shù)據(jù)層融合后的字符像素進行特征提取,設(shè)計*提取了3 類互補性強的字符特征: 字符原始特征,粗網(wǎng)格特征及水平、垂直投影特征和字符外圍輪廓特征,作為輸入信號分別送給3 個BP 神經(jīng)網(wǎng)絡(luò)分類器, 根據(jù)識別系統(tǒng)的需求設(shè)置好各個網(wǎng)絡(luò)的初始參數(shù)后, 開始對3 個BP 網(wǎng)絡(luò)進行訓(xùn)練,訓(xùn)練過程中不斷調(diào)整網(wǎng)絡(luò)參數(shù),最終使各個BP 網(wǎng)絡(luò)達到良好的收斂效果, 然后用訓(xùn)練好的3 個BP 神經(jīng)網(wǎng)絡(luò)分別對同1 個車牌字符進行識別。
2.3 決策層融合
決策層采用了模糊推理技術(shù)[6-7]作為最終判決的依據(jù)。模糊系統(tǒng)中,知識的抽取和表達比較方便,但學(xué)習(xí)能力較差,神經(jīng)網(wǎng)絡(luò)可從樣本中進行有效的學(xué)習(xí),但從網(wǎng)絡(luò)中提取知識的過程比較困難;模糊系統(tǒng)適合于處理結(jié)構(gòu)化的知識,而神經(jīng)網(wǎng)絡(luò)對處理非結(jié)構(gòu)化信息更為有效。設(shè)計中選擇特征層神經(jīng)網(wǎng)絡(luò)分類器的輸出作為決策層模糊推理系統(tǒng)的輸入還可實現(xiàn)數(shù)據(jù)整理、*和抑制噪聲,使獲取模糊規(guī)則的過程變得容易。所以,融合系統(tǒng)中模糊推理技術(shù)和神經(jīng)網(wǎng)絡(luò)技術(shù)能克服自身不足、各取所長、優(yōu)勢互補,從而使融合系統(tǒng)的性能得到改善。[!--empirenews.page--]
運用模糊理論進行模式識別時通常采用3 種方法:隸屬原則識別法、擇近原則識別法以及模糊聚類分析法。設(shè)計中選用了隸屬原則識別算法對3 個BP 網(wǎng)絡(luò)的識別結(jié)果進行最終決策。隸屬原則識別法的難點在于隸屬度函數(shù)的選擇。
由于每個BP 網(wǎng)絡(luò)提取的是字符的不同特征, 各網(wǎng)絡(luò)參數(shù)的設(shè)置也各不相同,導(dǎo)致3 個神經(jīng)網(wǎng)絡(luò)對同一個測試字符的輸出向量和識別率各不相同,所以設(shè)計中是從這兩個方面出發(fā)確定隸屬度函數(shù)。3 個BP 網(wǎng)絡(luò)對同一個字符進行識別時的輸出向量構(gòu)成一個3 行50 列(設(shè)計中所需識別的字符共計50 類)的矩陣M,統(tǒng)計出3 個BP 網(wǎng)絡(luò)的識別率后將其歸一化為一個1 行3 列的矩陣N,確定隸屬度函數(shù)可通過兩矩陣相乘Q=N[1×3]·M[3×50]得到,相乘結(jié)果Q[1×50]為一個行向量,取該向量中最大值所對應(yīng)的字符作為模糊決策的最終結(jié)果,如式3 所示:
3 仿真結(jié)果及其分析
應(yīng)用MATLAB 軟件對上述各個模塊所采用的算法進行了仿真,效果如圖2 所示。仿真結(jié)果表明,針對同一幅車牌圖像,3 個BP 網(wǎng)絡(luò)給出了不同的識別結(jié)果,但是通過決策層的模糊推理融合算法仍然能夠正確地識別。
設(shè)計*采集到實際的車輛圖像84 套, 其中因無法準(zhǔn)確定位或字符分割的圖像共12 套, 在剩余的72 套圖像中,用其中的50 套作為神經(jīng)網(wǎng)絡(luò)的訓(xùn)練樣本,其余22 套作為測試樣本,對車牌識別,經(jīng)實驗統(tǒng)計,其結(jié)果如表1 所示。
由以上統(tǒng)計結(jié)果可明確的看出,應(yīng)用數(shù)據(jù)融合技術(shù)系統(tǒng)的識別率較單一識別方法有了較大的提高, 達到了90.9%。
4 結(jié)束語
基于數(shù)據(jù)融合理論, 將不同的識別方法有效地結(jié)合起來構(gòu)成融合型車牌字符識別系統(tǒng), 數(shù)據(jù)層應(yīng)用了加權(quán)平均算法, 特征層選用了BP 神經(jīng)網(wǎng)絡(luò), 決策層采用了模糊推理算法。實驗證明, 該系統(tǒng)能有效的實現(xiàn)車牌字符識別, 字符識別率達到了90%以上, 較采用單一識別方法有了較大的提高。通過融合使信息資源得到了充分利用,各種方法互補,系統(tǒng)性能得到了很大提高。對于特征層融合應(yīng)用的BP 神經(jīng)網(wǎng)絡(luò)算法, 直接使用了前人的研究成果,可對網(wǎng)絡(luò)的參數(shù)設(shè)置及收斂速度進一步的研究,加以改善提高。