1 引 言
車輛牌照識別( VLPR: V ehic le L icense PlateRecognit iON)系統(tǒng)作為一個專用的計算機視覺系統(tǒng),能夠自動攝取車輛圖像并識別出車牌。這個系統(tǒng)可應用在公路自動收費、停車場管理、失竊車輛偵察、門衛(wèi)系統(tǒng)、智能交通系統(tǒng)等不同場合。汽車牌照定位是車牌識別的難點, 因此, 公路車牌定位算法的研究有著重要而實用意義。車牌識別在圖像處理技術中是典型的先分割目標進而識別的應用實例。類似的應用包括信封上郵政編碼的分割與識別、貨運列車車型車號的自動分割和識別、文字的識別等等。雖然車輛牌照識別系統(tǒng)是一個針對車牌識別的專用系統(tǒng), 然而對它的研究定會對上述類似問題的研究起到推動作用。
關于車牌定位已有很多方法提出, 如基于數學形態(tài)學的定位方法:基于顏色的定位方法 , 這種方法主要利用彩色空間的信息, 實現車牌定位, 包括彩色邊緣算法、顏色距離、相似度算法和基于邊緣的顏色對方法等; 基于遺傳算法提取汽車牌照的方法:基于神經網絡的車牌定位方法。
針對各種車牌定位算法的優(yōu)缺點, 提出基于DCT變化的車牌定位算法, 該方法在DCT 數據中,提取出一種基于加權頻率的車牌區(qū)新特征, 然后經過自適應閾值分類, 采用基于投影法的車牌區(qū)分割方法, 直接在DCT 域實現車牌的快速定位。該方法可使定位矩形框緊湊地包圍車牌區(qū)域, 有效降低誤檢率, 且運算復雜度較低, 有利于實現復雜背景中車牌的快速定位。
2 車牌定位算法
2. 1 離散余弦變換
離散余弦變換( DCT )是利用傅立葉變換的對稱性, 采用圖像邊界褶翻操作將圖像變換為偶函數形式, 然后對這樣的圖像進行二維離散傅立葉變換, 變換后的結果將僅包含余弦項, 故稱之為離散余弦變換。DCT可以將圖像描述為不同幅值和頻率的正弦值之和的形式。對于一幅典型的圖像, DCT 有這樣的性質: 許多有關圖像的重要可視信息都集中在DCT變換的一小部分系數中。
一個M N矩陣A 的二維DCT定義如下:
數值Bpq稱為A 的DCT系數。DCT是一個可逆變換, 逆變換的定義如下:
DCT逆變換方程可以理解為: 任意M N 的矩陣A 都可以寫成M N 個如公式( 3)所示的函數之和的形式:
這些函數被稱為DCT基本函數。
2. 2 基于DCT 域的特征提取
對于彩色圖像, 圖像預處理部分首先將輸入的圖像去掉彩色, 進行灰度化。利用RGB 空間到灰度的轉換公式得到車牌的灰度圖像, 即:
其中, f ( x, y )為( x, y )位置像素的灰度值, R ( x,y )、G (x, y )、B ( x, y )為輸入彩色圖像在( x, y )位置像素的紅、綠、藍顏色對應的彩色信息。
預處理后的圖像經DCT 變換后所得到的系數位置及其幅值所反映的是該變換圖像的空間頻率及其能量。這里, 將圖像劃分為子塊, 子塊的大小為8 8, 對每個8 8的子塊進行DCT 變換使其能量按頻率集中, 得到的64個變換系數, 分別代表對應不同基波頻率分量的大小。
若將8 8的DCT系數劃分為0區(qū)、1區(qū)、2區(qū)、3區(qū)等4個區(qū)域, 則每個區(qū)域代表不同紋理的方向:0區(qū)表示的是直流分量(即8 8子塊的平均值) , 1區(qū)表示的是豎向紋理(即水平方向的頻率變化), 2區(qū)表示的是斜向紋理(即斜向的頻率變化) , 3區(qū)表示的是橫向紋理(即豎直方向的頻率變化)。
由于車牌字符區(qū)域具有特殊的線條結構, 它基本上可歸為橫向、豎向、斜向的線條組合。在圖像中, 這些線條主要顯示出特殊的紋理特點, 其灰度與背景相差較大, 即邊緣變化較劇烈, 且表現出明顯的豎向、斜向、橫向紋理特征。而在DCT 域中則主要表現為在圖的1、2、3區(qū)的中高頻部分的系數值較大, 即豎向線條的變換系數主要集中于1區(qū), 斜向線條的變換系數主要集中于2區(qū)( 1區(qū)與3區(qū)也有一定的分布) , 橫向線條的變換系數主要集中于3區(qū),這是圖像所含車牌字符在DCT 域中所表現出的紋理特征??梢?, 車牌字符區(qū)所具有的特殊結構使其在DCT 域能夠表現出更為豐富的中、高頻DCT 分量。同時, 車牌字符區(qū)在DCT域表現出明顯的方向性信息。綜合考慮上述兩點, 用一種基于DCT子塊的加權頻率特征(W eighted Frequency, WF) , 通過對不同方向DCT 分量進行非線性加權增強, 如公式( 5)所示, 從而使車牌字符區(qū)特征更加明顯。
其中c( i, j)為8 8塊中第i行第j列的DCT系數; i取1~ 8; j取1~ 8, 圖1為輸入車輛圖像及其對應的WF 特征圖??梢?, 車牌字符區(qū)域的WF 值明顯高于背景。
圖1 輸入圖像及其WF特征圖。
2. 3 分類處理
在進行分類時, 如果圖像中車牌和背景之間的對比度較低, 此時的WF 值會比較小; 另外, 高頻信息豐富的非車牌區(qū)域背景經常也具有較大的WF值。因此, 如果采用固定閾值, 則不利于低對比度車牌區(qū)域的提取, 同時也容易將高頻豐富的背景誤認為車牌區(qū)域。因此本算法采用自適應閾值法進行分類, 閾值的設定如公式( 6)所示。
其中aver為整幅圖像的平均WF 值, max 為整幅圖像的最大WF值, m in為整幅圖像的最小WF值, k為經驗值, 可按公式( 7)進行分類。
圖2為分類結果圖, 可以看出, 大量的背景被去除, 車牌區(qū)被很好地提取出來。
圖2 分類結果圖。
2. 4 平滑去噪
分類后的二值標記圖中, 通常會存在一些零散的噪聲點, 而真實車牌區(qū)域只有一個, 過多的噪聲點往往會干擾車牌區(qū)域的投影, 引起定位框比實際車牌區(qū)域大, 或者制造假車牌區(qū)。因此, 在分割之前,需要對分類結果圖進行平滑去噪。通常的噪聲是一些物體邊緣或紋理較豐富的背景, 形狀大多不規(guī)則且分布較稀疏, 用統(tǒng)計濾波法, 可減小其影響, 具體方法為: 統(tǒng)計每個候選區(qū)域中的像素點數, 并找出最大的像素點數, 當候選區(qū)域的像素點數小于一定值時(本算法中使用候選區(qū)域最大像素點數的1 /4) ,即認為該區(qū)域為噪聲區(qū)域, 將其去除。
對于候選車牌區(qū)中可能會有的少量凹區(qū)和斷續(xù), 可以通過游程平滑算法進行平滑。所謂游程平滑算法是對同一掃描行上的黑像素點之間的距離進行檢測, 當兩相鄰黑像素點之間的空白游程長度小于門限值時, 則將這兩點之間的空白游程全部填黑。
考慮到一條水平掃描線上的一段游程L = (P 1, P 2,……, P i, Pi+ 1,……,P j- 1, P j, ……, Pn ); 其中游程L1 =(P1, P2, ……, P i )和L 3 = (Pj , ……, P n )是0- 游程(即黑像素游程), 而L 2 = (Pi+ 1, ……, Pj- 1 )是1 - 游程(即白像素游程)。當L2 的長度j- i- 1小于設定的門限T 時, 則將兩黑游程L1 和L3 連接起來即把游程L2 的全部像素平滑成黑。在本算法中游程平滑算法運用了兩次, 即水平方向和垂直方向各用一次。
處理后的圖像如圖3所示。
圖3 平滑去噪處理后。
2. 5 投影分割
經過上述操作后, 某個區(qū)域內一定會包含實際的車牌, 為精確定位車牌, 采用投影法分割, 快速定位圖像中的車牌區(qū)域, 并且誤檢率較低。
對于去噪后的標記圖, 首先對其進行水平投影,然后對投影值進行分析, 確定出水平基線, 再在水平基線之間進行垂直投影, 確定出垂直基線。這樣就可以初步定位出車牌區(qū)?;€的產生依據下面的規(guī)則: 首先設定一個閾值T, 將小于此閾值的投影值置0, 大于此閾值的投影值置1, 然后當相鄰投影值一個為0, 另一個為1時, 即認為非零投影值處存在一條基線。在本算法中進行了兩次投影, 即水平和垂直投影。確定出水平基線和垂直基線后即可在圖像中劃出矩形框, 標出車牌區(qū)域。另外, 為使矩形框緊緊包圍車牌區(qū)域, 在畫基線之前, 首先判斷矩形框各基線上所有像素值之和是否為零, 若為零, 則將基線向靠近矩形中心的位置移動直到各基線上所有像素值之和不為零為止。算法的最終定位結果圖如圖4所示。
圖4 定位結果圖。
3 結束語
本算法通過對汽車圖像進行離散余弦變換( DCT ), 得到DCT 系數, 并計算加權頻率特征, 之后采用自適應閾值法, 實現車牌區(qū)/非車牌區(qū)的快速分類; 再經平滑濾波之后, 利用投影法實現車牌區(qū)域的定位, 有效降低誤檢率, 且運算復雜度較低, 有利于實現復雜背景中車牌區(qū)域的快速定位。經多次實驗證明, 本算法具有較高的正確檢測率, 部分實驗結果如圖5所示。