一種改進(jìn)的圖像重組算法及其硬件實現(xiàn)
1.引言
目前,大多數(shù)的數(shù)字相機(jī)的圖像傳感器,不管是CMOS還是CCD,都是單色的,即只有灰度的變化。為了得到彩色圖像,普遍采用的方法是在傳感器的表面覆蓋一層聚酰亞胺掩膜的彩色濾色器。濾色器的格式有多種,一般為棋盤格式。本文提出的算法針對的是其中最常用的bayer格式,如圖1所示,其濾色濾格子分別透過G(綠)、B(藍(lán))、R(紅)三種顏色,其中G的采樣率是B、R的兩倍,原因是人眼對綠色信息要比藍(lán)色、紅色敏感。
圖像傳感器傳來的數(shù)據(jù)通常對應(yīng)每個像素點R、G、B三種顏色中的一種顏色信息,圖像重組算法(Demosaicing Algorithm)是指把傳感器送來的每個像素點信息轉(zhuǎn)化為包含R、G、B三原色信息的圖像算法。關(guān)于圖像重組算法日前主要有獨立插值法、按比例插值法、Kimmel法等,本文將在分析這些算法的基礎(chǔ)上提出能平衡圖像質(zhì)量和硬件消耗的新算法及實現(xiàn)方法。
2.傳統(tǒng)算法
2.1 獨立插值算法
最簡單的線性方法足R、G、B三分量各自獨立進(jìn)行插值重組,彼此沒有關(guān)聯(lián)。以利用相鄰像素作平均的插值法為例:
如圖2,G2、G4、G6、G8、R1、R3、R7、R9為已知相應(yīng)像素的相應(yīng)分量,G5、R2、R4、R6、R8、R5為所求分量,求法如下:
藍(lán)色分量的求法與R相似。
此方法雖然簡單,占用硬件資源比較少,但是卻會引起色彩混淆和邊沿模糊問題,因為其在重組過程中忽略了邊沿問題。為了提高圖像質(zhì)量,可以在此基礎(chǔ)上加入梯度的控制。因此,該算法采用了梯度小的方向的分量值作均值處理。由于梯度大的方向是邊沿變化的方向,若選取了該方向上的值作均值,就會模糊了邊沿。以求圖2中的G5分量為例:
水平梯度H=|G4-G6|,垂直梯度V=|G2-G8|。
H>V,G5=(G2+G8)/2;H
此外,該算法沒有考慮噪聲因素,其簡單的平均化操作將使一個像素上的噪聲擴(kuò)大到影響九個像素,從而導(dǎo)致信噪比較低。
2.2 按比例插值算法
由于BAYER格式的傳感器上G分量比R、B分量要多一倍,于是有人提出利用G分量對R、B分量進(jìn)行插值。
如圖3所示,G1-G9已經(jīng)插值得到,R1、R3、R7、R9為已知R信息,求R5:
R5={(R1*G5/G1)+(R3*G5/G3)+(R7*G5/G7)+(R9*G5/G9))/4
此算法對消除色彩混淆有一定的作用,但有個致命的缺點,在G分量特別小的區(qū)域,兩G分量比例(如G5/G1)可能會變得很大;由于R1、R3、R7、R9都只是所要求的R5周圍的點,在R5周圍很有邊沿信息(在圖像中,邊沿信息與噪聲無異)時,如果G5/G1等比例值太大,很可能引入一個非常大的噪聲,使得圖像失真嚴(yán)重,造成計算R、B分量時對噪聲特別敏感,使得圖像信噪比降低。
2.3 Kimmel算法
Kimmel算法是圖像重組算法中一個常用的經(jīng)典方法。如圖4,Kimmel算法求G5:
其中,E為權(quán)重參數(shù),表征該相鄰像素參與運算的比例。E由該相鄰像素的梯度D決定,梯度D越大,權(quán)重E越小。梯度D的定義如下:(其中P代表R,G,B任意一個分量)
從而:Ei=(1+D2(P5)+D2(Pi))1/2,如E3=(1+Dxd2(PS)+Dxd2(P3))1/2。
kimmel算法在求解R、B分量時也同樣采用了按比例插值的思想,只是比例權(quán)重不同,這樣可以較大程度地減弱色彩混淆現(xiàn)象。如圖4,用kimmel算法求R5:
Kimmel算法重組得到的圖像質(zhì)量比線性插值的方法提高了很多,但kimmel算法也有其缺點,這是本文提出改進(jìn)算法的出發(fā)點,將在下面討論。[!--empirenews.page--]
3.改進(jìn)的算法
本文在kimmel算法的基礎(chǔ)上進(jìn)行了如下的改進(jìn):
(1) 待重組圖像像素與周邊像素的關(guān)聯(lián)性進(jìn)一步增強(qiáng),從而改善圖像的邊沿特性。
在kimmel算法中梯度簡單地以兩個像素的某個分量差絕對值表示,本文提出的方法是用一個相應(yīng)方向上更大范圍窗口的像素點的差的平均值來代替原來梯度。
例如,在kimmel算法中,如圖1,D=|G[5,5]□G[6,6]|,用本文的方法則為:
這樣可進(jìn)一步加強(qiáng)所求像素點與周邊像素已知分量的關(guān)聯(lián)性,從而減弱混淆現(xiàn)象。
(2) 修正kimmel算法在G分量缺少時的缺陷。
在kimmel算法中,在G很小的區(qū)域,兩像素的G比例就會變得很大,這樣會造成圖像失真和放大噪聲。為此,本文在利用G計算R、B時,可給G設(shè)一閾值;此值越大,圖像質(zhì)量越差;此值越小,在G較小區(qū)域的圖像失真就越嚴(yán)重;因此,此值的設(shè)定要經(jīng)過反復(fù)的仿真試驗,找到合適的平衡點,本文經(jīng)過實驗對比各參數(shù)下的效果,將此值選擇為40~60。
(3) 改變kimmel算法所有像素都重新計算其三分量值的做法。
kimmel的算法會改變每個像素三個分量的值,本算法保留原來該像素的已知值,從而可以保留原始圖像更多的信息,提高了圖像質(zhì)量。由于本算法要在ASIC上實現(xiàn),在不影響圖像總體質(zhì)量的前提下,應(yīng)盡量簡化某些運算,節(jié)省硬件資源。
①本文在求E時不用開方倒數(shù)的方式,而采用查表的方式,即一個范圍內(nèi)的D值對應(yīng)一個E值,只要所設(shè)的值能達(dá)到“D大則E小”的效果便可;
②求D時所需的除以21/2的運算可轉(zhuǎn)化成近似移位相加。
4.硬件實現(xiàn)
本算法涉及了大量的算術(shù)運算,而且計算中像素相關(guān)性的要求需要存儲大量像素,所以硬件實現(xiàn)必須適當(dāng)減少硬件資源和RAM的使用量,從而降低ASIC的面積,本文提出如下的解決方法。
4.1 流水線式的運算處理
由式(1)、式(2)可見,計算插入的R、G、B值要經(jīng)過大量的運算,而傳感器送過來的數(shù)據(jù)是實時的,對其處理也必須是實時的,也就是說進(jìn)來像素的分量值就要送出一個像素的R、G、B值。假設(shè)模塊的主頻率和傳感器送來的數(shù)據(jù)頻率分別為48MHz和12MHz,則在四個周期就要輸出一個像素的R、G、B值。顯然,四個48MHz時鐘周期是不可能完成如此多的運算的。
本文采用的方法是把眾多運算分成m個步驟完成,而每個步驟都占n個周期,一個步驟完成的結(jié)果在下一個n個周期運用計算,如此一級一級的計算,輸入與輸出都是實時的,其設(shè)計思想近似于計算機(jī)架構(gòu)中的流水線結(jié)構(gòu)。其中m和n要根據(jù)模塊時鐘與傳感器輸出數(shù)據(jù)的頻率的比例關(guān)系以及所設(shè)計ASIC的工藝水平對時序的限制來確定。此方法可使此模塊面積減為原始設(shè)計的1/2左右。以計算R[5,5](像素坐標(biāo)如圖1)為例:步驟1:求得G[4,3],G[4,5],G[6,3],G[6,5],G[4,7],G[6,7];步驟2:求得R[5,4]和R[5,6];步驟3:求得R[5,5],這樣,每個步驟都有4個周期去完成,就可以滿足模塊的實時性。其中步驟1可再分為前兩個周期計算G[4,3],G[4,5]和G[6,3],后兩個周期計算G[6,5],G[4,7],G[6,7],從而復(fù)用其中除法器、加法器和乘法器,使該運算占用資源減少到一半。同樣道理,計算R[5,4]和R[5,6]時也可以復(fù)用資源,分別在兩個周期內(nèi)完成其運算。
4.2 堆棧式的RAM操作
此算法要求存儲9×9窗口大小的像素信息,也就是要存下9行的傳感器送來的數(shù)據(jù)。本文提出的方法只需要存8行的像素信息即可,但要配合一個9×9的寄存器陣列實現(xiàn)。下面以實例說明RAM操作過程:當(dāng)?shù)?行數(shù)據(jù)要送來時,前8行數(shù)據(jù)已按順序存儲在RAM中。當(dāng)傳感器送來G[1,9]時,模塊要進(jìn)行以下工作:(1)把RAM第1列數(shù)據(jù)讀出;(2)然后把第1列后7行的數(shù)據(jù)連同G[1,9]寫到RAM的第1列中,同時把第1列全部數(shù)據(jù)連同G[1,9]寫到9x9的陣列的第一列中,這樣既保存了第1行的數(shù)據(jù),又保證第9行數(shù)據(jù)能寫到RAM里,相當(dāng)于將RAM數(shù)據(jù)往里推,丟去第1行數(shù)據(jù),推入第9行的數(shù)據(jù)。如此類推,就可以減少一行存儲資源。
5.仿真與驗證
本文基于攝像頭控制器芯片的開發(fā)平臺進(jìn)行了仿真驗證,并比較了改進(jìn)的算法與傳統(tǒng)算法的優(yōu)劣。
此模塊通過了功能仿真、DC工具時序、面積等分析,并在FPGA板上通過接傳感器,經(jīng)JPEP壓縮,由USB傳輸?shù)接嬎銠C(jī)驗證其效果。本文采用Syn-opsys公司的DC compiler分析了各算法實現(xiàn)的面積代價。同時,本文針對幾種算法的圖像還原能力作了分析:用線性方法、kimmel方法和本算法處理同一張圖片轉(zhuǎn)化的bayer格式圖片,設(shè)R(x,y)為原圖像素值,r(x,y)為處理后像素值:
設(shè)滿足(3)式的點為還原良好點,其個數(shù)為n,本文所用測試圖片為640×480大小,令h=n/640×480為算法的還原程度判斷。
圖5和表1是幾種Demosaicing算法的仿真結(jié)果圖片及其相應(yīng)的h值和面積代價,可以看到本文提出的方法的圖像質(zhì)量要比其他算法的好,尤其在高頻時,混淆現(xiàn)象得到了很好的改善。
6 結(jié)論
本文在詳細(xì)分析傳統(tǒng)算法的優(yōu)劣基礎(chǔ)上,提出了新的圖象重組算法,而流水線式分時復(fù)用資源的實現(xiàn)方法節(jié)省了接近一半的資源,很好地克服了模塊實時性要求,主頻時鐘限制和demosaicing算法復(fù)雜性帶給硬件實現(xiàn)資源成本高的問題。