基于FPGA的ARM圖像縮放器的實現(xiàn)

時間：2013-04-26 13:48:04

關鍵字： ARM FPGA FIFO DDR

手機看文章

掃描二維碼
隨時隨地手機看文章

[導讀]ARM是目前全球最大的嵌入式芯片技術的IP提供商，其所擁有的IP已經(jīng)成為眾多芯片設計公司采納的一種技術標準和開發(fā)平臺。所以基于ARM 內(nèi)核的SoC已經(jīng)成為嵌入式處理器的開發(fā)重點，可通過ARM實現(xiàn)LCD控制器來完成對嵌入式

ARM是目前全球最大的嵌入式芯片技術的IP提供商，其所擁有的IP已經(jīng)成為眾多芯片設計公司采納的一種技術標準和開發(fā)平臺。所以基于ARM 內(nèi)核的SoC已經(jīng)成為嵌入式處理器的開發(fā)重點，可通過ARM實現(xiàn)LCD控制器來完成對嵌入式LCD屏的控制。如果利用TFT屏支持顯示，其圖像分辨率存在局限性，因此通過搭建一個FPGA平臺實現(xiàn)圖像縮放器功能外接LCD顯示器，完成ARM信號的擴展顯示。同時FPGA也能完成對ARM平臺產(chǎn)生的圖像信號進行驗證和仿真，以測試其功能和時序的正確性。XGA顯示器因其顯示量大，輸出形式多樣等特點已經(jīng)成為目前大多數(shù)設計中的常用輸出設備，因此本文針對ARM產(chǎn)生的VGA信號通過插值算法對其擴展為XGA標準信號。

1 VESA標準中的VGA與XGA時序

視頻電子標準協(xié)會(VESA)是非盈利國際組織，主要制定個人電腦、工作站以及消費電子類產(chǎn)品在視頻接口標準，因此本文所設計的VGA與XGA的時序均按照VESA標準設計。

顯示器通常采用逐行掃描的方式，每一幀圖像按順序一行接著一行連續(xù)掃描而成，掃描的過程中由水平同步信號HSYNC和垂直同步信號VSYNC來控制掃描。行掃描和場掃描的時序圖如圖1所示，其行掃描和場掃描的時序要求如表1、表2所示。

圖1 行掃描時序和場掃描時序

2 系統(tǒng)整體設計

2.1系統(tǒng)框圖

系統(tǒng)設計的數(shù)據(jù)源是來自ARM9系統(tǒng)板的視頻信號，其格式為VESA標準的VGA信號。數(shù)據(jù)源進入FPGA后先進行圖像縮放的處理，把輸入的有效像素數(shù)據(jù)利用算法對其進行處理，期間的處理數(shù)據(jù)利用FIFO與DDR2進行緩存，然后把處理后的圖像數(shù)據(jù)按照XGA時序送入視頻編碼芯片，最后送入顯示器顯示。其中FPGA內(nèi)部設計分為時序控制模塊、時序產(chǎn)生模塊、FIFO模塊、圖像縮放器模塊以及DDR2 SDRAM控制器模塊,如圖2所示。

圖2 系統(tǒng)原理框圖

2.2 硬件實現(xiàn)

FPGA采用Altera的EP3C16F484C6芯片，該芯片具有15 408個邏輯單元，504 KB內(nèi)存，56個乘法器和4個PLL鎖相環(huán)內(nèi)核，最大支持346個I/O端口，系統(tǒng)時鐘最高為250 MHz。FPGA開發(fā)板采用了專門的視頻解碼編碼芯片，Silicon Image的視頻編碼芯片SI7170支持VGA到UVGA的格式標準，同時也支持HDTV格式的編碼。DDR2 SDRAM采用三星的K4T51163QC芯片, 其頻率支持267 MHz，本文選取為200 MHz。芯片容量為32 MB×16，實際上只要SDRAM滿足存儲2幀圖像的容量即可滿足本文設計要求[1]。完成轉換后的XGA信號所需的輸出時鐘為65 MHz，可由FPGA內(nèi)部鎖相環(huán)產(chǎn)生。

3 FPGA內(nèi)部模塊工作原理

3.1輸入時序控制模塊與輸出時序控制模塊

輸入時序控制模塊是根據(jù)輸入視頻信號的同步信號和時序要求，確保有效的圖像數(shù)據(jù)能夠順利寫入FIFO進行緩存。例如當模塊接收到場同步信號時，F(xiàn)IFO進入即將寫入的狀態(tài)，當模塊接收到使能信號時， FIFO開始寫入數(shù)據(jù)，這樣能確保寫入FIFO的數(shù)據(jù)是從完整1幀圖像的起始開始寫入。

輸出時序控制模塊的功能是產(chǎn)生輸出圖像所必需的同步信號、場同步信號和行同步信號，以保證輸出圖像的數(shù)據(jù)與時序一致，從而使圖像可以正確地顯示在顯示器上。

輸入輸出時序控制模塊，按照計數(shù)器的方法進行設計[2]。例如VGA信號的1幀圖像的總像素要求為800×525，其中有效像素為640×480。對于行掃描來說可設置1~96像素時鐘計數(shù)為行同步信號，97~144像素時鐘計數(shù)為行消隱后肩，145~784像素時鐘計數(shù)為圖像有效像素顯示，685~800像素時鐘計數(shù)為行消隱前肩。完成一行后，計數(shù)器置0，等待新的行同步信號到來再重新計數(shù)。在圖像有效像素時鐘內(nèi)，讓寫入FIFO使能信號處于有效狀態(tài)，而其余時間使能信號處于無效狀態(tài)，這樣可保證有效圖像數(shù)據(jù)能準確寫入FIFO進行緩存，并等待下一步的處理。

3.2 圖像縮放器模塊

如圖3所示，圖像縮放器模塊主要完成對輸入圖像數(shù)據(jù)源進行分辨率的縮放。根據(jù)設計，輸入的圖像數(shù)據(jù)為VGA 640×480格式，輸出的圖像數(shù)據(jù)為XGA 1024×768格式。由于輸入圖像數(shù)據(jù)與輸出圖像數(shù)據(jù)在完整1幀中的每一行像素點和每一列的數(shù)量上之比都為5:8，因此可考慮對輸入的VGA信號作5:8的放大。先對數(shù)據(jù)在水平方向上進行插值放大，然后再進行垂直方向上的放大，設計中水平方向和垂直方向的插值放大均使用分級雙線性插值算法。

圖3 圖像縮放器模塊框圖

3.2.1分級雙線性插值 [3]

在雙線性插值算法中，插值點的值根據(jù)其相鄰的4個已知點計算得出，如圖4所示。

圖4 雙線性插值算法原理圖

已知a、b、c、d為輸入圖像內(nèi)的相鄰的4個點，其灰度值表示為f(x)。待插像素f點映射到原圖像后的坐標值小數(shù)部分為[m,n]。計算f點灰度值的過程如式(1)~式(3)所示：

f[g]=f[a]+m(f(b)-f(a)) (1)

f[h]=f[c]+m(f(d)-f(c)) (2)

f[f]=f[g]+m(f(h)-f(g))

=(1-m)(1-n)f(a)+m(1-n)f(b)+(1-m)nf(c)+mnf(d) (3)

分級雙線性插值使用的4個源圖像像素點都是待插值點的直接鄰點。插值的計算過程如下：

g(x)=(f(a)(m×N)+f(b)×(1-m)N)/N

其中，m與1-m分別是a點與b點的權值。因為是做5:8的轉換，這里取C=N=8，將原來為5個像素點的長度區(qū)間劃分為8個區(qū)間，每個區(qū)間都有m×N與(1-m)N這一對權值組成的整數(shù)對。每個區(qū)間內(nèi)部的待插值點都與該區(qū)間左邊界取同樣的值。8個區(qū)間的權值對應于(8,0)、(7,1)、(6,2)、(5,3)(4,4)、(3,5)、(2,6)和(1,7)。在確定好了點位置后，以查找表的方式寫入權值與位置之間的關系，最后可根據(jù)內(nèi)插點與臨近點的相對位置查找對應系數(shù)，并通過計算得出各像素點的灰階值。

3.2.2具體插值過程

3.2.2.1水平插值

將雙線性插值分解為水平和垂直方向進行，由于是把原圖像作5：8的放大，所以根據(jù)分級雙線性插值，把原水平方向的5個像素點采用分8級雙線性插值送入水平插值器。水平插值器由計數(shù)器與使能信號同時控制，每間隔5個時鐘，水平插值器使能端置于計算插值狀態(tài)，把進入的5個值進行一次插值變成新的8個像素點，之后再間隔5個時鐘，將新的值進入插值器進行插值,直到把1行640個像素點插值為1行1 024個像素點。

3.2.2.2 垂直插值

垂直插值器完成垂直方向5:8的轉換，即5行數(shù)據(jù)變?yōu)?行數(shù)據(jù)的轉換，插值過程是按垂直方向對原來的5行數(shù)據(jù)采用分8級雙線性插值,變換為新的8行數(shù)據(jù)。

完成水平插值的數(shù)據(jù)流水線型通過FIFO1與FIFO2模塊，期間將FIFO1與FIFO2的值送入垂直插值器進行插值，完成垂直插值后的數(shù)據(jù)送入FIFO3與FIFO4模塊，輸出順序排列在先的送入FIFO3，而另外一行數(shù)據(jù)進入FIFO4。FIFO3與FIFO4之間的數(shù)據(jù)也是流水線型進入到DDR2 SDRAM模塊中，整個過程通過使用狀態(tài)機對垂直插值進行控制，使經(jīng)過垂直插值后的數(shù)據(jù)能以正確的順序完成插值，并且送入DDR2 SDRAM模塊。把對原5行數(shù)據(jù)經(jīng)過水平和垂直插值變?yōu)?行數(shù)據(jù)的時間作為一個周期，直到完成整1幀VGA格式圖像到1幀XGA圖像的放大。

3.3 DDR2 SDRAM控制器模塊

控制器模塊的具體作用為：當SCALER完成圖像數(shù)據(jù)處理后，把圖像數(shù)據(jù)送進DDR2中儲存,在確保DDR2中存儲有2幀完整圖像時，DDR2的讀出端才開始讀取，從第一幀圖像地址讀取圖像數(shù)據(jù)，然后據(jù)根據(jù)時序控制從DDR2輸出。當讀完第一幀后，繼續(xù)讀取第二幀，此時第三幀繼續(xù)寫入原第一幀地址，之后的讀取寫入都按此過程進行。

由于DDR2 SDRAM不能同時寫入和讀出，所以需要DDR2 SDRAM控制器加以控制。可根據(jù)連接到DDR2 SDRAM模塊寫入端和讀出端的FIFO內(nèi)部已存數(shù)據(jù)數(shù)量進行讀寫控制。寫入端前的FIFO即為圖3的FIFO3。連接到DDR2讀出端的FIFO為圖3的FIFO2，它與輸出時序控制模塊共同完成最終所需XGA圖像的輸出。DDR2 SDRAM每次操作指令時，以1行數(shù)據(jù)為單位，即接受1次讀命令，則讀出1行數(shù)據(jù);同樣，接受1次寫入命令，則寫入1行數(shù)據(jù)，此1行數(shù)據(jù)同時為XGA格式的1行(1 024個像素點數(shù)據(jù))。

4 仿真與功能實現(xiàn)

在設計中，采用Verilog語言對各邏輯模塊進行編寫設計，在開發(fā)環(huán)境Quartus II 9.1和Modelsim-altera 6.5b下完成對各模塊的時序的仿真和功能的設計和驗證，如圖5所示為數(shù)據(jù)進入水平插值器后的仿真結果，水平插值把原5像素插為新8像素的仿真,其中pix為待插值的5個像素，data為插值后的8個新像素。

圖5 水平插值5像素插成8像素Modelsim仿真圖

經(jīng)過對各模塊設計的仿真,并且對各模塊功能驗證正確后，進行系統(tǒng)整體的仿真驗證，最終將處理完成圖像數(shù)據(jù)送到LCD上進行顯示，經(jīng)過放大后的示例如圖6 所示。仿真驗證表明，得到的圖像時序和數(shù)據(jù)與要求的時序一致，對于圖像數(shù)據(jù)來說雖然雙線性會對屏幕邊緣存在高頻分量的損失[4]，使輪廓稍有模糊，但是從圖像上對人眼觀看的影響很小。

圖6 經(jīng)過放大的ARM圖像信號在LCD上的顯示(XGA格式)

介紹了VESA標準中的VGA與XGA時序,通過FPGA平臺設計圖像縮放器，完成控制信號、時序信號和數(shù)據(jù)信號的同時輸入和控制，同時使用插值算法對分辨率進行放大，達到了對ARM圖像信號的擴展顯示。如要實現(xiàn)更多格式之間的轉換，可在程序寫入各種圖像格式縮放之間的算法，如VGA、XGA、SVGA等格式。在程序中利用狀態(tài)機實現(xiàn)不同格式之間的轉換和時序的控制，加強縮放的范圍，擴展其運用。