基于FPGA的HDTV視頻圖像灰度直方圖統(tǒng)計(jì)算法設(shè)計(jì)
引言
隨著HDTV 的普及,以LCD-TV 為主的高清數(shù)字電視逐漸進(jìn)入蓬勃發(fā)展時(shí)期。與傳統(tǒng)CRT 電視不同的是,這些高清數(shù)字電視需要較復(fù)雜的視頻處理電路來(lái)驅(qū)動(dòng),比如:模數(shù)轉(zhuǎn)換(A/D Converter)、去隔行(De-interlacer)、視頻縮放(Scaler)和視頻圖像增強(qiáng)(Video Enhancement)等等。由于HDTV 的帶寬較高,720p 信號(hào)(1280×720?Hz)的像素速率達(dá)到74MHz,因此針對(duì)HDTV 的視頻處理算法需要更高性能的器件。采用大規(guī)模高工藝的ASIC 芯片是目前這個(gè)問(wèn)題的主要解決方案,Pixelworks、Genesis 等公司均推出了基于大規(guī)模ASIC 的解決方案。但是,隨著FPGA 工藝的不斷改善,其性價(jià)比與日俱增,尤其是Xilinx、Altera 等廠商紛紛采用90nm 工藝量產(chǎn)后,其價(jià)格不斷降低,Xilinx 最新推出的Spartan-3E系列FPGA 120 萬(wàn)門的售價(jià)只有9 美元,已經(jīng)在小量產(chǎn)品的IC 設(shè)計(jì)中開(kāi)始替代結(jié)構(gòu)化ASIC,在數(shù)字高清電視這類價(jià)格敏感型消費(fèi)類電子產(chǎn)品中也開(kāi)始大量采用。
本文介紹了如何在FPGA 中利用Block RAM 的特殊結(jié)構(gòu)實(shí)現(xiàn)HDTV 視頻增強(qiáng)算法中灰度直方圖統(tǒng)計(jì)。
灰度直方圖統(tǒng)計(jì)
灰度直方圖統(tǒng)計(jì)是圖像處理過(guò)程中很常用的一個(gè)步驟,簡(jiǎn)單來(lái)講,就是對(duì)一幅圖像各個(gè)灰度的像素進(jìn)行計(jì)數(shù),得到一張灰度分布表。例如,8 位量化的灰度圖像統(tǒng)計(jì)結(jié)果就是256個(gè)值,分別代表0-255 每個(gè)灰度像素的數(shù)量,如圖1 所示為L(zhǎng)ena 圖像的灰度直方圖統(tǒng)計(jì)結(jié)果。直方圖是分析一幅圖像亮度分布特性有力的工具,根據(jù)它的結(jié)果可以進(jìn)行諸如灰度拉伸、自動(dòng)對(duì)比度、動(dòng)態(tài)伽馬調(diào)整等操作。
圖1 Lena 圖像的灰度直方圖統(tǒng)計(jì)
FPGA算法統(tǒng)計(jì)
在計(jì)算機(jī)或者DSP 上實(shí)現(xiàn)直方圖統(tǒng)計(jì)時(shí),我們通常會(huì)使用數(shù)組結(jié)構(gòu),即在內(nèi)存中開(kāi)辟一個(gè)整數(shù)數(shù)組來(lái)進(jìn)行計(jì)數(shù),但是在FPGA 中定義數(shù)組是非常消耗資源的,尤其是當(dāng)數(shù)組成員的位寬很大時(shí)。例如用觸發(fā)器來(lái)統(tǒng)計(jì)256 灰度的720p 圖像的直方圖,將消耗4000 個(gè)邏輯單元(每個(gè)邏輯單元是一個(gè)四輸入查找表),這幾乎消耗了一個(gè)Spartan-3E 25 萬(wàn)門器件(XC3S250E)80%的邏輯資源。
幸運(yùn)的是,F(xiàn)PGA 器件提供了一個(gè)很好的結(jié)構(gòu)可以處理這類問(wèn)題,這就是Block RAM。在Altera 和Xilinx 的各型號(hào)FPGA 器件上都集成了一種稱為Block RAM 的片上內(nèi)存,它們以若干Kbits 為一塊,不同型號(hào)集成不同數(shù)量的塊,例如在Spartan-3E 系列中以18Kbits 為一塊,在規(guī)模最小的型號(hào)XC3S100E 上集成了4 塊這樣的內(nèi)存,如圖2 所示:
圖2 Spartan-3E 系列FPGA 集成的Block RAM
這種內(nèi)存很容易實(shí)現(xiàn)數(shù)組類型的結(jié)構(gòu),而且這種內(nèi)存被設(shè)計(jì)成雙端口方式,即可以用兩組獨(dú)立的地址數(shù)據(jù)總線來(lái)讀寫,因此可以用不到一塊的Block RAM 就實(shí)現(xiàn)256×24 這樣的高位寬計(jì)數(shù)器陣列來(lái)進(jìn)行HDTV 視頻圖像的直方圖統(tǒng)計(jì),如圖3 所示:
圖3 用Block RAM 實(shí)現(xiàn)計(jì)數(shù)器陣列
以Block RAM 的結(jié)構(gòu)為核心,按照以下幾點(diǎn)來(lái)設(shè)計(jì)直方圖統(tǒng)計(jì)算法:
1. Block RAM 使用雙端口方式,端口A 用來(lái)將內(nèi)存單元計(jì)數(shù)值讀出,端口B 將計(jì)數(shù)值加一后寫回該內(nèi)存單元。
2. 內(nèi)存的地址在像素有效時(shí)由像素灰度值選擇,在行同步期間不計(jì)數(shù),在場(chǎng)同步期間使用一個(gè)遞增計(jì)數(shù)器在前256 個(gè)時(shí)鐘將統(tǒng)計(jì)結(jié)果輸出,在之后的256 個(gè)時(shí)鐘將RAM 塊清零。 3. 雙端口讀寫時(shí)鐘相位相差180 度,以避免雙端口讀寫沖突。
4. 數(shù)據(jù)的讀出、加一和寫入采用了流水線結(jié)構(gòu)以提高性能,所以在地址控制上要進(jìn)行適當(dāng)暫存以保證數(shù)據(jù)同步。
圖4 為256 級(jí)灰度720p 視頻圖像直方圖統(tǒng)計(jì)的算法實(shí)現(xiàn)功能框圖:
圖4 用FPGA 的Block RAM 實(shí)現(xiàn)直方圖統(tǒng)計(jì)
結(jié)語(yǔ)
該算法借助FPGA 片上的高性能Block RAM(讀寫速度可以到200 兆以上),可以實(shí)現(xiàn)SMPTE 定義的從720p 到1080p 的各種HDTV 視頻圖像的實(shí)時(shí)直方圖統(tǒng)計(jì),僅占用FPGA不到一百個(gè)邏輯單元和一塊Block RAM,是一種性價(jià)比較高的FPGA 實(shí)現(xiàn)直方圖統(tǒng)計(jì)的算法,而且該算法具有很好的通用性,可以應(yīng)用到各
種需要大量高位寬計(jì)數(shù)器的高速FPGA設(shè)計(jì)中。
參考文獻(xiàn):
1. Xilinx,Spartan-3E FPGA datasheet,2005.3
2. Xilinx,Using Block RAM in Spartan-3 Generation FPGAs,2005.3