基于H.264的Exp-Golomb解碼器ASIC設(shè)計(jì)

時(shí)間：2011-09-21 10:18:47

關(guān)鍵字：解碼器 GO ASIC設(shè)計(jì) BSP

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]本文的研究目標(biāo)是設(shè)計(jì)H．264標(biāo)準(zhǔn)中的Exp-Golomb解碼器，在對其算法進(jìn)行深入探討的基礎(chǔ)上，提出了一種高效且低成本的ASIC實(shí)現(xiàn)方案。 Exp-Golomb編碼原理及解碼算法分析在H．264基本規(guī)范中，除了殘差變

本文的研究目標(biāo)是設(shè)計(jì)H．264標(biāo)準(zhǔn)中的Exp-Golomb解碼器，在對其算法進(jìn)行深入探討的基礎(chǔ)上，提出了一種高效且低成本的ASIC實(shí)現(xiàn)方案。

Exp-Golomb編碼原理及解碼算法分析

在H．264基本規(guī)范中，除了殘差變換系數(shù)采用CAVLC編碼方式外，其它句法元素均使用Exp-Golomb編碼。Exp-Golomb編碼是一種有規(guī)則的變長編碼方式，在各類視頻編碼標(biāo)準(zhǔn)中被廣泛應(yīng)用。Exp-Golomb編碼基于符號的概率統(tǒng)計(jì)進(jìn)行編碼，用短碼字來表示出現(xiàn)概率高的信息，用長碼字來表示出現(xiàn)概率低的信息，碼長與被編碼數(shù)成指數(shù)對應(yīng)關(guān)系，從而使總體平均碼字最短。與定長編碼方式相比，節(jié)省了大量存儲空間。

在H．264中采用的是0階Exp-Golomb編碼，編碼規(guī)則如圖1所示。

Exp-Golomb碼字的邏輯結(jié)構(gòu)為：[M zeros][1][INFO]。其中M個(gè)0和中間的1稱為前綴，INFO是M位的信息值，因此，每個(gè)Exp-Golomb碼字的長度都為2M+ 1。每個(gè)索引字codenum經(jīng)過編碼都可以對應(yīng)一個(gè)如上結(jié)構(gòu)的碼字，它們之間的關(guān)系是：

codenum=2M+INFO-1 (1)

由式1可知，進(jìn)行Exp-Golomb解碼可先探測出碼字前連續(xù)O的個(gè)數(shù)，再取出后綴，經(jīng)該公式計(jì)算即可得到codenum值。在H．264中存在四種Exp-Golomb碼：無符號型ue(v)、有符號型se(v)、映射型me(v)和截?cái)嘈蛅e(v)。因此，對于解出的codenum值，根據(jù)句法元素類型的不同有四種映射方式，如表2所示。根據(jù)相應(yīng)描述完成映射后，輸出syntax即為解碼值。

Exp-Golomb解碼器硬件結(jié)構(gòu)設(shè)計(jì)

基于以上解碼算法設(shè)計(jì)的Exp-Golomb解碼器硬件結(jié)構(gòu)如圖1所示。整個(gè)系統(tǒng)主要由以下模塊組成：輸入碼流緩沖移位模塊、碼長檢測模塊、 codenum生成模塊以及句法元素映射模塊。系統(tǒng)上電復(fù)位后，首先由碼流緩沖移位模塊提供待解碼字，然后由碼長檢測模塊中的首一檢測器探測出連續(xù)0 的個(gè)數(shù)，即時(shí)計(jì)算得出當(dāng)前碼長送至累加器。同時(shí)，首一檢測的結(jié)果和待解碼字一起送至codenum計(jì)算模塊，經(jīng)移位、相減得到codenum值。最后將 codenum送至四個(gè)映射單元處理，最終解碼句法元素由選擇器輸出至寄存器。整個(gè)解碼流程用一個(gè)時(shí)鐘周期完成。下文將詳細(xì)敘述各功能子模塊的硬件結(jié)構(gòu)。

輸入碼流緩沖移位模塊

        輸入碼流緩沖移位模塊是實(shí)現(xiàn)H．264實(shí)時(shí)解碼的關(guān)鍵模塊。由于在每個(gè)變長解碼流程中，碼長不可能事先確定，所以在解出碼值的同時(shí)必須定位下一個(gè)碼字。這就要求該模塊具有快速響應(yīng)和并行輸出的特點(diǎn)。由于H．264中定義Exp-Golomb碼最大碼長不超過32，設(shè)計(jì)中采用兩個(gè)32位寄存器，一個(gè)32位桶形移位器及一個(gè)累加器的組合來實(shí)現(xiàn)該功能，如圖1左端所示。其中，寄存器Rn負(fù)責(zé)從外部模塊讀取數(shù)據(jù)，并和寄存器R1一起作為桶形移位器的輸入；在每個(gè)解碼周期，桶形移位器移出已解碼流的同時(shí)還要裝載新的待解碼流；而累加器則計(jì)數(shù)已處理碼長，傳送桶形移位器移位長度，判斷并控制R0的讀取和R1的更新。這樣就為后續(xù)處理單元提供了連續(xù)不間斷的碼流。

碼長檢測模塊

        該模塊的主要組成部件是一個(gè)16位的首一檢測器，其功能是檢測出輸入序列中第一個(gè)1之前連續(xù)0的個(gè)數(shù)。碼長(2M+1)的獲取只需將首一檢測的結(jié)果與一個(gè)1位進(jìn)行位拼接即可實(shí)現(xiàn)，無需額外電路。另外，考慮到響應(yīng)速度和路徑延時(shí)，首一檢測器的設(shè)計(jì)采用分組并行探測方式，其硬件結(jié)構(gòu)如圖2所示。輸入的16位碼流分成4組，每組4位均通過一個(gè)4輸入與門，得到4位輸出信號后送至優(yōu)先編碼器1，從而判斷出首1所在區(qū)間。同時(shí)與門的四個(gè)輸出還作為選擇器MUX的控制信號，片選出存在首1的4位數(shù)據(jù)，并將其送至優(yōu)先編碼器2，判斷出首1的具體位置。最后將兩個(gè)編碼器的輸出進(jìn)行位拼接即可得到首 1前連續(xù)O的個(gè)數(shù)M。

codenum計(jì)算模塊和句法元素映射模塊

        codenum計(jì)算模塊用于實(shí)現(xiàn)公式1的功能，設(shè)計(jì)中采用一個(gè)16位的桶形移位器結(jié)合一個(gè)16位減法器實(shí)現(xiàn)。桶形移位器根據(jù)首一檢測結(jié)果，重新定位碼流指針，正確輸出碼字中[1][INFO]部分，最后將[1][INFO]減去1即可得到codenum值。

        關(guān)于句法元素映射模塊，由于H．264中定義了四種：Exp-Golomb碼，如前文表2所描述，存在四種不同的映射方式，本設(shè)計(jì)中采用四塊組合映射邏輯加一個(gè)多選器實(shí)現(xiàn)，具體結(jié)構(gòu)如圖1右端所示。其中ue直接等于codenum，se與te的映射則分別采用包含二選一電路的簡單組合邏輯實(shí)現(xiàn)，而me的實(shí)現(xiàn)較復(fù)雜，需查找H．264標(biāo)準(zhǔn)中定義的運(yùn)動矢量、量化參數(shù)的映射表格，設(shè)計(jì)中采用ROM結(jié)構(gòu)實(shí)現(xiàn)查表。

綜合、仿真結(jié)果與性能分析

        在上述硬件架構(gòu)下，使用Verilog HDL進(jìn)行Exp-Golomb解碼器電路設(shè)計(jì)，并在Xilinx公司的ISE 8．2開發(fā)環(huán)境下進(jìn)行了功能驗(yàn)證，選擇Virtex 2系列的XC2V250器件。使用Synplify 7．7軟件進(jìn)行邏輯優(yōu)化與綜合，系統(tǒng)時(shí)鐘頻率可達(dá)104MHz。ISE完成布局布線后，通過ModelSim 5．8調(diào)用JM86生成的測試向量進(jìn)行后仿真，最后與軟件的計(jì)算結(jié)果相比較，驗(yàn)證了設(shè)計(jì)的正確性。

        使用Synopsys公司的Design Compiler工具在0．18μm的SIMC CMOS工藝條件下，對RTL代碼進(jìn)行綜合優(yōu)化，時(shí)鐘頻率最高可以達(dá)到200MHz。通過設(shè)置不同的面積、時(shí)序及功耗約束條件，縮短關(guān)鍵路徑的延時(shí)，綜合出等效門數(shù)2276門、時(shí)鐘頻率為162MHz的最優(yōu)設(shè)計(jì)。在此工作頻率下，該Exp-Golomb硬件解碼器電路解出一個(gè)句法元素只需耗用單個(gè)時(shí)鐘周期，因此本設(shè)計(jì)可滿足H．264高清晰度視頻實(shí)時(shí)解碼的要求。

結(jié)語

本文在分析H．264標(biāo)準(zhǔn)中Exp-Golomb解碼算法的基礎(chǔ)上，提出了一種高效、省面積的Exp-Golomb解碼器架構(gòu)。在Xilinx公司的 ISE 8．2開發(fā)環(huán)境下使用Virtex 2平臺對設(shè)計(jì)進(jìn)行了驗(yàn)證，使用Synopsys公司的DC工具在SMIC 0．18μm CMOS工藝條件下，對設(shè)計(jì)進(jìn)行了面積和時(shí)間的優(yōu)化，在162MHz時(shí)鐘頻率下工作時(shí)，電路等效門數(shù)為2276門，達(dá)到了預(yù)期目標(biāo)，為下一步工作打下了良好的基礎(chǔ)。