基于小波變換的視頻圖像壓縮算法研究

時(shí)間：2009-04-08 13:15:37

關(guān)鍵字：小波變換算法研究視頻圖像壓縮算法視頻圖像壓縮算法基于小波

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]l 引言隨著網(wǎng)絡(luò)和多媒體技術(shù)的迅速發(fā)展，特別是3G技術(shù)的逐漸普及，多媒體信息特別是視頻圖像信息將越來越豐富。對(duì)數(shù)據(jù)量龐大的視頻圖像信息進(jìn)行壓縮是非常必要的，因此視頻圖像的壓縮也一直吸引著廣大研究者進(jìn)

l 引言
隨著網(wǎng)絡(luò)和多媒體技術(shù)的迅速發(fā)展，特別是3G技術(shù)的逐漸普及，多媒體信息特別是視頻圖像信息將越來越豐富。對(duì)數(shù)據(jù)量龐大的視頻圖像信息進(jìn)行壓縮是非常必要的，因此視頻圖像的壓縮也一直吸引著廣大研究者進(jìn)行不斷深入的探索。
小波變換具有良好的時(shí)、頻局域性，并且由于其在非平穩(wěn)圖像信號(hào)分析方面的靈活性和適應(yīng)人眼視覺特性的能力，已經(jīng)成為圖像編碼的有力工具。應(yīng)用三維小波變換進(jìn)行視頻壓縮編碼，需考慮選用時(shí)、空域2組小波濾波器組。時(shí)域選用階數(shù)較低的濾波器組，而空域的濾波器組的選擇與靜止圖像變換編碼相似，常用的是雙正交D 9／7濾波器組，但是它的計(jì)算量較大，因此采用提升方法來實(shí)現(xiàn)，并且對(duì)提升格式的參數(shù)進(jìn)行調(diào)整，可進(jìn)一步減少運(yùn)算量。

2 基于提升格式的三維小波變換的視頻編碼系統(tǒng)
本文采用的視頻編碼系統(tǒng)主要是由三維小波變換、量化、熵編碼和碼流組裝4個(gè)部分組成，如圖1所示。設(shè)圖像序列有M×N×L個(gè)像素，M，N分別為圖像的列、行數(shù)，L為一組中的幀數(shù)。首先，對(duì)輸入的L幀圖像進(jìn)行三維提升型小波變換。然后用基于HVS的視覺閾值曲線對(duì)各個(gè)子帶的小波系數(shù)進(jìn)行量化，且把每個(gè)子帶進(jìn)一步分成固定大小的塊。之后對(duì)每個(gè)子塊進(jìn)行位平面熵編碼，并得到各塊的率失真曲線。最后，在碼流組裝過程中進(jìn)行碼流分配。該系統(tǒng)的解碼過程就是其逆過程。

3 算法實(shí)現(xiàn)
(1)小波分解：本文采用提升型小波變換對(duì)視頻信號(hào)進(jìn)行3級(jí)的三維小波分解得到垂直、水平和幀方向的三維小波子帶。得到一個(gè)低頻分辨率的圖像逼近LLL3和代表不同分辨率、不同方向上的視頻序列細(xì)節(jié)信息的高頻三維小波子帶(LHHm，LHLm，LLHm，HLHm，HHLmHHHm，HLLm，其中m表示級(jí)數(shù)，即m=1，2，3)。低頻子帶LLLm代表視頻序列時(shí)間軸方向的上下文信息，包含圖像大部分的能量，需重點(diǎn)保護(hù)。對(duì)于時(shí)間軸上的高頻子帶采用本文的閾值量化法進(jìn)行量化。時(shí)間軸低頻子帶的能量要高于高頻子帶，當(dāng)運(yùn)動(dòng)劇烈時(shí)，經(jīng)小波分解后的時(shí)間軸高頻子帶內(nèi)的系數(shù)會(huì)急劇增大，會(huì)影響算法的整體壓縮效果，而時(shí)間軸低頻子帶其積聚了圖像信息的大部分能量，所以不能引入太大的失真。
(2)基于HVS的閾值量化：本文采用的量化方法是利用視覺門限曲線與小波系數(shù)的關(guān)系來構(gòu)造單位小波變換系數(shù)的量化矩陣?？臻g變換小波是雙正交D 9／7濾波器組，文獻(xiàn)中給出圖像壓縮中最佳小波基D 9／7閾值量化因子矩陣，以該矩陣為基礎(chǔ)推斷三維小波變換系數(shù)的量化矩陣。當(dāng)視頻圖像序列中物體的運(yùn)動(dòng)變化很快時(shí)，在三維小波變換系數(shù)時(shí)間軸上的高頻子帶中會(huì)產(chǎn)生較大的系數(shù)值，其量化后的數(shù)值依然很大，所以采用如下量化方法。在量化中設(shè)立一個(gè)閾值T，以小波分解系數(shù)的均方誤差作為判斷準(zhǔn)則，設(shè)量化矩陣為Q，對(duì)系數(shù)按照下式量化：

其中R為量化步長(zhǎng)。具體過程為：設(shè)PD是1個(gè)比特位，當(dāng)M≤TPD=1時(shí)，輸出碼流中輸出一位PD=0，則解碼器以量化矩陣Q對(duì)輸入碼流進(jìn)行反量化；當(dāng)M>T時(shí)，輸出碼流中輸出PD=1，然后輸出量化步長(zhǎng)R，用2個(gè)字節(jié)來表示，則解碼器以量化矩陣Q(1+R)對(duì)輸入碼流進(jìn)行反量化。
(3)熵編碼：量化后的每個(gè)子帶被進(jìn)一步分成固定大小的塊，并對(duì)每個(gè)子塊采用位平面技術(shù)分別進(jìn)行熵編碼。嵌入式位平面編碼器按照位平面從最高有效位N一1～0降序地進(jìn)行編碼，因此在截取壓縮碼流時(shí)，先保證所有系數(shù)的最高有效位平面的優(yōu)先傳輸，保證碼流的解碼質(zhì)量。在每個(gè)編碼之后都同時(shí)記錄當(dāng)前編碼的碼率R和對(duì)應(yīng)的失真D，得到的率失真曲線將用于后面的碼流組裝。
(4)碼流組裝：在所有的系數(shù)塊完成編碼后，根據(jù)最小化全局失真的原則用碼流組裝對(duì)各個(gè)塊的碼流進(jìn)行碼率分配。原始的碼率控制方法采用全局最優(yōu)的碼率控制，會(huì)導(dǎo)致幀方向上質(zhì)量的顫抖。本文結(jié)合率失真優(yōu)化和幀方向上質(zhì)量平穩(wěn)2方面的要求，沿幀方向上采用新的碼率分配方法，同時(shí)在沿水平和垂直方向上保持了率失真優(yōu)化的方法。即對(duì)于同一時(shí)間軸小波子帶的分塊都采用同一斜率來選取截?cái)帱c(diǎn)；對(duì)于不同時(shí)間軸小波子帶的分塊，按照不同的斜率來截?cái)嘁哉{(diào)整時(shí)間軸方向的穩(wěn)定性?？梢愿鶕?jù)式(2)的失真比例條件來調(diào)整截?cái)帱c(diǎn)的斜率。

在中高碼率環(huán)境下，各時(shí)間軸子帶的衰減系數(shù)βn近似相等，因此可以簡(jiǎn)單的依照下等式通過控制各時(shí)間軸子帶的率失真斜率來控制失真的比例。

此處δi為等式(2)給出的理論失真值，m為時(shí)間軸的小波子帶個(gè)數(shù)。
前面的熵編碼過程中已經(jīng)計(jì)算并保存了每個(gè)塊的率失真曲線。為了使先傳輸?shù)拇a率對(duì)信息失真度的降低最快，需要保證率失真的凸性，因此按照文獻(xiàn)中方法對(duì)每個(gè)塊的率失真曲線采取凸包絡(luò)處理。每個(gè)塊的失真根據(jù)所處的小波子帶乘上一個(gè)能量權(quán)重，以利用小波域的失真估計(jì)圖像空域的失真：

此處w表示提升型小波合成濾波器帶來的能量增益。對(duì)于雙正交D9／7濾波器，低通增益wL=1．299，高通增益為wH=0．787。在三維方向上共經(jīng)過n個(gè)低通和m個(gè)高通提升型濾波器的小波子帶，能量增益為各層增益的乘積叫=wnLwmH。
對(duì)所有的塊的率失真曲線，找出聯(lián)合最優(yōu)的率失真斜率點(diǎn)，并將碼流在該點(diǎn)截?cái)啵缓髮⑺袎K中在同一斜率切點(diǎn)截?cái)嗟玫降拇a流片斷組合成最終的壓縮碼流。最優(yōu)斜率能夠得出最接近目標(biāo)碼率的公共斜率，每個(gè)系數(shù)塊的截?cái)啻a率長(zhǎng)度也作為頭信息記錄在壓縮碼流中，作為對(duì)壓縮碼流隨機(jī)解碼時(shí)的索引。

4 實(shí)驗(yàn)結(jié)果
本文利用上述的視頻編碼方法對(duì)QCIF格式的標(biāo)準(zhǔn)視頻序列Foreman和Akiyo序列進(jìn)行壓縮編碼，每幀176×144的像素，全長(zhǎng)300幀，幀率為每秒30幀。在編解碼過程中，取L=6幀為一組進(jìn)行三維小波變換?？蓪oreman和Akiyo序列分別壓縮到0．4 bpp和O．1 bpp。根據(jù)式(2)可計(jì)算出時(shí)間軸平穩(wěn)條件下各級(jí)D 9／7濾波器的理論時(shí)間軸R—D斜率比例，來控制時(shí)間軸率失真截?cái)嘈甭省?br /> 比較該編碼算法和MPEG一4的VM 16．O版本的性能。對(duì)于Foreman，其優(yōu)于采用“IPP…”GOP結(jié)構(gòu)的MPEG一4平均O．3 dB；其平均壓縮質(zhì)量Akiyo與相近。如圖2所示，其中“一”代表本文中算法，“▲”代表“IPP…”GOP結(jié)構(gòu)的MPEG一4。Foreman序列與Akiyo序列如圖2所示。

由圖2可以看出，新的視頻圖像編碼方法對(duì)于像Foreman這樣圖像背景比較復(fù)雜，且場(chǎng)景中的物體運(yùn)動(dòng)較大的圖像，該方法仍能在較大的壓縮比下得到重建質(zhì)量良好的視頻圖像，對(duì)于這種大部分區(qū)域的運(yùn)動(dòng)很少，時(shí)間軸上的顫抖不是很明顯，可以保持三維小波變換編碼的特點(diǎn)，在高的壓縮比之下重建圖像仍然能夠得到較高的圖像質(zhì)量。這說明本文所提出的方法是有所改進(jìn)的，特別是對(duì)于運(yùn)動(dòng)變化較快的圖像。
    根據(jù)文獻(xiàn)提出的視頻序列質(zhì)量的評(píng)價(jià)方法，對(duì)Foreman和Akiyo這2段視頻序列圖像分別采用本文中的算法和MPEG一4的VM 16．O“IPP…”GOP結(jié)構(gòu)重建后的圖像序列進(jìn)行評(píng)價(jià)。下面分別給出視頻清晰度和流暢度評(píng)價(jià)結(jié)果。
    (1)根據(jù)1段視頻清晰度的評(píng)價(jià)公式，可得新算法和GOP結(jié)構(gòu)對(duì)Foreman重建后的視頻清晰度分別為27．37和28．64；Akiyo的視頻清晰度分別為32．44和29．61。從視覺效果來看，新算法重建后的視頻序列的清晰度還是較好，且Akiyo的清晰度更好。
    (2)根據(jù)一段視頻流暢性指標(biāo)的評(píng)價(jià)公式，可得新算法和GOP結(jié)構(gòu)對(duì)視頻序列Foreman的流暢度10．56和12．13；Akiyo的原始和重建后的視頻流暢度8．87和9．11。從視覺效果來看，新算法重建后的視頻序列具有很好的流暢性，特別是對(duì)于Foreman序列。

5 結(jié) 語(yǔ)
本文利用視覺特性曲線對(duì)三維小波變換后的系數(shù)進(jìn)行量化，采用具有時(shí)間軸穩(wěn)定性的碼率控制方法，通過控制各小波時(shí)間軸子帶的失真比例來分配碼率，均衡控制解碼后時(shí)間軸信號(hào)的失真。實(shí)驗(yàn)結(jié)果表明，該方法的運(yùn)算復(fù)雜度低，有效降低存儲(chǔ)空間并提高運(yùn)算速度。而且該編碼器壓縮的視頻具有良好的時(shí)間軸平穩(wěn)性，因而更加適合用戶的視覺要求。同時(shí)，對(duì)于以往小波編碼中質(zhì)量較差的一些幀，壓縮質(zhì)量有所提高。