一種基于小波變換的新型壓縮編碼模型
引言
信息是現(xiàn)代社會(huì)的主要特征,而人們傳遞信息的重要媒介是圖像。隨著社會(huì)經(jīng)濟(jì)的發(fā)展,科學(xué)技術(shù)的不斷進(jìn)步,信息視覺(jué)化技術(shù)越來(lái)越受到人們的重視。數(shù)據(jù)量大是數(shù)字圖像的一個(gè)顯著特點(diǎn),一幅具有中等分辨率(640 × 480)的彩色(24bit/象素)數(shù)字圖像的數(shù)據(jù)量約為737Mbit。這給數(shù)字圖像的傳輸帶來(lái)很人的困難。因此,圖像處理及數(shù)據(jù)壓縮對(duì)現(xiàn)代化社會(huì)的發(fā)展起著不可忽視的作用。利用圖像壓縮編碼技術(shù),在原有圖像損失一定精度(即有損圖像壓縮編碼)或不損失任何精度(即無(wú)損圖像壓縮編碼)的情況下,將原有圖像用比原始數(shù)據(jù)量少得多的數(shù)據(jù)將其表示出來(lái),以提高圖像的存儲(chǔ)效率和傳輸效率,既是當(dāng)代信息高速公路、高清晰度電視(HDTV)、可視電話、圖文傳真等技術(shù)的關(guān)鍵,又在航空偵察遙感、資源勘探及生物醫(yī)學(xué)工程等領(lǐng)域起著非常重要的作用。
小波變換壓縮編碼的現(xiàn)狀及當(dāng)前的研究存在的問(wèn)題
小波分析是近年來(lái)發(fā)展起來(lái)的一門(mén)新興的數(shù)學(xué)分析理論,其應(yīng)用范圍包括數(shù)學(xué)領(lǐng)域本身的許多學(xué)科,利用小波變換的理論實(shí)現(xiàn)圖像的壓縮編碼已經(jīng)從九十年代初起得到了廣泛與深入地研究,并逐漸成為圖像壓縮編碼領(lǐng)域的一個(gè)重要分支。小波變換的優(yōu)越之處在于它在時(shí)域和頻域同時(shí)具有良好的局部化性質(zhì),從而可以更加有效地刻劃信號(hào)的特征。對(duì)于圖像而言,如果從能量的角度來(lái)看,其大部分能量一般集中在低頻部分,并且其頻帶較窄,而其余少部分能量則集中在高頻部分,其所占頻帶較寬。對(duì)于高頻部分的能量,其中的大部分又則是由圖像中的邊緣或細(xì)節(jié)產(chǎn)生的。因此,一種有效的變換編碼技術(shù)應(yīng)該具有這樣的特性,即圖像通過(guò)變換后,其能量應(yīng)主要集中在少部分的低頻系數(shù)上,大部分高頻系數(shù)只占有少量能量,而占高頻中的能量應(yīng)該減小,這是圖像變換編碼的一個(gè)基本的要求。小波變換恰好提供了這樣的特性,從而可以較好地適應(yīng)圖像的固有特性,對(duì)圖像進(jìn)行有效地分解、表征與編碼。
盡管小波變換圖像壓縮編碼算法具有結(jié)構(gòu)簡(jiǎn)單、無(wú)需仟何圳練、支持多碼率、壓縮比較大、圖像復(fù)原質(zhì)量較理想等特點(diǎn),但任不同程度上存在壓縮與解壓縮速度慢、圖像復(fù)原質(zhì)量不理想等問(wèn)題,為了進(jìn)一步改善此算法的工作效率,需要解決以下兩個(gè)主要問(wèn)題。首先是正交小波基的選擇問(wèn)題。正交小波基的選取對(duì)圖像壓縮效果有很火的影響。在實(shí)際應(yīng)用中,由于可供選擇的正交小波基很多,如何做出恰當(dāng)?shù)倪x擇是一個(gè)難題。理論和實(shí)踐表明,理想的止交小波基應(yīng)該具有下列性質(zhì):1、線性相位特件—能減少或消除重構(gòu)圖像在邊緣處的失真;2、緊支集特性—支集越短,小波變換的計(jì)算復(fù)雜度越低,便于快速實(shí)現(xiàn);3、消失矩特性—即,一般米說(shuō),k越大,小波變換后能量越集中出現(xiàn)任低頻,而在其他子帶中,會(huì)出現(xiàn)更多的0,便于提高壓縮比。根據(jù)當(dāng)前研究得知,有緊支集的正交小波基除Haar系以外,其他都不具備線性相位特性。為了保持該特性,可放棄正交性而采用具有緊支集的雙正交小波。其次是數(shù)據(jù)向量量化編碼算法的優(yōu)化問(wèn)題在整個(gè)圖像壓縮過(guò)程中,對(duì)小波系數(shù)進(jìn)行向量量化編碼會(huì)直接影響圖像的壓縮效果。同時(shí),由于應(yīng)用層面的需要,目前,常用的數(shù)據(jù)向量量化編碼算法如零樹(shù)編碼算法等運(yùn)算時(shí)間長(zhǎng),運(yùn)算量大等特點(diǎn)。使它不易于實(shí)時(shí)系統(tǒng)的實(shí)現(xiàn),嚴(yán)重限制應(yīng)用的范圍。而且也有不同程度地存在運(yùn)算復(fù)雜、重構(gòu)復(fù)原圖像效果不理想等問(wèn)題。因此,亟需尋找優(yōu)秀的向量量化算法。 此外,對(duì)活動(dòng)圖像和網(wǎng)絡(luò)版的圖像壓縮編碼的研究以及對(duì)人眼視覺(jué)特性的充分利用等研究也是小波變換圖像壓縮編碼領(lǐng)域亟待解決的問(wèn)題。圖像在傳輸中往往含有的噪聲,如果通過(guò)壓縮編碼后,有利于噪聲的去處,或者在解壓縮時(shí),加入對(duì)圖像的去噪環(huán)節(jié),并且把這個(gè)環(huán)節(jié)融入解壓編碼的過(guò)程也是當(dāng)前研究的熱點(diǎn)之一。
嵌入式零樹(shù)編碼
嵌入式零樹(shù)編碼方法(Embedded Zerotree Wavelets Encoding)是1993年由美國(guó)學(xué)者Jerome M.Shapiro首先完整地提出的基于比特連續(xù)逼進(jìn)的圖像編碼方法。它的思想來(lái)源于對(duì)自然圖像的觀察和理解。自然圖像具有兩個(gè)特征:第一,自然圖像通常具有相對(duì)重要的低頻信號(hào),當(dāng)一幅圖像進(jìn)行小波分解后,圖像的能量集中在相對(duì)低頻的了帶內(nèi),所以低頻子帶的小波系數(shù)往往要大十高頻子帶內(nèi)相關(guān)位置的小波系數(shù);第二,絕對(duì)值人的小波系數(shù)對(duì)圖像的影響要大于絕對(duì)值小的小波系數(shù)。同時(shí),在圖像小波系數(shù)經(jīng)過(guò)量化后,會(huì)出現(xiàn)大面積的零系數(shù),因此,怎樣用最少的符號(hào)來(lái)表示這些零系數(shù)的位置,則是圖像編碼提高壓縮比的關(guān)鍵,Shapiro的嵌入式零樹(shù)編碼的優(yōu)點(diǎn)是只要記住零樹(shù)根的位置,就可記住零樹(shù)結(jié)構(gòu)中所有零系數(shù)的位置。所以它可以極人提高壓縮比。正因?yàn)槿绱?,現(xiàn)在的零樹(shù)編碼已經(jīng)成為新的圖像編碼國(guó)際標(biāo)準(zhǔn)JPEG2000的一個(gè)組成部分。通過(guò)實(shí)踐發(fā)現(xiàn),如果按一定的順序扣描,則零樹(shù)根會(huì)更容易連續(xù)出現(xiàn);同時(shí),如果我們可以采用多種編碼的方法來(lái)表示這些連續(xù)出現(xiàn)的零樹(shù)根,就可以進(jìn)一步地提高圖像編碼的壓縮比和信噪比。
圖像數(shù)據(jù)經(jīng)過(guò)小波分解以后,得到塔式的數(shù)據(jù)結(jié)構(gòu),由圖像的了帶分解可知,按水平方向和垂直方向頻率的高低(低頻為L(zhǎng),高頻為H),對(duì)第n層分解,每層可以劃分為4個(gè)子帶,分別表示第n分解層的低頻子帶、垂直子帶、水平子帶和高頻子帶,各分辨率下的子帶圖像系數(shù)域?qū)D像信號(hào)而言有著不同的重要性。由于正交小波變換能有效去除圖像系數(shù)的相關(guān)性,使得無(wú)論是在同一分解層或是在不同的分解層小波系數(shù)的線性相關(guān)性均非常的小,但不同的分解層內(nèi)系數(shù)幅值之間仍然存在明顯的相關(guān)性,相關(guān)性主要表現(xiàn)在小尺度上(低分解層)的小波系數(shù)往往不大于在較大尺度的相同空間位置的小波系數(shù),零樹(shù)就是基于此種系數(shù)幅值的相關(guān)性而提出的一種新型的數(shù)據(jù)結(jié)構(gòu),通過(guò)零樹(shù)結(jié)構(gòu),可以充分利用小波域各子圖像的特點(diǎn)有效地表示數(shù)據(jù)。
零樹(shù)結(jié)構(gòu)的定義為:對(duì)于給定的閾值T,如果小波系數(shù)X
新的壓縮編碼結(jié)構(gòu)流程
不論什么樣的壓縮編碼方法,其目的都是要在一定保真度的情況下,達(dá)到大的壓縮比。小波變換后系數(shù)的特點(diǎn)使人們提出各種方案來(lái)提高其壓縮比。零樹(shù)編碼量化就是利用小波變換后的樹(shù)結(jié)構(gòu)提出的一種行之有效的編碼方法。當(dāng)然,這種的在小波變換后的處理方法還有很多。但都達(dá)不到零樹(shù)編碼量化的效果。但這也并不是蛻,簡(jiǎn)單的零樹(shù)編碼,就能達(dá)到理想的效果。小波變換在表示圖像方面有很大的靈活性、適應(yīng)人類視覺(jué)特性(HVS)以及圖像壓縮等方面有顯著的優(yōu)勢(shì)。在圖像壓縮方面的優(yōu)勢(shì)主要表現(xiàn)在如下幾方面:小波變換后的低頻子圖集中了圖像的大部分能量;高頻子圖集中了圖像的邊緣、輪廓對(duì)應(yīng)位置的大部分能量;同一方向上各級(jí)高頻子圖系數(shù)幅度大體一致。小波變換能除去系數(shù)的相關(guān)性,使得同一尺度內(nèi)和不同尺度間的小波系數(shù)相關(guān)性均非常小。但是,不同尺度的小波系數(shù)在幅度上仍然存任著一定的相關(guān)性。前面提到的基于零樹(shù)的嵌入式小波壓縮算法就是利用這種相關(guān)性來(lái)有效的編碼小波系數(shù)。它們是對(duì)高頻子圖和低頻子圖統(tǒng)一量化編碼,只利用了系數(shù)尺度之間、空間位置之間的相關(guān)性,而沒(méi)有利用人類視覺(jué)生理和心理的特性。通過(guò)大量的文獻(xiàn)我們可以了解到,人眼的特性是對(duì)高頻失真不敏感,特別是對(duì)角線方向的高頻失真最不敏感,而對(duì)低頻失真較為敏感。為了充分利用人的視覺(jué)的特性,我們對(duì)小波變換后的壓縮方案進(jìn)行了選擇,如圖2所示。
首先對(duì)圖像進(jìn)行四級(jí)小波變換,然后根據(jù)人眼對(duì)低頻失真較敏感,而且低頻分量集中了圖像絕大部分能量的特點(diǎn),對(duì)最低頻子圖子帶單獨(dú)進(jìn)行DPCM壓縮編碼,為了進(jìn)一步提高壓縮比,我們采用自適應(yīng)算術(shù)編碼對(duì)隨后的碼流進(jìn)行編碼。根據(jù)人眼對(duì)45°方向的高頻失真不很敏感以及子帶小波系數(shù)為零的概率很大的特點(diǎn),對(duì)其舍去不作編碼(解碼時(shí)恢復(fù)為零),對(duì)其余子帶采用零樹(shù)量化編碼。在零樹(shù)法量化編碼時(shí),對(duì)高頻子帶與較低頻子帶采取不同的量化策略,較低頻部分分配較高的比特率,高頻部分分配較低的比特率,最后進(jìn)行游程編碼。
在本算法的實(shí)現(xiàn)中,由于我們要對(duì)不同的于帶進(jìn)行不同的量化,對(duì)于高級(jí)數(shù)的小波系數(shù)采用細(xì)致的量化方法,因?yàn)樗瑘D像中對(duì)人眼重要的信息。對(duì)低級(jí)數(shù)的小波系數(shù)采用相對(duì)粗一些的量化方法。它們都是標(biāo)量量化方法。同時(shí),在算法實(shí)踐中,如果采用SPIHT算法,不容易定位不同子帶的子系數(shù)。因此,在算法實(shí)現(xiàn)上,我們采用了EZW算法,即不采用集合分裂的方法來(lái)提高算法速度。同時(shí),如前面提到的通過(guò)創(chuàng)建數(shù)組來(lái)提高檢索零樹(shù)的效率的方法還是行之有效的方法。而且,這樣作有助于定位象素點(diǎn)在不同子帶區(qū)的位置,有利于我們的量化實(shí)現(xiàn)。我們?cè)谒惴ㄉ霞右圆捎?,得到良好的效果?/p>
仿真結(jié)果和性能比較
信噪比的定義為:
通過(guò)仿真的比較結(jié)果(圖3),我們可以看出算法在較低的編碼率的情況下,可以獲得了較高的壓縮比。通過(guò)對(duì)兩幅圖像的比較,我們發(fā)現(xiàn),在大致相同信噪比的情況下,Lena圖像有更高的編碼率,這和Lena圖像的統(tǒng)計(jì)特性有很大的關(guān)系。但二者都獲得了較高的編碼率。通過(guò)下面的圖像,我們可以從主觀效果上看出,本編碼方案的視覺(jué)效果較好,因此它是可行的。