基于空間預測與變換的醫(yī)學圖像壓縮方法
1、引言
圖像是人類最主要的信息源。在信息爆炸的時代,圖像數(shù)據(jù)壓縮技術(shù)是解決海量圖像數(shù)據(jù)的存儲和傳輸重要手段。因此尋求最佳的圖像數(shù)據(jù)壓縮技術(shù)也始終是信息技術(shù)領(lǐng)域中的一個研究熱點。
隨著醫(yī)學成像技術(shù)和計算機技術(shù)的發(fā)展,數(shù)字化醫(yī)學圖像在醫(yī)學臨床診斷和教學研究中的應用日益廣泛。一方面,從X射線、計算機斷層掃描(CT)到核磁共振(MRI)、超聲圖像等的出現(xiàn)和發(fā)展,使得醫(yī)學影像的質(zhì)量越來越高,在醫(yī)學診斷中扮演越來越重要的角色;另一方面,醫(yī)學影像具有的信息量也越來越大,在醫(yī)院使用PACS系統(tǒng)和遠程醫(yī)療診斷系統(tǒng)中,均需大量的存儲空間來存儲和傳輸,圖像數(shù)據(jù)的大小將會直接影響到傳輸?shù)乃俣龋瑢е履康牡嘏R床醫(yī)生無法進行有效的診斷。醫(yī)學圖像壓縮編碼現(xiàn)已成為醫(yī)療信息學一個重要的研究方向,它要求重構(gòu)圖像不能有明顯的失真,可以滿足日益龐大的醫(yī)學圖像數(shù)據(jù)的壓縮和傳輸任務。
2、空間域圖像壓縮算法介紹
2.1 頻率域圖像壓縮算法的缺陷
近年來,圖像數(shù)據(jù)的壓縮取得了很大的發(fā)展,涌現(xiàn)了很多非常優(yōu)秀的壓縮算法。目前受到廣泛應用,并已納入新的國際標準的基于小波的壓縮方法是一種成熟的、具有高保真壓縮效果的壓縮方法,但針對醫(yī)學圖像的壓縮,該方法有一些嚴重的缺陷:
(1)基于小波的壓縮方法是通過犧牲高頻信息、保存低頻信息的方法來換取壓縮比的,圖像經(jīng)小波分解量化后會損失高頻信息,并且隨著壓縮倍率的提高,高頻信息的損失將越嚴重,這樣會直接造成圖像中紋理細節(jié)的損失;
?。?)該方法必須以大面積圖像為基礎(隨著小波分解所用基礎面積的減小,恢復圖像質(zhì)量將急劇降低),并在多次二維小波分解基礎上再做無失真編碼后,才能得到高保真的壓縮效果,但這種以大面積作為處理基礎的算法是難于實現(xiàn)實時壓縮的。
2.2 空間域圖像壓縮算法簡介
正因為變換域編碼存在以上缺陷,因此,人們又把目光投向了基于空間域的壓縮方法。
在文獻[4]中作者提出了多分辨率空間重采樣圖像壓縮算法RBC算法。RBC算法在壓縮比為4倍左右的應用情況下,其壓縮質(zhì)量不低于基于小波的壓縮算法。但是因為RBC算法在對圖像的結(jié)構(gòu)描述上過于簡單,隨著壓縮比的上升,其壓縮質(zhì)量迅速下降,因此,文獻[5]在此基礎上進行了改進,提出了基于模式特征的圖像壓縮算法SDBC算法。該算法以4×4的像素塊作為基本的圖像子區(qū),用作壓縮處理的基本單元,每個圖像子區(qū)根據(jù)其紋理結(jié)構(gòu)的復雜程度,分為平坦區(qū)、粗紋理區(qū)和細紋理區(qū)三類,以子區(qū)內(nèi)圖像的平均方差作為分類的準則,其壓縮質(zhì)量較RBC算法有顯著提高。
雖然SDBC算法考慮了圖像中紋理的分布,進行分區(qū)壓縮,但是該算法只是用了4×4大小的塊,并且只進行了三種分類模式,顯然,這種方法并不能覆蓋圖像中的所有紋理。因此,本文延續(xù)SDBC的算法思想,借鑒H.264視頻編碼標準中的幀內(nèi)編碼技術(shù),提出了基于空間預測和變換的壓縮方法來解決以上的問題。
3、基于空間預測與變換的醫(yī)學圖像壓縮方法
3.1 基于空間預測與變換的醫(yī)學圖像壓縮方法概述
基于空域的圖像壓縮算法一般不能像基于小波變換的算法那樣能進行全圖的運算,而是要分塊處理,為了便于計算機處理,一般圖像的分塊大小為2n×2n。本文選取4×4和16×16兩種大小不同的塊作為處理的窗口,以SAD作為窗口大小的選擇的準則。本算法以16×16的宏塊為單位進行編碼。
基于空間預測和變換的醫(yī)學圖像壓縮方法的大體流程如下:
?。?)把圖像分成若干個16×16大小的宏塊;
?。?)預測分析:對一個16×16的窗口進行預測分析。經(jīng)過分析,得到最終進行編碼的窗口大?。?6×16或者4×4,以及最佳預測模式;
(3)預測編碼:根據(jù)(2)得到的窗口大小及最佳預測模式對該塊進行變換、量化和掃描處理,此外,還要進行反變換和反量化,生成重建窗口。
(4) 對(3)中得到的數(shù)據(jù)進行熵編碼;
(5)重復(2)、(3)、(4),遍歷圖像中所有的16×16宏塊。
3.2 預測類型
根據(jù)窗口的大小不同,本算法有兩種預測類型,分別為4×4預測類型和16×16預測類型。圖1中給出了產(chǎn)生4×4預測類型的像素分布,圖2中給出了除模式2外的其他8種預測模式,而模式2是均值預測模式,它是用當前塊的上邊及左邊像素的灰度值的均值來作為當前塊每個像素的預測值。16×16預測類型有4種預測模式,分別為垂直預測方式、水平預測方式、直流預測方式和平面預測方式(如圖3所示)。4×4預測類型適合預測細節(jié)多、變換相對較大、包含多個不同對象的圖像區(qū)域,而16×16預測類型較適合于預測平滑的圖像區(qū)域,對圖像中相對不變的部分進行編碼。
圖1 4×4塊預測類型的像素點分布
圖2 4×4塊預測方向
圖3 16×16塊預測模式
該算法在選擇編碼窗口時以絕對誤差和SAD(Sum of Absolute Difference)作為判斷準則。絕對誤差和是指當前待編碼塊與預測塊之間的差值絕對值之和,即殘差之和。假設當前塊用S(i,j)表示,預測值為pred(i,j),i,j=0,1,...,N,則
SAD值越小,說明圖像的殘差值越小,從而說明當前待編碼塊與預測塊越接近,相應預測模式的預測的精度越高;反之,SAD值越大,說明圖像的殘差值越大,從而預測塊不能很好的反應當前待編碼塊,相應預測模式的預測精度越低。
為了綜合考慮各種預測模式的不同偏重方向性,當對宏塊進行編碼時會遍歷所有的預測模式,并借助模式判決準則從中選出最優(yōu)的模式作為最終的編碼模式。
3.3 變換
由于離散余弦變換(DCT)非常近似于統(tǒng)計最佳的K-L變換,所以DCT通常被用于圖像塊的變換編碼中。但是DCT有一個缺點:在DCT變換矩陣中的部分系數(shù)是無理數(shù),在計算機上用迭代方法進行變換和反變換后,不能得到一致的初始值。本文采用H.264幀內(nèi)編碼的思想,用整數(shù)DCT[6]代替浮點數(shù)DCT。整數(shù)DCT對圖像信號作用后可以獲得與DCT類似的頻率分解;同時,正交變換的目的是減少變換系數(shù)的相關(guān)性,使得變換系數(shù)的能量集中在較少的幾個分量上,變換前后的能量并沒有損失,在去除空間相關(guān)性上,整數(shù)DCT與DCT具有相同的效果。
本文中采用了兩種變換:整數(shù)4×4 DCT和4×4的Hadamard變換。
整數(shù)4×4DCT變換減少了舍入誤差,降低了計算復雜度,提高了運算精度;使用4×4塊進行變換,使用于變換的塊的尺寸縮小,能夠減少塊效應;同時,為了使小尺寸的變換方式對圖像中較大面積的平滑區(qū)域不產(chǎn)生塊之間的灰度差異,進一步降低DC系數(shù)間的相關(guān)性,對16個4×4塊的DC系數(shù)進行第二次塊變換,即Hadamard變換。
4、試驗分析及結(jié)論
4.1 壓縮性能比較
針對CT圖像和MRI圖像進行壓縮(CT圖像和MRI圖像分別如圖4、圖5所示),用本文提供的算法的壓縮結(jié)果與和JPEG2000壓縮算法的壓縮結(jié)果進行了對比,采用的客觀評價指標為峰值信噪比(PSNR),結(jié)果見圖6和圖7(為了描述方便,本文提供的算法我們暫且用NEW來表示)。
為了比較兩種算法的優(yōu)劣,用下面的表格1表示用于測試圖像的格式、大小和比特深度。
表1 用作比較的三種圖像屬性
測試圖像 | 圖像格式 | 圖像大小 | 比特深度 |
CT | RAW | 512×512 | 8 |
MRI | RAW | 512×512 | 8 |
圖4 CT圖像
圖5 MRI圖像
客觀評價參數(shù)峰值信噪比(PSNR)的定義如下:
其中:f(i,j)為原始圖像,g(i,j)為恢復圖像,M×N為圖像的寬×高
圖6 CT圖像的峰值信噪比曲線比較
圖7 MRI圖像的峰值信噪比曲線比較
4.2 試驗結(jié)果分析
對于CT和MRI圖像來說,本文提供的算好于JPEG2000的壓縮算法,其中,對CT圖像的壓縮效果明顯高于JPEG2000。
5、結(jié)論
現(xiàn)代醫(yī)學影像設備產(chǎn)生越來越大的信息量,而且其信息量還會繼續(xù)增加。因此,研究醫(yī)學圖像壓縮算法具有重大的意義。
本文首先對基于頻率域的小波壓縮算法的缺點進行了探討,然后簡單介紹了基于模式特征的圖像壓縮算法,并延續(xù)了該算法的思想,同時借鑒H.264的幀內(nèi)編碼技術(shù)提出了基于空間預測與變換的圖像壓縮方法。最后通過與JPEG2000壓縮算法的對比和分析試驗結(jié)果,可以看出,本方法對CT圖像和MRI圖像有較好的壓縮效果。