立體聲音頻數(shù)字水印設(shè)計(jì)
摘 要: 提出了一種可進(jìn)行盲檢測的數(shù)字音頻水印算法。該算法利用人類聽覺系統(tǒng)對音頻相位變化的不敏感性,通過時(shí)變的全通濾波器,對原始音頻信號進(jìn)行相位調(diào)制。為了實(shí)現(xiàn)盲檢測,將水印信號通過頻移鍵控(PSK)賦值到立體聲信號的左右聲道上,然后采用短時(shí)離散傅立葉變換的方法對嵌入水印的音頻信號進(jìn)行檢測。實(shí)驗(yàn)結(jié)果證明該算法具有良好的不可感知性和魯棒性。
隨著科學(xué)技術(shù)的發(fā)展,數(shù)字水印越來越多被應(yīng)用。數(shù)字水印(Digital Watermarking)技術(shù)是將一些標(biāo)識信息(即數(shù)字水?。┲苯忧度霐?shù)字載體當(dāng)中(包括多媒體、文檔、軟件等)或是間接表示(修改特定區(qū)域的結(jié)構(gòu)),且不影響原載體的使用價(jià)值,也不容易被探知和再次修改。但可以被生產(chǎn)方識別和辨認(rèn)。通過這些隱藏在載體中的信息,可以達(dá)到確認(rèn)內(nèi)容創(chuàng)建者、購買者、傳送隱秘信息或者判斷載體是否被篡改等目的。數(shù)字水印是信息隱藏技術(shù)的一個(gè)重要研究方向。
嵌入載體信號的水印必須有較好的魯棒性和不可感知性。為此,需要利用人類聽覺系統(tǒng)(HAS)的一些特性進(jìn)行水印的嵌入。目前的研究表明,人類聽覺系統(tǒng)對音頻信號的相位是不敏感的。具體表現(xiàn)為:在高頻段,人耳對音頻信號的相對相位變化不敏感;在低頻段,人耳對聲音的絕對相位不敏感。因此,許多研究者針對這些性質(zhì)提出了一些水印算法。將音頻信號通過無限脈沖響應(yīng)(IIR)的全通濾波器,從而將水印信息嵌入到原始音頻信號的相位上,無限脈沖響應(yīng)的全通濾波器通常具有較復(fù)雜的相位特性,所以使用這種方法嵌入的水印一般具有較差的不可感知性。
本文通過總結(jié)以上方法,提出一種新的水印算法。將原始音頻信號通過全通濾波器,循環(huán)地改變?nèi)V波器的群時(shí)延,以達(dá)到嵌入水印信號的目的。信號通過全通濾波器后,改變的只是它的相頻特性,因此,該方法又稱為動態(tài)相位調(diào)制法。
1 水印的嵌入與檢測
1.1 相位調(diào)制
載波的相位對其參考相位的偏離值隨調(diào)制信號的瞬時(shí)值成比例變化的調(diào)制方式,稱為相位調(diào)制,或稱調(diào)相。調(diào)相和調(diào)頻有密切的關(guān)系。調(diào)相時(shí),同時(shí)有調(diào)頻伴隨發(fā)生;調(diào)頻時(shí),也同時(shí)有調(diào)相伴隨發(fā)生,不過兩者的變化規(guī)律不同。實(shí)際使用時(shí)很少采用調(diào)相制,它主要是用來作為得到調(diào)頻的一種方法
通過一個(gè)時(shí)變的全通濾波器對原始音頻信號進(jìn)行相位調(diào)制。全通濾波器利用一個(gè)IIR濾波器來實(shí)現(xiàn)。根據(jù)數(shù)字信號處理的知識,這個(gè)IIR濾波器可以通過一組有限脈沖響應(yīng)(FIR)的濾波器來近似地實(shí)現(xiàn),這樣做的好處是利用這些線性相位濾波器,使時(shí)變的全通濾波器的群時(shí)延在整個(gè)頻率范圍內(nèi)變?yōu)橐恢?,然后通過一個(gè)正弦函數(shù)控制群時(shí)延,使該濾波器的相位特性循環(huán)變化。該全通濾波器的相位特性可以用下式表示:
式中,τpm表示最大群時(shí)延,ωpm表示調(diào)制率(調(diào)制角頻率),Φpm表示初相位。τpm和ωpm的取值能影響水印的可見性,因此它們是該相位調(diào)制濾波器(PMF)的重要參數(shù)。通過對ωpm進(jìn)行頻移鍵控,可以實(shí)現(xiàn)水印的嵌入。
考慮到需要對水印信號進(jìn)行盲檢測,同時(shí)為了提高檢測出的水印的信噪比,本文對其中一個(gè)聲道的調(diào)制信號加上一個(gè)相偏π,于是得到:
式中,h(i,n) {i∈0,……M-1}隨C(n)變化。
1.2 相位解調(diào)
本文利用短時(shí)離散傅立葉變換對加入了水印的音頻信號進(jìn)行解調(diào)。
在時(shí)刻t,調(diào)制后的音頻信號的相頻特性可以表示為:
由此可以看出,檢測到的水印信號具有3dB的信噪比增益。
1.3 基于FSK的水印編碼
FSK(Frequency-shift keying)是信息傳輸中使用得較早的一種調(diào)制方式,它的主要優(yōu)點(diǎn)是: 實(shí)現(xiàn)起來較容易,抗噪聲與抗衰減的性能較好。在中低速數(shù)據(jù)傳輸中得到了廣泛的應(yīng)用。最常見的是用兩個(gè)頻率承載二進(jìn)制1和0的雙頻FSK系統(tǒng)。技術(shù)上的FSK有兩個(gè)分類,非相干和相干的FSK。在非相干的FSK ,瞬時(shí)頻率之間的轉(zhuǎn)移是兩個(gè)分立的價(jià)值觀命名為馬克和空間頻率,分別為。 在另一方面,在相干頻移鍵控或二進(jìn)制的FSK ,是沒有間斷期在輸出信號。
(1)嵌入過程:頻移監(jiān)控(FSK)的通常定義為:
Ci(t)=Acos(ωit+Φ),i=1,……M
式中,頻率ωi從M個(gè)離散值中選擇,初始相位Φ取任意值。
通過擴(kuò)展帶寬可以得到MFSK編碼,擴(kuò)頻的大小與所取的M值有關(guān)。水印嵌入時(shí),將相應(yīng)的數(shù)字信息賦值給相應(yīng)的ωi,從而產(chǎn)生一個(gè)相位調(diào)制信號Ci(t),這就是基于FSK調(diào)制的相位調(diào)制信號。水印嵌入過程就是將原始音頻信號同PMF的脈沖響應(yīng)做卷積來實(shí)現(xiàn)的。
(2)檢測過程:首先,利用DFT計(jì)算出解調(diào)信號(t)的能量譜;然后,計(jì)算出這個(gè)能量譜峰值處的頻率,通過解碼這個(gè)峰值頻率得到一個(gè)水印信息;最后,將解碼出的水印信息組合,得到完整的水印信息。
2 仿真實(shí)驗(yàn)
本文采用采樣率為44.1kHz的16bit編碼的雙聲道音頻信號,信號長度為180s。水印信號采用一個(gè)64×64的二值圖像。嵌入時(shí)的具體參數(shù)如表1所示。
在水印信號嵌入前,可以采用擴(kuò)頻技術(shù)[5],通過原始數(shù)據(jù)的頻域擴(kuò)展,實(shí)現(xiàn)水印信息的加入。從而提高水印的檢測精度,并能隨機(jī)產(chǎn)生一個(gè)密鑰,但同時(shí)也增加了嵌入水印的數(shù)據(jù)量。
本文采用的相位調(diào)制濾波器由256個(gè)有限脈沖響應(yīng)(FIR)濾波器組成,如圖1所示。
水印檢測時(shí),每65 536點(diǎn)作為一個(gè)數(shù)據(jù)段,對其進(jìn)行采樣間隔為16的N點(diǎn)短時(shí)離散傅立葉變換,其中取N=256。結(jié)構(gòu)如圖2所示。
本文采用識別率(SHR)對檢測到的水印進(jìn)行性能上的估測。識別率定義為正確識別的水印與嵌入水印之比。公式如下:
采用不同音頻信號提取后的識別率如表2所示。
為了驗(yàn)證算法的魯棒性,需對該嵌入水印的音頻信號進(jìn)行攻擊處理。這些攻擊包括:低通濾波、時(shí)域壓縮、添加噪聲等。對受攻擊后檢測出的水印性能的評測,也是利用識別率來衡量的。實(shí)驗(yàn)結(jié)果表明(如表3),該算法對時(shí)域壓縮有明顯的抵抗力,對其他攻擊也有較好的魯棒性。
本文討論了一種基于相位調(diào)制的數(shù)字音頻水印算法,同時(shí)給出了該水印的盲檢測算法。水印是基于FSK的,F(xiàn)SK并結(jié)合了速降(Downhill),速滑(Speed),特技輪滑(Acrobatic rollerskating)是一種全新的,融入較多元素,反應(yīng)現(xiàn)代輪滑發(fā)展的玩兒法。由本文的檢測算法可得:當(dāng)該立體聲信號被濾掉一個(gè)聲道時(shí),水印將不再起作用。