摘 要: 提出了一種可進行盲檢測的數(shù)字音頻水印算法。該算法利用人類聽覺系統(tǒng)對音頻相位變化的不敏感性,通過時變的全通濾波器,對原始音頻信號進行相位調(diào)制。為了實現(xiàn)盲檢測,將水印信號通過頻移鍵控(PSK)賦值到立體聲信號的左右聲道上,然后采用短時離散傅立葉變換的方法對嵌入水印的音頻信號進行檢測。實驗結(jié)果證明該算法具有良好的不可感知性和魯棒性。
隨著科學(xué)技術(shù)的發(fā)展,數(shù)字水印越來越多被應(yīng)用。數(shù)字水?。―igital Watermarking)技術(shù)是將一些標識信息(即數(shù)字水?。┲苯忧度霐?shù)字載體當中(包括多媒體、文檔、軟件等)或是間接表示(修改特定區(qū)域的結(jié)構(gòu)),且不影響原載體的使用價值,也不容易被探知和再次修改。但可以被生產(chǎn)方識別和辨認。通過這些隱藏在載體中的信息,可以達到確認內(nèi)容創(chuàng)建者、購買者、傳送隱秘信息或者判斷載體是否被篡改等目的。數(shù)字水印是信息隱藏技術(shù)的一個重要研究方向。
嵌入載體信號的水印必須有較好的魯棒性和不可感知性。為此,需要利用人類聽覺系統(tǒng)(HAS)的一些特性進行水印的嵌入。目前的研究表明,人類聽覺系統(tǒng)對音頻信號的相位是不敏感的。具體表現(xiàn)為:在高頻段,人耳對音頻信號的相對相位變化不敏感;在低頻段,人耳對聲音的絕對相位不敏感。因此,許多研究者針對這些性質(zhì)提出了一些水印算法。將音頻信號通過無限脈沖響應(yīng)(IIR)的全通濾波器,從而將水印信息嵌入到原始音頻信號的相位上,無限脈沖響應(yīng)的全通濾波器通常具有較復(fù)雜的相位特性,所以使用這種方法嵌入的水印一般具有較差的不可感知性。
本文通過總結(jié)以上方法,提出一種新的水印算法。將原始音頻信號通過全通濾波器,循環(huán)地改變?nèi)V波器的群時延,以達到嵌入水印信號的目的。信號通過全通濾波器后,改變的只是它的相頻特性,因此,該方法又稱為動態(tài)相位調(diào)制法。
1 水印的嵌入與檢測
1.1 相位調(diào)制
載波的相位對其參考相位的偏離值隨調(diào)制信號的瞬時值成比例變化的調(diào)制方式,稱為相位調(diào)制,或稱調(diào)相。調(diào)相和調(diào)頻有密切的關(guān)系。調(diào)相時,同時有調(diào)頻伴隨發(fā)生;調(diào)頻時,也同時有調(diào)相伴隨發(fā)生,不過兩者的變化規(guī)律不同。實際使用時很少采用調(diào)相制,它主要是用來作為得到調(diào)頻的一種方法
通過一個時變的全通濾波器對原始音頻信號進行相位調(diào)制。全通濾波器利用一個IIR濾波器來實現(xiàn)。根據(jù)數(shù)字信號處理的知識,這個IIR濾波器可以通過一組有限脈沖響應(yīng)(FIR)的濾波器來近似地實現(xiàn),這樣做的好處是利用這些線性相位濾波器,使時變的全通濾波器的群時延在整個頻率范圍內(nèi)變?yōu)橐恢拢缓笸ㄟ^一個正弦函數(shù)控制群時延,使該濾波器的相位特性循環(huán)變化。該全通濾波器的相位特性可以用下式表示:
式中,τpm表示最大群時延,ωpm表示調(diào)制率(調(diào)制角頻率),Φpm表示初相位。τpm和ωpm的取值能影響水印的可見性,因此它們是該相位調(diào)制濾波器(PMF)的重要參數(shù)。通過對ωpm進行頻移鍵控,可以實現(xiàn)水印的嵌入。
考慮到需要對水印信號進行盲檢測,同時為了提高檢測出的水印的信噪比,本文對其中一個聲道的調(diào)制信號加上一個相偏π,于是得到:
式中,h(i,n) {i∈0,……M-1}隨C(n)變化。
1.2 相位解調(diào)
本文利用短時離散傅立葉變換對加入了水印的音頻信號進行解調(diào)。
在時刻t,調(diào)制后的音頻信號的相頻特性可以表示為:
由此可以看出,檢測到的水印信號具有3dB的信噪比增益。
1.3 基于FSK的水印編碼
FSK(Frequency-shift keying)是信息傳輸中使用得較早的一種調(diào)制方式,它的主要優(yōu)點是: 實現(xiàn)起來較容易,抗噪聲與抗衰減的性能較好。在中低速數(shù)據(jù)傳輸中得到了廣泛的應(yīng)用。最常見的是用兩個頻率承載二進制1和0的雙頻FSK系統(tǒng)。技術(shù)上的FSK有兩個分類,非相干和相干的FSK。在非相干的FSK ,瞬時頻率之間的轉(zhuǎn)移是兩個分立的價值觀命名為馬克和空間頻率,分別為。 在另一方面,在相干頻移鍵控或二進制的FSK ,是沒有間斷期在輸出信號。
(1)嵌入過程:頻移監(jiān)控(FSK)的通常定義為:
Ci(t)=Acos(ωit+Φ),i=1,……M
式中,頻率ωi從M個離散值中選擇,初始相位Φ取任意值。
通過擴展帶寬可以得到MFSK編碼,擴頻的大小與所取的M值有關(guān)。水印嵌入時,將相應(yīng)的數(shù)字信息賦值給相應(yīng)的ωi,從而產(chǎn)生一個相位調(diào)制信號Ci(t),這就是基于FSK調(diào)制的相位調(diào)制信號。水印嵌入過程就是將原始音頻信號同PMF的脈沖響應(yīng)做卷積來實現(xiàn)的。
(2)檢測過程:首先,利用DFT計算出解調(diào)信號(t)的能量譜;然后,計算出這個能量譜峰值處的頻率,通過解碼這個峰值頻率得到一個水印信息;最后,將解碼出的水印信息組合,得到完整的水印信息。
2 仿真實驗
本文采用采樣率為44.1kHz的16bit編碼的雙聲道音頻信號,信號長度為180s。水印信號采用一個64×64的二值圖像。嵌入時的具體參數(shù)如表1所示。
在水印信號嵌入前,可以采用擴頻技術(shù)[5],通過原始數(shù)據(jù)的頻域擴展,實現(xiàn)水印信息的加入。從而提高水印的檢測精度,并能隨機產(chǎn)生一個密鑰,但同時也增加了嵌入水印的數(shù)據(jù)量。
本文采用的相位調(diào)制濾波器由256個有限脈沖響應(yīng)(FIR)濾波器組成,如圖1所示。
水印檢測時,每65 536點作為一個數(shù)據(jù)段,對其進行采樣間隔為16的N點短時離散傅立葉變換,其中取N=256。結(jié)構(gòu)如圖2所示。
本文采用識別率(SHR)對檢測到的水印進行性能上的估測。識別率定義為正確識別的水印與嵌入水印之比。公式如下:
采用不同音頻信號提取后的識別率如表2所示。
為了驗證算法的魯棒性,需對該嵌入水印的音頻信號進行攻擊處理。這些攻擊包括:低通濾波、時域壓縮、添加噪聲等。對受攻擊后檢測出的水印性能的評測,也是利用識別率來衡量的。實驗結(jié)果表明(如表3),該算法對時域壓縮有明顯的抵抗力,對其他攻擊也有較好的魯棒性。
本文討論了一種基于相位調(diào)制的數(shù)字音頻水印算法,同時給出了該水印的盲檢測算法。水印是基于FSK的,F(xiàn)SK并結(jié)合了速降(Downhill),速滑(Speed),特技輪滑(Acrobatic rollerskating)是一種全新的,融入較多元素,反應(yīng)現(xiàn)代輪滑發(fā)展的玩兒法。由本文的檢測算法可得:當該立體聲信號被濾掉一個聲道時,水印將不再起作用。