音頻水印技術(shù)簡介
音頻水印技術(shù)
“水印”這一術(shù)語與信息隱藏科學(xué)高度關(guān)聯(lián)。所謂信息隱藏,可以理解為在一種信息中隱藏附帶另外一種信息。因此,音頻水印技術(shù)是指通過修改音頻信號從而在原始信號中嵌入附加信息的技術(shù)。大量的相關(guān)研究已經(jīng)產(chǎn)生了相當(dāng)多的嵌入和提取音頻信號中的水印數(shù)據(jù)的技術(shù)。大多數(shù)的水印系統(tǒng)是在線性域?qū)?shù)據(jù)進(jìn)行操作的(即PCM水?。I俨糠挚蓪σ驯粔嚎s的數(shù)據(jù)進(jìn)行水印嵌入(稱為比特流水?。?/p>
水印技術(shù)對音頻數(shù)據(jù)的修改其程度是輕微的,一般人的耳朵無法分辨出原始信號和已添加水印的音頻信號有什么不同。專門的水印探測器則可以從已添加水印信息的信號中讀出被嵌入的信息。
Fraunhofer IIS研發(fā)了一種強(qiáng)健的音頻水印技術(shù)。該技術(shù)的特點(diǎn)是可保證被嵌入的信息能保持可被讀出,而且即使經(jīng)過諸如MP3壓縮/解壓過程抑或模擬傳輸過程等處理后仍然可讀。更多的信息可到Music Trace網(wǎng)站獲取,該公司目前擁有該技術(shù)的由Fraunhofer IIS頒發(fā)的許可并負(fù)責(zé)維護(hù)該技術(shù)。
總體構(gòu)思
水印技術(shù)的基礎(chǔ)構(gòu)思可通過下圖表達(dá)。其關(guān)鍵在于附加的雖然聽不到但可通過特殊的水印解析器解析得到的信號。水印數(shù)據(jù)的嵌入過程是依靠于一個(gè)解碼過程中必須知曉的關(guān)鍵字而進(jìn)行。
水印的必要條件
一個(gè)設(shè)計(jì)優(yōu)良的水印嵌入系統(tǒng)應(yīng)具備一些對于提高安全性和有效性而言是非常必要的屬性。水印應(yīng)具有:
·隱藏性,應(yīng)不能被聽到;
·對于統(tǒng)計(jì)或分析應(yīng)是透明的;
·可抵抗數(shù)字信號處理運(yùn)算;
·防篡改;
·與音樂的整體直接相關(guān),而不只是在音樂的開頭部分(文件頭)或音樂中的某個(gè)位置;
·可由關(guān)鍵字決定其意義;
上述要求可通過將兩種基礎(chǔ)技術(shù)合并而成。這兩種技術(shù)分別是“心理聲學(xué)(PsychoacousTIcs)”和“展布頻譜(Spread Spectrum)”調(diào)制。
第一種技術(shù)通過對人類聽覺系統(tǒng)進(jìn)行建模分析所獲得的人類心理聲學(xué)特性保證了附加的數(shù)據(jù)不會被聽到。而展布頻譜調(diào)制可把嵌入的信息分散分布在整個(gè)時(shí)域平面上,從而提供了高度的強(qiáng)壯性,能抵抗各種各樣的信號處理攻擊。
應(yīng)用
數(shù)據(jù)(水?。┑募嫒輦鬏?/p>
基本上,水印算法在現(xiàn)有的音樂內(nèi)容發(fā)布途徑上增加了一種新的數(shù)據(jù)傳輸途徑。數(shù)據(jù)(水?。┑膫鬏斣谀撤N程度上可實(shí)現(xiàn)向后兼容,可以認(rèn)為每一種現(xiàn)有的音樂內(nèi)容發(fā)布途徑均可以傳送帶有水印的音樂。因此,水印技術(shù)可在廣泛的應(yīng)用領(lǐng)域獲得使用。
數(shù)字權(quán)限管理(Digital Rights Management,簡稱DRM)
數(shù)字權(quán)限管理通常被認(rèn)為是水印技術(shù)的主要應(yīng)用。水印技術(shù)可滿足數(shù)字權(quán)限管理的要求,比如所有權(quán)認(rèn)證,數(shù)字媒體訪問控制,追蹤非法拷貝等等。
元數(shù)據(jù) META data(注:即用于表達(dá)事物本質(zhì)的描述性內(nèi)容)
除了IPMP用途之外基于水印技術(shù)有許多可實(shí)現(xiàn)的應(yīng)用。其中一種重要的設(shè)想是隨同音樂一起傳輸元數(shù)據(jù)。元數(shù)據(jù)可包含諸如作曲人,演唱者,音樂類型等信息。
廣播
音頻水印技術(shù)的另一種應(yīng)用是在廣播領(lǐng)域。包括節(jié)目類型辨別、廣告搜索、廣播覆蓋面研究等等。
音頻質(zhì)量
雖然通過一種經(jīng)過精心設(shè)計(jì)的方法可以把水印信息對聽眾隱瞞起來,但是,嚴(yán)格地說,音頻信號中的任何額外信息均是對原信號的一種修改,因此潛在被聽眾感知的可能。而實(shí)際上,通過使用Fraunhofer IIS水印技術(shù)而導(dǎo)致的音頻質(zhì)量降低的程度是非常低的,比目前流行的各種編碼技術(shù)比如MPEG-2 AAC所帶來的音頻信號質(zhì)量的降低程度還要低。
比特流水印
目前,基于互聯(lián)網(wǎng)或其他渠道進(jìn)行的壓縮的音樂發(fā)布已經(jīng)越來越普及和流行。但是,控制對已發(fā)布內(nèi)容的使用和再分發(fā)目前仍不能實(shí)現(xiàn)?;谂c比特流關(guān)聯(lián)的水印技術(shù)可提供一種有用的機(jī)制以追蹤非法復(fù)制或在多媒體內(nèi)容中附加版權(quán)信息以防止可能的非法分發(fā)。
壓縮域水印嵌入
比特流水印系統(tǒng)可在已經(jīng)壓縮的音頻信號中直接嵌入水印。這種技術(shù)可適用于為節(jié)省存儲空間而把比特流進(jìn)行預(yù)壓縮的情況,比如互聯(lián)網(wǎng)音樂提供商便是一例。
線性域水印解析
雖然嵌入過程在壓縮域進(jìn)行,但水印的解析始終是在線性域(即已經(jīng)解壓的音頻數(shù)據(jù))進(jìn)行的。這是因?yàn)閷Ρ忍亓鞯慕鈮罕仨毑粫茐囊驯磺度氲乃 _@使得在PCM(脈沖編碼調(diào)制,即數(shù)字化的音頻信號)水印和比特流水印之間達(dá)成了兼容性,容許對在壓縮域或線性域嵌入的水印數(shù)據(jù)使用相同的水印解析器。圖2是復(fù)合的處理過程。
收益
比特流水印的主要應(yīng)用是把媒體內(nèi)容個(gè)人化。這意味著在發(fā)布過程中(比如下載或在線聆聽),關(guān)于發(fā)布過程的信息,比如用戶ID,可被嵌入到內(nèi)容中。由此可實(shí)現(xiàn)內(nèi)容的追蹤。該系統(tǒng)的先進(jìn)性包括:
·快速處理(可由服務(wù)器進(jìn)行即時(shí)水印嵌入)
可存儲預(yù)壓縮的音頻。
·個(gè)人化的水印嵌入
·兼容PCM水印技術(shù)
可用性
目前,一種適用于MPEG-2AAC預(yù)壓縮比特流的水印嵌入系統(tǒng)正在研發(fā)和測試中。它依賴于一種特設(shè)的AAC音頻編碼器,可隨同比特流同時(shí)傳送信息,從而使得可聯(lián)合優(yōu)化音頻編碼和水印嵌入過程,換來的是提高音頻質(zhì)量、增強(qiáng)水印解碼性能以及提高處理速度。
PCM水印
相對于比特流水印系統(tǒng),PCM水印系統(tǒng)在線性音頻信號中嵌入水印。其基本構(gòu)思是在音頻信號屏蔽閥值下隱藏一個(gè)寬帶數(shù)據(jù)信號。這就可以使得水印信號不會被聽到。圖3是流程圖。
水印的解析
水印解析器,簡單地,是一種以軟件方式實(shí)現(xiàn)的展布頻譜接收器,它基于偽隨機(jī)信號的相關(guān)性。水印本身可被視作信息比特序列,其意義由系統(tǒng)的用戶決定。這意味著這些比特可表達(dá)任何信息,或者說,任何信息都可以經(jīng)由此“水印通道”進(jìn)行傳輸。
不可聽
水印的不可聽是由我們的屏蔽模型保證的。聽覺測試可證明水印的嵌入即使對鑒定用的信號也不會產(chǎn)生可被覺察到的失真。