音頻水印技術
“水印”這一術語與信息隱藏科學高度關聯(lián)。所謂信息隱藏,可以理解為在一種信息中隱藏附帶另外一種信息。因此,音頻水印技術是指通過修改音頻信號從而在原始信號中嵌入附加信息的技術。大量的相關研究已經(jīng)產(chǎn)生了相當多的嵌入和提取音頻信號中的水印數(shù)據(jù)的技術。大多數(shù)的水印系統(tǒng)是在線性域?qū)?shù)據(jù)進行操作的(即PCM水?。?。少部分可對已被壓縮的數(shù)據(jù)進行水印嵌入(稱為比特流水?。?/p>
水印技術對音頻數(shù)據(jù)的修改其程度是輕微的,一般人的耳朵無法分辨出原始信號和已添加水印的音頻信號有什么不同。專門的水印探測器則可以從已添加水印信息的信號中讀出被嵌入的信息。
Fraunhofer IIS研發(fā)了一種強健的音頻水印技術。該技術的特點是可保證被嵌入的信息能保持可被讀出,而且即使經(jīng)過諸如MP3壓縮/解壓過程抑或模擬傳輸過程等處理后仍然可讀。更多的信息可到Music Trace網(wǎng)站獲取,該公司目前擁有該技術的由Fraunhofer IIS頒發(fā)的許可并負責維護該技術。
總體構(gòu)思
水印技術的基礎構(gòu)思可通過下圖表達。其關鍵在于附加的雖然聽不到但可通過特殊的水印解析器解析得到的信號。水印數(shù)據(jù)的嵌入過程是依靠于一個解碼過程中必須知曉的關鍵字而進行。
水印的必要條件
一個設計優(yōu)良的水印嵌入系統(tǒng)應具備一些對于提高安全性和有效性而言是非常必要的屬性。水印應具有:
·隱藏性,應不能被聽到;
·對于統(tǒng)計或分析應是透明的;
·可抵抗數(shù)字信號處理運算;
·防篡改;
·與音樂的整體直接相關,而不只是在音樂的開頭部分(文件頭)或音樂中的某個位置;
·可由關鍵字決定其意義;
上述要求可通過將兩種基礎技術合并而成。這兩種技術分別是“心理聲學(PsychoacousTIcs)”和“展布頻譜(Spread Spectrum)”調(diào)制。
第一種技術通過對人類聽覺系統(tǒng)進行建模分析所獲得的人類心理聲學特性保證了附加的數(shù)據(jù)不會被聽到。而展布頻譜調(diào)制可把嵌入的信息分散分布在整個時域平面上,從而提供了高度的強壯性,能抵抗各種各樣的信號處理攻擊。
應用
數(shù)據(jù)(水?。┑募嫒輦鬏?/p>
基本上,水印算法在現(xiàn)有的音樂內(nèi)容發(fā)布途徑上增加了一種新的數(shù)據(jù)傳輸途徑。數(shù)據(jù)(水印)的傳輸在某種程度上可實現(xiàn)向后兼容,可以認為每一種現(xiàn)有的音樂內(nèi)容發(fā)布途徑均可以傳送帶有水印的音樂。因此,水印技術可在廣泛的應用領域獲得使用。
數(shù)字權限管理(Digital Rights Management,簡稱DRM)
數(shù)字權限管理通常被認為是水印技術的主要應用。水印技術可滿足數(shù)字權限管理的要求,比如所有權認證,數(shù)字媒體訪問控制,追蹤非法拷貝等等。
元數(shù)據(jù) META data(注:即用于表達事物本質(zhì)的描述性內(nèi)容)
除了IPMP用途之外基于水印技術有許多可實現(xiàn)的應用。其中一種重要的設想是隨同音樂一起傳輸元數(shù)據(jù)。元數(shù)據(jù)可包含諸如作曲人,演唱者,音樂類型等信息。
廣播
音頻水印技術的另一種應用是在廣播領域。包括節(jié)目類型辨別、廣告搜索、廣播覆蓋面研究等等。
音頻質(zhì)量
雖然通過一種經(jīng)過精心設計的方法可以把水印信息對聽眾隱瞞起來,但是,嚴格地說,音頻信號中的任何額外信息均是對原信號的一種修改,因此潛在被聽眾感知的可能。而實際上,通過使用Fraunhofer IIS水印技術而導致的音頻質(zhì)量降低的程度是非常低的,比目前流行的各種編碼技術比如MPEG-2 AAC所帶來的音頻信號質(zhì)量的降低程度還要低。
比特流水印
目前,基于互聯(lián)網(wǎng)或其他渠道進行的壓縮的音樂發(fā)布已經(jīng)越來越普及和流行。但是,控制對已發(fā)布內(nèi)容的使用和再分發(fā)目前仍不能實現(xiàn)?;谂c比特流關聯(lián)的水印技術可提供一種有用的機制以追蹤非法復制或在多媒體內(nèi)容中附加版權信息以防止可能的非法分發(fā)。
壓縮域水印嵌入
比特流水印系統(tǒng)可在已經(jīng)壓縮的音頻信號中直接嵌入水印。這種技術可適用于為節(jié)省存儲空間而把比特流進行預壓縮的情況,比如互聯(lián)網(wǎng)音樂提供商便是一例。
線性域水印解析
雖然嵌入過程在壓縮域進行,但水印的解析始終是在線性域(即已經(jīng)解壓的音頻數(shù)據(jù))進行的。這是因為對比特流的解壓必須不會破壞已被嵌入的水印。這使得在PCM(脈沖編碼調(diào)制,即數(shù)字化的音頻信號)水印和比特流水印之間達成了兼容性,容許對在壓縮域或線性域嵌入的水印數(shù)據(jù)使用相同的水印解析器。圖2是復合的處理過程。
收益
比特流水印的主要應用是把媒體內(nèi)容個人化。這意味著在發(fā)布過程中(比如下載或在線聆聽),關于發(fā)布過程的信息,比如用戶ID,可被嵌入到內(nèi)容中。由此可實現(xiàn)內(nèi)容的追蹤。該系統(tǒng)的先進性包括:
·快速處理(可由服務器進行即時水印嵌入)
可存儲預壓縮的音頻。
·個人化的水印嵌入
·兼容PCM水印技術
可用性
目前,一種適用于MPEG-2AAC預壓縮比特流的水印嵌入系統(tǒng)正在研發(fā)和測試中。它依賴于一種特設的AAC音頻編碼器,可隨同比特流同時傳送信息,從而使得可聯(lián)合優(yōu)化音頻編碼和水印嵌入過程,換來的是提高音頻質(zhì)量、增強水印解碼性能以及提高處理速度。
PCM水印
相對于比特流水印系統(tǒng),PCM水印系統(tǒng)在線性音頻信號中嵌入水印。其基本構(gòu)思是在音頻信號屏蔽閥值下隱藏一個寬帶數(shù)據(jù)信號。這就可以使得水印信號不會被聽到。圖3是流程圖。
水印的解析
水印解析器,簡單地,是一種以軟件方式實現(xiàn)的展布頻譜接收器,它基于偽隨機信號的相關性。水印本身可被視作信息比特序列,其意義由系統(tǒng)的用戶決定。這意味著這些比特可表達任何信息,或者說,任何信息都可以經(jīng)由此“水印通道”進行傳輸。
不可聽
水印的不可聽是由我們的屏蔽模型保證的。聽覺測試可證明水印的嵌入即使對鑒定用的信號也不會產(chǎn)生可被覺察到的失真。