藏文信息隱藏技術綜述
引言
安全、有效的信息傳輸對國家安全、社會穩(wěn)定和人民安 居樂業(yè)至關重要。網(wǎng)絡和多媒體技術的發(fā)展,使得信息傳輸?shù)?速度和數(shù)量正以驚人的增量發(fā)展。然而,信息傳輸?shù)谋憷诜?便人們的同時也給信息安全帶來了隱患,同時也為基于數(shù)字載 體的秘密信息傳輸提供了廣闊的研究空間。目前,基于載體的 秘密信息傳輸是信息安全領域的一個方興未艾的研究熱點。而 基于載體預處理的藏文信息隱藏技術將為信息安全領域提供 一些新的數(shù)字信息共享和傳輸理念,特別是藏文的預處理規(guī) 律、在數(shù)字信息中的隱藏規(guī)律等,將有助于涉藏秘密通信技 術的發(fā)展,并可以對民用和商用領域中涉及到藏文內(nèi)容的傳輸、 共享、存儲和提取的通信過程起到安全保護、版權保護及完 整性認證的作用,并對國家涉藏領域的網(wǎng)絡輿情監(jiān)控、國內(nèi)外 涉藏敏感信息標注和情感色彩認知起著至關重要的作用。
在藏文信息隱藏技術方面,目前主要涉及的技術有關鍵 字識別、字符識別和提取、韻律認知、語義角色標注、文本資 源挖掘和語料抽取等,并以此為基礎進行置亂優(yōu)化。
1國內(nèi)外信息隱藏技術研究現(xiàn)狀
信息隱藏一直是信息安全領域中保障隱秘信息安全傳輸 和數(shù)字信息版權的重要手段,也是近年來國內(nèi)外學者研究的 熱點之一。最新的一屆ACM信息隱藏和多媒體安全會議ACM IH&MMSec,13 Workshop)的主要研究內(nèi)容有信息隱藏算法、 多媒體水印和認證、載體運算域的數(shù)字信號處理等。其中,信息隱藏算法的設計首先依賴于載體的選擇和預處理;關于多 媒體水印和認證的研究則將信息隱藏和數(shù)字水印的載體范圍 從數(shù)字圖像等常見載體拓展到了包括三維模型在內(nèi)的新型載體 上;載體運算域的數(shù)字信號處理涉及到了載體預處理時所用的 具體方法,如空間域或變換域等。2013年IEEE圖像處理國 際會議(IEEE ICIP 2013)的主要研究內(nèi)容包括圖像、音視頻 和3-D等多媒體的信息隱藏算法和多媒體特征提取和分析等, 這兩類研究內(nèi)容均與載體的選取和預處理有關。最新一屆信 息隱藏國際會議(IH2012)的主要研究內(nèi)容包括多媒體安全和 其他載體的信息隱藏。我國的第十一屆全國信息隱藏暨多媒體 安全學術大會(CIHW2013)中關于信息隱藏算法的研究內(nèi)容 也主要集中在非常規(guī)載體的分析和預處理上。
藏文作為信息隱藏領域一種新的信息格式,對其研究主 要局限于藏文操作系統(tǒng)、藏文信息技術標準、藏文信息處理等 幾個方面,具體內(nèi)容集中在藏文編碼字符集、術語集、拼 音輔助集等的建立。
基于載體的秘密通信技術是20世紀90年代中期發(fā)展起 來的跨領域的學科,而載體的預處理技術一直是其研究的主 要方向。對隱藏載體進行預處理,生成信息隱藏嵌入?yún)^(qū)域是 信息隱藏算法中最重要的研究內(nèi)容之一。從上述國內(nèi)外各學術 會議中關于信息隱藏的參會論文和研討情況看,各類載體固有 特性的研究對預處理技術有著重要的意義,且數(shù)字圖像依然 是主要的一類載體,而三維模型將是未來主要研究的一類非 常規(guī)載體。下面就對數(shù)字圖像和三維模型兩類載體的預處理 技術的研究現(xiàn)狀進行闡述。
1.1數(shù)字圖像預處理技術研究綜述
基于數(shù)字圖像的信息隱藏技術是信息隱藏學科中重要的
技術分支,是目前應用最廣、覆蓋范圍最大的信息隱藏技術手 段。在基于數(shù)字圖像的信息隱藏技術研究中,信息隱藏區(qū)域的 生成是關系算法性能的重要因素。信息隱藏區(qū)域的生成方法 主要包括空間域生成法、變換域生成法以及空間域和變換域 聯(lián)合的生成方法。
空間域算法:作為空間域算法中出現(xiàn)最早、操作最簡單 且應用最廣泛的算法,基于位平面分解理論的LSB算法可 以直接替換的方式隱藏較大的數(shù)據(jù)量,劉紅翼等提出的一種 LSB算法具有容量大、運算量小的特點;劉文彬等提出的 LSB隱寫替換的消息定位方法則可以對此類算法進行檢測; 而IH2012的論文中,有學者運用假設檢驗理論和含秘載體的 奇偶感知特性可有效地檢測LSB算法所隱藏的隱秘信息, 這些研究為藏文信息隱藏中涉及到關于此類算法的抗檢測性 研究提供了新的待改進方向。張焱等提出的像素值排序和趙 彥濤等提出的直方圖修改等空間域算法在沿用LSB直接替換 的隱藏理念的同時,還提升了魯棒性,因此也被廣泛用于數(shù)字 圖像載體預處理;隨后,楊春芳等提出了針對此類算法的 檢測方法,這也為針對此類算法抗檢測性改進的研究提供 了重要依據(jù)。此外,上述同類算法中的載體子區(qū)域劃分思想、 內(nèi)容自適應思想等也對本項目基于載體結構特性建立空間匹 配模型的機制提供了方法學上的有力支持。
變換域算法:不同于空間域算法直接對載體的空間特性 進行修改,變換域預處理方法以修改載體的頻率參數(shù)來隱藏 信息,因此算法的魯棒性比空間域算法好。在此基礎上, 唐燕等又對隱秘信息的檢測和恢復進行了研究和改進,實現(xiàn) 了幾乎無需原始參量的半盲提取。盡管變換域算法不具備 空間域算法容量大、運算量小和易操作等優(yōu)勢,但是變換域 中的多小波理論因其同時具有對稱性、短支撐性、二階消失 矩和正交性等特性成為了信號處理中有明顯優(yōu)勢且較常用的方 法,在前期研究中利用多小波方法將數(shù)字圖像載體分塊后作 為嵌入?yún)^(qū)域,提高了算法的魯棒性和不可見性陽,這種方 法為在藏文信息隱藏研究中建立基于區(qū)域能量的階梯性分布 機制提供了一種研究手段。
混合域算法:較單獨運用一種空間域或變換域生成隱藏 區(qū)域并設計信息隱藏算法來看,基于空間域與變換域聯(lián)合的 信息隱藏算法可以兼有多種算法的性能優(yōu)勢。在基于空間域和 變換域聯(lián)合的信息隱藏算法中,空間域的作用體現(xiàn)在數(shù)據(jù)嵌 入的具體操作方面,因為隱藏的實質(zhì)就是在當前環(huán)境下的空 間分量上進行數(shù)據(jù)修改,利用邊緣像素值差分(Edged Pixel Value Differencing,EPVD)將載體換算為若干個像素塊,以 最大斜角的數(shù)據(jù)修改作為信息隱藏的具體方法;利用濕紙 碼和基于LSBM的雙層隱寫來對載體進行加1嵌入或減1嵌 入;另外,國內(nèi)外許多學者利用調(diào)色板理論進行數(shù)據(jù)嵌入。而變換域在載體預處理中的主要作用是生成滿足特定 需要的信息隱藏環(huán)境(區(qū)域),主要包括變換后的系數(shù)分布以 及n階分量子圖等。如對RSV顏色空間的V分量做DCT變 換,分塊后作為嵌入?yún)^(qū)域;利用視覺顯著點技術確定跟蹤 窗(Regions of Interest,ROI),在 ROI 的 DCT 系數(shù)上嵌入隱 藏信息,并指定某個ROI邊緣地圖脆弱性標識,嵌入到DWT 變換后的含密圖像中;前期研究中,研究人員利用自適應 顏色遷移理論中l(wèi)a B域對顏色的控制力,消除了 RGB顏色分 量的強相關性,并結合GHM能量分區(qū)隱藏信息,在不可見性、 嵌入信息量和魯棒性方面均具有較好的表現(xiàn)。
1.2三維模型預處理技術研究綜述
潘志庚等將基于三維模型的信息隱藏預處理方法主要分 為空間域算法和變換域算法。這也這為藏文信息隱藏研究 提供了新的思路和方法。
空間域算法:空間域算法通常具有易嵌入和盲提取的特 點,如直接置換載體的幾何信息來隱藏數(shù)據(jù)是三維模型載體 信息隱藏最原始、最直接的方法四。為改進此類算法的魯棒性, 引入仿射不變量是有效的措施,如利用具有連續(xù)解析性的仿 射不變量優(yōu)化需要置換的頂點、將穩(wěn)態(tài)錨點通過三角垂心 編碼解析為聚類元素從而嵌入隱秘信息。此外,基于主元 分析的算法也有助于改善空間域算法的魯棒性,例如可根據(jù) 主元分析(Primary Component Analysis,PCA)來確定模型 的關鍵位置作為魯棒區(qū)域,并用網(wǎng)格分割法改進魯棒性和不 可見性刼。這類算法也為藏文信息隱藏從載體結構特性進 行解析和預處理提供了理論依據(jù)。改進型的空間域算法多針 對魯棒性或容量性有所提升,如基于連續(xù)解析性的體積矩的 盲算法,改善了之前算法對連通性攻擊的魯棒性;通過重 排頂點和面片在網(wǎng)格文件中的表示信息,利用表示域內(nèi)的信息 進行嵌入使算法具有良好的不可見性和大容量性,但對相 似變換以外的攻擊不具有魯棒性。
變換域算法:三維模型預處理的變換域方法大多利用頻 譜分析將模型信息參數(shù)化,對參數(shù)進行少量修改后以隱藏 信息,其中,基于小波變換的算法可以對規(guī)則和非規(guī)則網(wǎng)格模 型進行小波域參量修改以嵌入較多信息網(wǎng)。理論上,變換域 算法比空間域算法魯棒性強,但由于三維模型頂點的天然無 序性和不規(guī)則性,對其進行頻譜分析難度大,導致變換域算 法實用性目前較低,因此空間域算法依然是比變換域算法更有 實用價值的研究方向
2藏文信息隱藏技術研究現(xiàn)狀
目前反映藏文信息處理技術最新進展的文獻較少,綜合 以已有的研究成果及相關研究文獻,藏文信息處理可劃分為
藏語信息處理和藏字信息處理兩個層次"3氣藏語信息處理 包括機器翻譯、信息檢索、信息提取、文本校對、文本生成、 文本分類、自動摘要以及藏文字識別和語音識別的后處理等 等;而藏字信息處理包括操作系統(tǒng)以及編碼字符集、輸入技術、 字形描述與生成、存儲、編輯、排版、字頻統(tǒng)計和藏字屬性庫等。 這些研究基礎對藏文信息隱藏技術的發(fā)展至關重要,是基于 載體預處理的藏文信息隱藏的主要技術來源。鑒于藏文的獨 特構造,以及藏文的特點,目前對藏文秘密信息的預處理技 術一般指置亂和加密算法的選擇,而置亂使信息變得雜亂 無章難以辨認,可以起到加密與改變信息嵌入特性的作用。可 用于藏文信息隱藏的置亂算法主要有Arnold變換、幻方矩陣、 Gray碼變換、混沌序列等方法。其中,Arnold變換算法簡 單且置亂效果顯著,使有意義的數(shù)字圖像變成像白噪聲一樣 的無意義圖像,實現(xiàn)了信息的初步加密和信息結構的調(diào)整,在 嵌入信息為數(shù)字圖像時可以很好的應用?;梅街脕y的思想 基于查表思想,基于數(shù)字圖像的幻方置亂可降低幻方置亂階 數(shù)或以圖像塊進行置亂,實現(xiàn)置亂效果與系統(tǒng)開銷的平衡岡。 Gray是一種具有反射特性和循環(huán)特性的單步自補碼,它的循 環(huán)、單步特性消除了隨機取數(shù)時出現(xiàn)重大誤差的可能,它的 反射、自補特性使得求反非常方便?;煦绲膬?yōu)勢在于對初 始條件的極端敏感和軌跡在整個空間上的遍歷性。根據(jù)經(jīng)典 的Shannon置亂與擴散的要求,這些獨特的特征使得混沌映 射成為信息隱藏嵌入算法的優(yōu)秀候選[4氣上述傳統(tǒng)的置亂算 法一般用于正方形圖像處理,而經(jīng)過改進的Arnold算法可直 接用于寬高不等的矩形圖像而不必進行正方形擴展,這也 將是藏文信息隱藏技術所采用的主要置亂方法之一。
3藏文信息隱藏技術的研究目標、研究內(nèi)容和要解決的問題
3.1研究目標
面向藏文安全通信的高性能信息隱藏算法是目前藏文信 息隱藏技術的主要目標,包括提出性能出色的、適合藏文通信 要求的信息隱藏算法;提出一種具有普適性的高性能信息隱 藏嵌入?yún)^(qū)域生成原則和嵌入規(guī)則:
基于數(shù)字圖像的藏文信息隱藏算法:提出至少兩種基 于數(shù)字圖像的藏文信息隱藏算法,算法將同時滿足面向藏文 安全的信息隱藏應用所要求的高不可見性(PSNR > 34.90 dB)、 強魯棒性(抗擊大約69%以下的JPEG2000壓縮、35%以下 的剪切及常見濾波與加噪)、大容量性(基于彩色圖像的信息 隱藏信息嵌入率> 18%)以及高感知篡改性(檢測隱藏數(shù)據(jù)是 否被篡改能力> 95%)。
基于三維模型的藏文信息隱藏算法:提出至少一種基 于三維模型的藏文信息隱藏算法。算法將同時滿足面向藏文 安全的信息隱藏應用所要求的高不可見性(RSNR > 69.94 dB、 En > 70%)、應對一般攻擊的強魯棒性(抗擊大約0.10%隨機 加噪、50-times Laplacian平滑、50%均勻重網(wǎng)格化以及均勻 簡化等)、大容量性(相對理想的RSNR,嵌入率> 29%)以及 低復雜度(根據(jù)載體模型幾何信息量而變化)。
普適性信息隱藏嵌入?yún)^(qū)域生成原則和嵌入規(guī)則:利 用載體圖像能量和復雜度特性,提出基于能量性和復雜度的 藏文信息隱藏區(qū)域生成原則和嵌入規(guī)則,將適應于所有對數(shù) 字圖像處理后有能量區(qū)別的圖像處理方法,指導設計者利用 能量與魯棒性、復雜度與不可見性的對應關系,研究出同時滿 足不可見性和魯棒性的信息隱藏算法。
3.2研究內(nèi)容
藏文信息隱藏區(qū)域生成原則與規(guī)則研究:數(shù)字圖像信 息隱藏技術的研究核心集中在隱藏區(qū)域和嵌入規(guī)則的設計上, 藏文信息隱藏算法的設計方法和思路就是在選定藏文信息隱 藏區(qū)域以及制定好信息隱藏規(guī)則后,按照一定的順序將兩者進 行合理的組織,所以研究藏文信息隱藏區(qū)域生成原則以及信息 隱藏規(guī)則是重點。
基于數(shù)字圖像的藏文信息隱藏算法研究:隱藏算法 是基于數(shù)字圖像的信息隱藏技術的研究核心,需按照嵌入域 進行劃分,對基于空間域和基于變換域的信息隱藏算法分別進 行研究,提出單獨基于空間域、單獨基于變換域以及兩者聯(lián) 合應用的數(shù)字圖像信息隱藏算法。
基于三維模型的藏文信息隱藏算法研究:首先對三 維模型的結構特性和能量特性進行研究,再根據(jù)載體模型的 特性找出對應的預處理方法。在研究基于空間域和基于變換 域的信息隱藏算法的基礎上,提出改進型的三維模型信息隱 藏算法。主要用于提升載體有效嵌入容量和降低載體視覺失 真度。
載體與藏文秘密信息的一致化方法研究:基于上述研 究基礎,生成結構和能量差異化子區(qū)域,再將藏文秘密信息 按照拼音屬性進行解析生成信息序列。再利用優(yōu)化算法使得 預處理后的載體信息和藏文秘密信息的解析編碼獲得最大一 致化,從而提高算法性能。
3.3需解決的關鍵問題
綜合已有的研究,在藏文信息隱藏技術方面,目前需要 解決的問題有以下幾個方面:
(1)信息隱藏區(qū)域與嵌入規(guī)則設計:在具有什么性質(zhì)的區(qū) 域內(nèi)應用什么樣的規(guī)則進行藏文信息隱藏才可以解決“不可見 性與魯棒性的對立、容量性與抗分析性的對立”問題,是藏文 信息隱藏研究領域的關鍵技術之一。需找出隱藏區(qū)域的性質(zhì)與 信息隱藏性能的關系,提出面向藏文信息傳輸?shù)男畔㈦[藏區(qū)域 選擇的原則與方法;給出在具有具體性質(zhì)的嵌入?yún)^(qū)域中的藏
文信息隱藏嵌入規(guī)則的制定原理和方法;提出大量的藏文信 息數(shù)據(jù)轉換思想與方法,以提供形式多樣的信息隱藏嵌入規(guī) 則。
數(shù)字圖像載體預處理方法:①多小波理論在載體預 處理中的應用。對于數(shù)字圖像經(jīng)過多小波變換后所具有的特 殊性質(zhì),找出多小波變換后數(shù)字圖像所具有的能量特性與基 于數(shù)字圖像信息隱藏算法性能之間所遵循的規(guī)律已有學者進 行研究。②顏色空間的性能分析與應用選取。RGB、CMYK、 laB、YUV以及HSx顏色空間,應用方法以及應用各有優(yōu)劣勢。 該技術的應用難點在于為顏色空間在藏文信息隱藏的應用提出 完備的應用方案,因為這些顏色空間在藏文信息隱藏技術中的 應用目前非常少,應用優(yōu)劣還處于實驗驗證階段,沒有理論驗 證的支持。
三維網(wǎng)格模型載體預處理方法:骨架抽取和內(nèi)切球 解析技術在藏文信息隱藏算法中的應用。這種方法不涉及頂 點數(shù)量及坐標的改變和拓撲關系的修改。難點在于尋找一個 理想的仿射不變量作為輔助參數(shù)以彌補算法對縮放攻擊的脆 弱性。
藏文的置亂與遺傳優(yōu)化算法:有的藏文字處理系統(tǒng) 把藏文看成是由30個輔音、4個元音、3個上加字、5個下加 字共42個藏文字符組成的,而有的則認為由其他數(shù)量的字符 組成?;趯Σ匚闹屑幼謱Πl(fā)音的影響規(guī)律的研究,利用字 符與二進制碼的解析規(guī)則和置亂與優(yōu)化技術對信息置亂,達 到隱藏信息與載體信息的最大匹配度也是一個技術難點。
4藏文信息隱藏技術研究的新方法
(1)利用載體圖像能量和復雜度特性,提出基于能量性 和復雜度的藏文信息隱藏區(qū)域生成原則和嵌入規(guī)則。高能量 與強魯棒、高復雜度與高不可見性的對應關系,從根本上解決 藏文信息隱藏算法中不可見性和魯棒性的對立問題,為面向藏 文通信安全的信息隱藏算法的設計給出一種普適性方法。
( 2)根據(jù)數(shù)字圖像信息隱藏嵌入?yún)^(qū)域的生成原則和嵌入 規(guī)則,提出新的、高性能的數(shù)字圖像的藏文信息隱藏算法。 算法利用laB等顏色空間轉換以及多小波對載體圖像進行的 處理,生成具有不同能量特性的嵌入?yún)^(qū)域,從頻率域上滿足 藏文信息隱藏的應用要求;通過對載體圖像進行顏色遷移、 矢量解析以及環(huán)形處理,從數(shù)字圖像的空間結構上滿足藏文 信息隱藏的應用要求。
(3)提出滿足三維模型結構特性和能量特性的藏文信息 隱藏算法。算法利用局部高度理論和均值偏移理論對載體模 型進行預處理,生成具有不同能量特性的嵌入?yún)^(qū)域,從頻域 上滿足信息隱藏的應用要求;通過對載體圖像進行骨架抽取、 內(nèi)切球解析,從空間結構上滿足藏文信息隱藏的應用要求。
20211223_61c44b7fa72b6__藏文信息隱藏技術綜述