面向物聯(lián)網(wǎng)的多媒體數(shù)據(jù)庫檢索技術應用研究
引言
伴隨著信息高速公路的興起,多媒體正在深入我們的生活,物聯(lián)網(wǎng)時代也離我們越來越近。在對文字、圖形、圖像、視頻及聲音等多種媒體信息進行綜合處理時,傳統(tǒng)的信息檢索已經不能滿足人們的需求,信息的查找和檢索要求也越來越高。
1面向物聯(lián)網(wǎng)的多媒體數(shù)據(jù)庫特點
多媒體數(shù)據(jù)庫是多媒體技術與數(shù)據(jù)庫技術相結合而產生的一種新型數(shù)據(jù)庫,是指數(shù)據(jù)庫中的信息不僅涉及各種數(shù)字、字符等格式化的表達形式,而且還包括多媒體的非格式化的表達形媒體數(shù)據(jù)的存儲、讀取、檢索等功能的數(shù)據(jù)庫系統(tǒng)。多媒體數(shù)據(jù)庫繼承了傳統(tǒng)數(shù)據(jù)庫的一些優(yōu)點,但數(shù)據(jù)管理要涉及到更復雜的處理。與此同時,繼計算機、互聯(lián)網(wǎng)之后,物聯(lián)網(wǎng)帶來了信息技術的第三次革命,經過綜合分析,物聯(lián)網(wǎng)環(huán)境下的多媒體數(shù)據(jù)與傳統(tǒng)的數(shù)據(jù)相比,往往具有一些獨立的特性。
1.1數(shù)據(jù)的非結構化
聲音、圖像、影視等數(shù)據(jù)基本上都是二進制串。這些數(shù)據(jù)從其本身看不出任何結構,因此稱為非結構化數(shù)據(jù)。各種媒體的數(shù)字化存儲形式稱為多媒體數(shù)據(jù)。因為這些數(shù)據(jù)往往通過傳感器輸入計算機,又稱傳感器數(shù)據(jù)。媒體數(shù)據(jù)如果不另加一些描述和解釋,一般很難利用對數(shù)據(jù)的描述和解釋。這些特征使得傳統(tǒng)的關系型DBMS難以有效地管理這些類型的數(shù)據(jù),從而促使我們去研究、引入新型的DBMS系統(tǒng)。
1.2實時,性和快速更新
物聯(lián)網(wǎng)技術是基于各種感知技術的應用。其上部署了多種類型傳感器,不同類型的傳感器捕獲的數(shù)據(jù)內容和數(shù)據(jù)格式各不相同。由于每個傳感器都是一個信息源,采集信息在一定頻率的周期性環(huán)境下,傳感器獲得的多媒體數(shù)據(jù)也不斷更新,具有實時性。
1.3數(shù)據(jù)量大且維度高
物聯(lián)網(wǎng)是一種建立在互聯(lián)網(wǎng)上的泛在網(wǎng)絡。物聯(lián)網(wǎng)技術的重要核心仍在互聯(lián)網(wǎng),通過各種有線和無線網(wǎng)絡與互聯(lián)網(wǎng)融合,將物體的信息實時準確地傳遞出去叫多媒體數(shù)據(jù)量一般都很龐大。雖然采取了數(shù)據(jù)壓縮技術,但壓縮后的數(shù)據(jù)量還是很大。在物聯(lián)網(wǎng)上的傳感器定時采集的信息需要通過網(wǎng)絡傳輸,所以,這樣的海量數(shù)據(jù)對多媒體數(shù)據(jù)庫的存儲及檢索提出了更高的要求,同時還要考慮海量數(shù)據(jù)傳輸標準的統(tǒng)一。
2面向物聯(lián)網(wǎng)的多媒體數(shù)據(jù)庫檢索
多媒體數(shù)據(jù)包括文字、圖像、視頻、音頻等不同格式的信息內容。隨著互聯(lián)網(wǎng)的發(fā)展,傳統(tǒng)的基于結構化的關系數(shù)據(jù)庫檢索方式并不適合非結構化的多媒體數(shù)據(jù)的檢索,人們對多媒體數(shù)據(jù)的檢索提出了新的要求。基于內容的檢索就是從媒體數(shù)據(jù)中提取出特定的信息線索,然后根據(jù)這些線索從大量存儲在數(shù)據(jù)庫中的媒體中進行查找,檢索出具有相似特征的媒體數(shù)據(jù)來。它可以在更深層次更有效地利用存儲的多媒體信息。
基于內容的檢索是一個逐步求精的過程[3]:第一是從媒體內容中提取信息線索。基于內容的檢索直接對圖像、視頻、音頻內容進行分析,抽取特征和語義,利用這些內容特征進行索引,并進行檢索。第二是相似性匹配,就是將查詢特征與特征庫中的資料按照一定的匹配算法進行形似匹配,把滿足一定相似性的一組候選結果按相似度大小排列放回給用戶。第三是特征調整。對于系統(tǒng)返回的查詢結果,用戶可選擇滿意結果,或從中選擇一個示例,經特征調整形成新的查詢。第四,逐步縮小檢索范圍,直到用戶滿意。其具體過程如圖1所示。
2.1基于內容的圖像檢索技術
基于內容的圖像檢索技術是指利用一定的算法提取圖庫中圖像的顏色、紋理、形狀等特征進行檢索。用戶提供一個樣例圖像,系統(tǒng)提取樣例圖像的特征,然后跟數(shù)據(jù)庫中的所有圖像的特征進行比較,并將與樣例特征相似的圖像返回給用戶。
2.2基于內容的視頻檢索技術
視頻主要由鏡頭組成,鏡頭由一系列連續(xù)的幀組成,幀是一幅靜態(tài)的圖像,是組成視頻的最小單位?;趦热莸囊曨l檢索的關鍵步驟是視頻的分割,分割完成后,也就確定了每個鏡頭的開始和結束位置。每個鏡頭中的一系列幀的差異很小,可以從中選擇出關鍵幀來描述鏡頭的關鍵圖像,對該鏡頭的檢索可以轉換為對該關鍵幀的檢索。由于視頻中的關鍵幀就是一副靜態(tài)的圖像,因此,可以使用類似圖像檢索的方法進行檢索。
2.3基于內容的音頻檢索技術
基于內容的音頻檢索可以提取音頻數(shù)據(jù)中的特征信息,對不同音頻進行特征匹配,從而達到檢索的目的。一般以韻律、和音、旋律以及音調、響度、音色等感知特征進行特征值檢索,根據(jù)查詢索引和數(shù)據(jù)庫中音頻索引之間的相似性,來對音頻片段進行檢索。除實際發(fā)聲詞匯外,包含在語音中的其他信息,如發(fā)音者的身份和情緒都有助于語音索弓I和檢索。
3面向物聯(lián)網(wǎng)的多媒體數(shù)據(jù)檢索策略
針對多媒體數(shù)據(jù)的特點,分析物聯(lián)網(wǎng)環(huán)境中信息檢索遇到的問題,一方面可以考慮提高服務器的處理能力、擴充服務器的存儲容量,另一方面,則可以考慮優(yōu)化查詢策略以提高檢索速度。優(yōu)化策略可以從三個方面來考慮。
3.1臨時表緩沖策略
對數(shù)據(jù)表操作時,傳統(tǒng)的方法是直接對表進行關系運算,然后從中選擇滿足要求的結果集。而采用臨時表的做法,則虐先對大數(shù)據(jù)表進行查詢,將滿足條件的數(shù)據(jù)預先讀取到臨時表中,然后將對源數(shù)據(jù)表的訪問轉換為對臨時表的訪問。將操作的數(shù)據(jù)集預先讀取到臨時表中會給系統(tǒng)帶來額外的開銷。但是,在一般情況下,臨時表中的數(shù)據(jù)集要遠小于源數(shù)據(jù)表中的數(shù)據(jù)集,因此,在對于海量數(shù)據(jù)進行連續(xù)操作或者頻繁訪問時,采用此策略可提高系統(tǒng)的總體性能。
3.2數(shù)據(jù)的降維處理策略
人們在物聯(lián)網(wǎng)世界獲得的數(shù)據(jù)量正以指數(shù)形式快速增長,為了減輕系統(tǒng)檢索的負荷,可以對數(shù)據(jù)進行降維處理。結合具體業(yè)務需求,在盡可能多的保留初始數(shù)據(jù)的前提下,將數(shù)據(jù)的維數(shù)降到一個合理的大小,再將降維處理后的數(shù)據(jù)送入信息處理系統(tǒng),這對海量數(shù)據(jù)的檢索是行之有效的。降維算法主要分為線性降維算法和非線性降維算法。降維的實質就是尋找投影變換,即從高維空間到低維空間的變換。同時,降維處理也是一些智能算法的必要步驟,該策略對物聯(lián)網(wǎng)數(shù)據(jù)檢索中的智能處理是很有幫助的。
3.3情景感知的語義檢索策略
物聯(lián)網(wǎng)是通過射頻識別、紅外感應器、全球定位系統(tǒng)、激光掃描器等信息傳感設備,把任何物品與互聯(lián)網(wǎng)連接起來,進行數(shù)據(jù)交換。基于感應網(wǎng)絡,可以從大規(guī)模的海量數(shù)據(jù)中獲取用戶的位置數(shù)據(jù)、鄰接數(shù)據(jù)、通信數(shù)據(jù)和行為數(shù)據(jù)等,并對如此海量的移動數(shù)據(jù)進行實時挖掘,推導出蘊含在數(shù)據(jù)中的規(guī)律,感知用戶的情景環(huán)境,發(fā)現(xiàn)用戶的行為模式,將最能滿足用戶需求的結果提交給用戶,以實現(xiàn)用戶所得即所需,從而有效提高物聯(lián)網(wǎng)信息檢索的質量。
4結語
隨著物聯(lián)網(wǎng)技術的應用發(fā)展,人們對此環(huán)境下多媒體數(shù)據(jù)庫的檢索需求也越來越迫切。“數(shù)據(jù)災難”成為急需解決的問題。利用云計算、模式識別等各種智能技術,可以從傳感器獲得的海量信息中檢索、加工處理出有意義的數(shù)據(jù)。隨著理論研究和時間探索的不斷深入,面向物聯(lián)網(wǎng)的檢索技術一定會更加完善,充滿智能的物聯(lián)網(wǎng)多媒體數(shù)據(jù)庫的應用也將逐步推向各個行業(yè)和領域。
20211018_616c5a5d90edf__面向物聯(lián)網(wǎng)的多媒體數(shù)據(jù)庫檢索技術應用研究