當(dāng)前位置:首頁 > 物聯(lián)網(wǎng) > 《物聯(lián)網(wǎng)技術(shù)》雜志
[導(dǎo)讀]摘要:傳統(tǒng)的圖像搜索方法一般是由圖像處理軟件自動(dòng)抽取圖像的顏色、形狀、紋理等特征,并以此建立特征索引庫,進(jìn)而由用戶輸入要查找的物品圖像,從而找出與之具有相近特征的圖像。而文中給出了從數(shù)學(xué)形態(tài)學(xué)的角度來提取圖像的關(guān)鍵形態(tài)特征,然后建立海量物品圖片的形態(tài)細(xì)化骨架庫,并以此簡化圖像搜索的關(guān)鍵內(nèi)容,降低數(shù)據(jù)庫存儲(chǔ)量,提高匹配效率以及準(zhǔn)確性的具體方法。

引言

目前大家比較熟悉的網(wǎng)絡(luò)搜索引擎技術(shù),大多是基于文字的檢索。不論是文章的查詢、圖片的搜索、音樂的查找甚至視頻的檢索,都是通過文字以及關(guān)鍵詞的描述或者標(biāo)引實(shí)現(xiàn)的。對于關(guān)鍵詞的文字捜索其缺點(diǎn)在于對多媒體信息描述上,用文字描述難以避免主觀性。特別是在網(wǎng)絡(luò)購物中,在海量商品庫中通過關(guān)鍵詞的查找很難找到自己所需要的物品,因而基于圖像的捜索技術(shù)應(yīng)運(yùn)而生。

傳統(tǒng)的圖像捜索方法一般是由圖像處理軟件自動(dòng)抽取圖像的顏色、形狀、紋理等特征,建立特征索引庫,用戶輸入要查找的物品圖像,就可以找出與之具有相近特征的圖像。本文從數(shù)學(xué)形態(tài)學(xué)的角度來提取圖像的關(guān)鍵形態(tài)特征,建立海量物品圖片((含bmp、jpg、gif等靜態(tài)圖片格式)的形態(tài)骨架庫,以此簡化圖像搜索的關(guān)鍵內(nèi)容,降低數(shù)據(jù)庫存儲(chǔ)量,提高匹配效率以及準(zhǔn)確性。

1數(shù)學(xué)形態(tài)學(xué)的基本原理

數(shù)學(xué)形態(tài)學(xué)是一門建立在集論基礎(chǔ)上的學(xué)科,是幾何形態(tài)學(xué)分析和描述的有力工具,它摒棄了傳統(tǒng)的數(shù)值建模及分析的觀點(diǎn),從集合的角度來刻畫和分析圖像,可以用來解決抑制噪聲、特征提取、邊緣檢測、圖像分割、形狀識(shí)別、紋理分析、圖像恢復(fù)與重建、圖像壓縮等圖像處理問題。數(shù)學(xué)形態(tài)學(xué)已在計(jì)算機(jī)視覺、信號處理與圖像分析、模式識(shí)別、計(jì)算方法與數(shù)據(jù)處理等方面得到了極為廣泛的應(yīng)用。

數(shù)學(xué)形態(tài)學(xué)是以形態(tài)結(jié)構(gòu)元素為基礎(chǔ)對圖像進(jìn)行分析的數(shù)學(xué)工具。它的基本思想是用具有一定形態(tài)的結(jié)構(gòu)元素去度量和提取圖像中的對應(yīng)形狀,以達(dá)到對圖像分析和識(shí)別的目的。數(shù)學(xué)形態(tài)學(xué)的應(yīng)用可以簡化圖像數(shù)據(jù),保持它們基本的形狀特征,并除去不相干的結(jié)構(gòu),適合當(dāng)前網(wǎng)絡(luò)搜索技術(shù)中對圖像內(nèi)容搜索的需要。

數(shù)學(xué)形態(tài)學(xué)的基本運(yùn)算主要有四個(gè),包括腐蝕(Erosion)、膨脹(dilation)、開運(yùn)算(openoperation),閉運(yùn)算(closeoperation)。它們在二值圖像中和灰度圖像中各有特點(diǎn)。下面對這幾個(gè)算法的原理進(jìn)行介紹,并給出實(shí)驗(yàn)結(jié)果。

腐蝕(Erosion)

把結(jié)構(gòu)元素B平移a后得到B[a],若B[a]包含于X,我們記下這個(gè)a點(diǎn),所有滿足上述條件的a點(diǎn)組成的集合稱做X被B腐蝕的結(jié)果。用公式表示為:

E(X)={a\B[a\1X}=X!B

圖1所示是其腐蝕示意圖。

圖1腐蝕的示意圖

下面以鞋子圖像為例,給出如圖2所示的腐蝕結(jié)果,實(shí)際上也就是要捜索的鞋子示意圖(圖像大小136X136像素,BMP格式)。

(a)原始圖片(b)腐蝕圖片

圖2腐蝕結(jié)果

膨脹(dilation)

膨脹可以看做是腐蝕的對偶運(yùn)算,其定義是:把結(jié)構(gòu)元素B平移a后得到B[a],若B[a]擊中X,我們記下這個(gè)a點(diǎn),所有滿足上述條件的a點(diǎn)組成的集合稱做X被B膨脹的結(jié)果。用公式表示為:

圖3所示是其膨脹原理與結(jié)果示意圖。

圖3膨脹原理與結(jié)果示意圖

開運(yùn)算(openoperation)

先腐蝕后膨脹稱為開運(yùn)算,如圖4所示。上面的兩幅圖中的左邊是被處理的圖像X(二值圖像,這里主要針對的是黑點(diǎn)),右邊是結(jié)構(gòu)元素B;下面的兩幅圖中的左邊是腐蝕后的結(jié)果,右邊是在此基礎(chǔ)上膨脹的結(jié)果??梢钥吹剑瓐D經(jīng)過開運(yùn)算后,一些孤立的小點(diǎn)被去掉了。

圖4開運(yùn)算示意圖

一般來說,開運(yùn)算能夠去除孤立的小點(diǎn)、毛刺和小橋(即連通兩塊區(qū)域的小點(diǎn)),而總的位置和形狀不變,這就是開運(yùn)算的作用。

閉運(yùn)算(closeoperation)

先膨脹后腐蝕稱為閉運(yùn)算,如圖5所示。圖5中上面的兩幅圖中,左邊是被處理的圖像X(二值圖像,我們針對的是黑點(diǎn)),右邊是結(jié)構(gòu)元素B;下面的兩幅圖中,左邊是膨脹后的結(jié)果,右邊是在此基礎(chǔ)上腐蝕的結(jié)果可以看到??梢?,原圖經(jīng)過閉運(yùn)算后,斷裂的地方被彌合了。

圖5閉運(yùn)算

一般來說,閉運(yùn)算能夠填平小湖(即小孔),彌合小裂縫,而總的位置和形狀不變。這就是閉運(yùn)算的作用。圖6展示了二值圖和灰度圖利用圓盤狀結(jié)構(gòu)元素進(jìn)行閉運(yùn)算的結(jié)果。

(a)開運(yùn)算(b)閉運(yùn)算

圖6運(yùn)算結(jié)果

1.5擊中擊不中變換HMT(Hit-MissTransform)

將形態(tài)學(xué)運(yùn)算推廣到更為一般的情況,實(shí)際上就演變?yōu)闂l件嚴(yán)格的模板匹配。這時(shí)結(jié)構(gòu)元素不僅含有物體點(diǎn),而且

還含有背景點(diǎn),只有當(dāng)結(jié)構(gòu)元素與所對應(yīng)的區(qū)域完全符合時(shí),才作為結(jié)果輸出到輸出圖像。

設(shè)A是被研究的對象,3是結(jié)構(gòu)元素,而且B由兩個(gè)不相交的部分B1和B2組成,即:

B=BiU&Bi+B2=0

于是,A被B擊中的定義為:

A7B={a\Bi[a\3A且壓[a]3Ac,

A7B=(A!Bi)n(Ac!B2)

因此,我們可以考慮將其作為一個(gè)整體結(jié)構(gòu)元素:B=BiUB2,Bi+B2=0。當(dāng)B在圖像A上移動(dòng)時(shí),在當(dāng)前位置a,只有當(dāng)B[a]與A和A的補(bǔ)集均相交,且其子集B1[a]含于A,B2[a]含于A時(shí)才能保留下來。所以選擇適當(dāng)?shù)腂1和B2后,HM變換實(shí)際上提取了A的特定于結(jié)構(gòu)元素對BB2)的邊緣幾何結(jié)構(gòu)信息。如圖7所示,圖7中的右下圖為采用約束灰度進(jìn)行擊中擊不中變換的效果圖。

圖7擊中擊不中示意圖

2圖像的細(xì)化與骨骼提取

2.1圖像的細(xì)化(Thinning)

細(xì)化可以由腐蝕分兩步實(shí)施完成,以免分裂物體。第一步是一個(gè)正常的腐蝕,但它是有條件的,就是那些被標(biāo)為可除去的像素點(diǎn)并不立即消去。在第二步中,只將那些消除后并不破壞連通性的點(diǎn)消除,否則保留。每一步都是一個(gè)3X3鄰域運(yùn)算,圖8所示是常用的八個(gè)方向結(jié)構(gòu)元素。

圖8八個(gè)方向結(jié)構(gòu)

第二步可以根據(jù)待消除點(diǎn)的八個(gè)相鄰點(diǎn)的情況查表來判斷是否刪除,圖9所示是相鄰點(diǎn)的情況示意圖。

圖9相鄰點(diǎn)情況表

判定是否可刪的依據(jù)可以從以下幾種進(jìn)行考慮:①內(nèi)部

點(diǎn)不能刪除;②孤立點(diǎn)不能刪除;③直線端點(diǎn)不能刪除;④如

/18物聯(lián)網(wǎng)技術(shù)2013年/第11期果P是邊界點(diǎn),去掉P后,如果連通分量不增加,則P可以刪除。

2.2骨架提取(Skeletonization)

一個(gè)與細(xì)化有關(guān)的運(yùn)算是抽骨架,也稱為中軸變換(Medialaxistransform)?中軸是所有與物體在兩個(gè)或更多非鄰接邊界點(diǎn)處相切的圓心的軌跡。但抽骨架很少通過在物體內(nèi)擬合圓來實(shí)現(xiàn)。中軸可設(shè)想成按如下方式形成。想象一片與物體形狀相同的草,沿其外圍各點(diǎn)同時(shí)點(diǎn)火。當(dāng)火勢向內(nèi)蔓延,向前推進(jìn)的火線相遇處各點(diǎn)的軌跡就是中軸。圖10所示是圖像細(xì)化與骨架提取示意圖。

抽骨架的實(shí)現(xiàn)與細(xì)化相似,可采用一個(gè)兩步有條件腐蝕實(shí)現(xiàn),但是與細(xì)化的不同在于拐角處,骨架延伸到邊界。

(a)二值細(xì)化(b)骨架提取

圖10圖像細(xì)化與骨架提取

3骨架數(shù)據(jù)庫建立與搜索結(jié)果比較

本文采用形態(tài)變換骨架提取算法,并以女式高跟鞋為例來建立女式高跟鞋有關(guān)的形態(tài)數(shù)據(jù)庫,以數(shù)據(jù)庫查詢搜索方式模擬網(wǎng)絡(luò)搜索引擎,通過形態(tài)配準(zhǔn)的相似率來搜索最接近的鞋子,并以相似率進(jìn)行排序,按相似程度的高低按序輸出,圖11所示是其實(shí)驗(yàn)結(jié)果圖。

圖11圖像形態(tài)骨骼提取數(shù)據(jù)庫建立

通過與傳統(tǒng)的圖像相似度進(jìn)行比較,在檢索速度、相似度以及數(shù)據(jù)壓縮等各個(gè)指標(biāo)進(jìn)行實(shí)驗(yàn),得出如表1所列的實(shí)驗(yàn)數(shù)據(jù)。

表1實(shí)驗(yàn)數(shù)據(jù)表

方法
檢索時(shí)間/ms
相似概率/(%)
形態(tài)法
2.5
85
結(jié)構(gòu)法
4.1
80

由以上實(shí)驗(yàn)可以看出,基于形態(tài)骨骼提取的圖像檢索算法在檢索速度上要比傳統(tǒng)的基于圖像結(jié)構(gòu)的捜索快50%,其相似配準(zhǔn)率的準(zhǔn)確性要優(yōu)于5%,另外,在數(shù)據(jù)存儲(chǔ)的時(shí)候其壓縮率要比普通的靜態(tài)圖像數(shù)據(jù)存儲(chǔ)格式要高30%以上。

4結(jié)語

基于形態(tài)骨骼提取的圖像捜索方法在物品顏色的檢索方面具有先天的不足,但是相較于傳統(tǒng)的文字關(guān)鍵詞捜索而言,本文提出的圖像捜索方法具有更加直觀和實(shí)用的特點(diǎn),通過數(shù)學(xué)形態(tài)特征提取建立特征索引庫,用戶只需將要查找的圖像的大致特征描述出來,就可以找出與之具有相近特征的圖像,檢索效率快,匹配的準(zhǔn)確性高,可廣泛應(yīng)用網(wǎng)絡(luò)購物、刑事偵測、夕卜觀檢索、特定物品搜索以及基于圖像內(nèi)容的搜索引擎技術(shù)領(lǐng)域。

20211112_618e60beb1df4__基于形態(tài)特征提取的圖像匹配搜索技術(shù)研究

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動(dòng)力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉