當(dāng)前位置:首頁(yè) > 嵌入式 > 嵌入式動(dòng)態(tài)
[導(dǎo)讀]農(nóng)場(chǎng)中一頭奶牛悠閑地吃著草,一個(gè)卡通小人兒在和消費(fèi)者聊著天。出現(xiàn)這一切,都源于一個(gè)簡(jiǎn)單的牛奶瓶。消費(fèi)者通過(guò)手機(jī)或平板掃描牛奶瓶身上的圖案,就會(huì)呈現(xiàn)一個(gè)虛擬農(nóng)場(chǎng),

農(nóng)場(chǎng)中一頭奶牛悠閑地吃著草,一個(gè)卡通小人兒在和消費(fèi)者聊著天。出現(xiàn)這一切,都源于一個(gè)簡(jiǎn)單的牛奶瓶。消費(fèi)者通過(guò)手機(jī)或平板掃描牛奶瓶身上的圖案,就會(huì)呈現(xiàn)一個(gè)虛擬農(nóng)場(chǎng),可以選擇各種小動(dòng)物,并和它們進(jìn)行互動(dòng)。

這種深受孩子喜愛(ài)的宣傳方式是怎么實(shí)現(xiàn)的呢?其實(shí)這個(gè)過(guò)程只需要六步:

通過(guò)攝像頭采集實(shí)時(shí)視頻;

將采集到的視頻流數(shù)字化成圖像,然后通過(guò)上文的特征點(diǎn)檢測(cè)、特征點(diǎn)描述子生成、特征點(diǎn)匹配一系列處理,找到識(shí)別標(biāo)識(shí)物;

識(shí)別出標(biāo)識(shí)物后,以標(biāo)識(shí)物作為參考,確定要生成的動(dòng)畫在 AR 環(huán)境中的位置和方向,并確定提前存入手機(jī)中的標(biāo)識(shí)圖位置;

標(biāo)識(shí)物中的標(biāo)識(shí)符號(hào)與預(yù)設(shè)的目標(biāo)圖進(jìn)行匹配;

程序根據(jù)標(biāo)識(shí)物位置調(diào)整動(dòng)畫(虛擬信息)位置;

動(dòng)畫(虛擬信息)被渲染進(jìn)視頻流。

這就是 AR 的實(shí)現(xiàn)過(guò)程,今天將為大家解釋六步中的“精華”——識(shí)別并跟蹤標(biāo)識(shí)物。

牛奶瓶上的特點(diǎn)

當(dāng)消費(fèi)者拿起手機(jī)掃描牛奶瓶時(shí),手機(jī)是怎么判斷這幅圖是不是自己要找的目標(biāo)呢?

 

目標(biāo)圖是在開(kāi)發(fā)這款 AR 應(yīng)用時(shí)提前讀入 app 的。啟動(dòng) app 后,它就開(kāi)始查找與標(biāo)識(shí)圖相同的幀。

這就像警察在抓逃犯時(shí),會(huì)在各交通要道設(shè)立排查點(diǎn),將過(guò)往行人與逃犯照片進(jìn)行對(duì)比,進(jìn)行排查。警察在比對(duì)照片時(shí),不會(huì)每根頭發(fā),每個(gè)毛孔都要進(jìn)行比較。他們會(huì)關(guān)注嫌疑人的一些顯著外貌特征,與這些特征相似度極高的人視為犯罪嫌疑人。

 

同理,圖像識(shí)別中的目標(biāo)圖也具有特征,我們將這些特征稱為“特征點(diǎn)”。

那么問(wèn)題來(lái)了,如何找到這些點(diǎn)?

圖像在電子設(shè)備中的狀態(tài)是一堆數(shù)字。特征點(diǎn)就是那些和周圍數(shù)字值相差較大的點(diǎn),檢測(cè)方法一般有:FAST、Harris、SIFT、SURF、MSER 等。

 

FAST 特征點(diǎn)檢測(cè)法因檢測(cè)速度快而深受研究者喜愛(ài),具體遵循以下步驟:

首先,從圖像中選取一個(gè)像素,記作 P。如果我們想判斷它是否為一個(gè)特征點(diǎn),首先把 P 點(diǎn)的亮度值記作 I。再設(shè)定一個(gè)合適的閾值 t,用來(lái)控制特征點(diǎn)的選取。以 P 為圓心,3 個(gè)像素為半徑做圓,這個(gè)圓的邊界上有 16 個(gè)像素,如下圖所示:

 

如果這 16 個(gè)像素的像素值都比 I+t 大,或都比 I-t 小,那么 P 就是一個(gè)特征點(diǎn)。一般在實(shí)際檢測(cè)中,這 16 個(gè)像素不用全部與 P 的亮度值進(jìn)行比較,只要有 3/4 個(gè)以上的像素亮度值比 P+t 大或比 P-t 小,就可以認(rèn)為 P 點(diǎn)為特征點(diǎn)。

簡(jiǎn)單來(lái)說(shuō),特征點(diǎn)就是與周圍反差較大的點(diǎn),就像下圖所示:

 

找到特征點(diǎn)就可以識(shí)別了么?

只知道檢測(cè)到特征點(diǎn)還不行,必須知道兩張圖像中的特征是否一致。如何判斷特征點(diǎn)是否一致,就需要借助特征點(diǎn)描述子了。

特征點(diǎn)描述子是一種描述特征點(diǎn)的方法。比如,我們?cè)谔粑鞴蠒r(shí),會(huì)選根蒂蜷縮、敲起來(lái)聲音濁響的青綠西瓜。這個(gè)挑瓜的過(guò)程就是描述的過(guò)程,挑瓜的依據(jù)就相當(dāng)于生成的描述子。

 

如果一個(gè)瓜和我們的挑瓜條件相似或相同,那么我們就判斷它是一個(gè)好瓜。同樣的如果一幅圖像中有一個(gè)點(diǎn)和我們的描述子相似或相同,那么就可以判斷它們?yōu)橥惶卣鳌?/p>

找到了特征點(diǎn)描述子,接下來(lái)就是要在目標(biāo)圖和識(shí)別圖之間進(jìn)行匹配。

 

判斷兩幅圖是否為同一幅圖的標(biāo)準(zhǔn)是人為控制的。我們既可以設(shè)置匹配率為 10% 以上的兩幅圖像是同一圖像,也可以設(shè)置匹配率為 90% 以上。具體標(biāo)準(zhǔn)根據(jù)應(yīng)用所需而定。

目前,特征點(diǎn)匹配技術(shù)大概分為兩類:一類是分別獲取兩幅圖像的特征點(diǎn)及特征點(diǎn)描述子,根據(jù)一定的搜索策略對(duì)這些特征點(diǎn)和描述子進(jìn)行計(jì)算,最終獲得最優(yōu)極值點(diǎn)即為匹配結(jié)果;另一類是只獲取參考幀圖像的特征點(diǎn)信息,并利用它在當(dāng)前幀上尋找最優(yōu)匹配,這種匹配的最大優(yōu)點(diǎn)是只需提取參考幀的特征點(diǎn),節(jié)約了一半的特征點(diǎn)提取時(shí)間。

發(fā)現(xiàn)目標(biāo)要盯緊

從文章開(kāi)頭的視頻中可以看到,當(dāng)小孩拿著 iPad 轉(zhuǎn)動(dòng)時(shí),生成的動(dòng)畫會(huì)保持不動(dòng)。給我們一種“動(dòng)畫和牛奶是一個(gè)整體”的錯(cuò)覺(jué)。要想達(dá)到這種效果,需要對(duì)視頻流中的圖像進(jìn)行特征點(diǎn)跟蹤。

特征跟蹤有兩種方式,一種是對(duì)視頻流中的每一幀圖像,進(jìn)行特征點(diǎn)匹配。另一種則在第一幅圖像中,尋找可能的特征位置,然后在后續(xù)的圖像中搜索它們的對(duì)應(yīng)位置。顯然,這類“先檢測(cè)后跟蹤”的方法適合用在視頻跟蹤應(yīng)用中。

 

在跟蹤過(guò)程中,相鄰兩幀經(jīng)過(guò)匹配后,得到當(dāng)前幀的目標(biāo)特征點(diǎn)。由于得到的目標(biāo)特征點(diǎn)中存在不穩(wěn)定特征點(diǎn),因此需要將這些不穩(wěn)定的點(diǎn)剔除。

但又出現(xiàn)了一個(gè)新的問(wèn)題,即隨著跟蹤的進(jìn)行,有效特征點(diǎn)會(huì)逐漸減少。尤其是在跟蹤過(guò)程中當(dāng)目標(biāo)姿態(tài)發(fā)生了大幅度變化時(shí),經(jīng)常會(huì)出現(xiàn)目標(biāo)的特征點(diǎn)急劇減少甚至消失的情況,這樣會(huì)導(dǎo)致跟蹤效果不好甚至跟蹤失敗。

這就像賣水果的小商販經(jīng)常會(huì)挑出好的水果擺放在最前面,隨著客人的購(gòu)買,再繼續(xù)往上添加。

解決特征點(diǎn)減少問(wèn)題的方法和賣水果是一樣的。只需擴(kuò)大范圍搜索重新提取特征點(diǎn),即當(dāng)前時(shí)刻目標(biāo)物中得到的特征點(diǎn)的個(gè)數(shù)小于一定的閾值時(shí),擴(kuò)大跟蹤面積重新提取特征點(diǎn),將重新提取到的特征點(diǎn)用在接下來(lái)的跟蹤過(guò)程中。

 

農(nóng)場(chǎng)中一頭奶牛悠閑地吃著草,一個(gè)卡通小人兒在和消費(fèi)者聊著天。出現(xiàn)這一切,都源于一個(gè)簡(jiǎn)單的牛奶瓶。消費(fèi)者通過(guò)手機(jī)或平板掃描牛奶瓶身上的圖案,就會(huì)呈現(xiàn)一個(gè)虛擬農(nóng)場(chǎng),可以選擇各種小動(dòng)物,并和它們進(jìn)行互動(dòng)。

在跟蹤的同時(shí)還需要完成一件事情,那就是渲染動(dòng)畫。動(dòng)畫必須和識(shí)別圖位置保持一致才能達(dá)到融合效果。

目前手機(jī)端 AR 應(yīng)用開(kāi)發(fā)多數(shù)是采用這種圖像法,這種方法已經(jīng)被模式化。開(kāi)發(fā)者不用考慮上述這些底層實(shí)現(xiàn),可以使用一些插件來(lái)實(shí)現(xiàn)。常用插件國(guó)外的有 Vuforia、Metaio 等,國(guó)內(nèi)有 HiAR、EasyAR、VoidAR 等。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉