當(dāng)前位置:首頁 > 智能硬件 > vr|ar|虛擬現(xiàn)實(shí)
[導(dǎo)讀] 如何AR技術(shù)開始崛起,比起VR技術(shù)更有前景。新型社交AR的興起引起了大家的注意,大家都很好奇他是如何實(shí)現(xiàn)的。本文就來淺談一下社交AR技術(shù)的實(shí)現(xiàn)原理。 2014年,一家名為L(zhǎng)ooksery

如何AR技術(shù)開始崛起,比起VR技術(shù)更有前景。新型社交AR的興起引起了大家的注意,大家都很好奇他是如何實(shí)現(xiàn)的。本文就來淺談一下社交AR技術(shù)的實(shí)現(xiàn)原理。

2014年,一家名為L(zhǎng)ooksery的烏克蘭初創(chuàng)公司利用這項(xiàng)技術(shù)為消費(fèi)者創(chuàng)建了一個(gè)數(shù)字化妝自拍應(yīng)用程序,而該應(yīng)用程序的下載量超過了一百萬次。Snapchat發(fā)現(xiàn)了潛在的巨大市場(chǎng),并且斥資收購了Looksery。6個(gè)月后,這為Snapchat帶來了現(xiàn)在十分知名的“Lens”產(chǎn)品。在另一邊廂,F(xiàn)acebook感覺到競(jìng)爭(zhēng)對(duì)手的危險(xiǎn),他們?cè)谶@之后的第二年收購了MSQRD應(yīng)用程序背后的團(tuán)隊(duì)。“自拍AR”這種以人為核心的計(jì)算機(jī)視覺突然在世界范圍內(nèi)引起了轟動(dòng),成為了兩大社交媒體巨頭之間斗爭(zhēng)的關(guān)鍵武器。

在2017年,蘋果和Snapchat都第一次推出了基于SLAM技術(shù)的ARKit和World Lenses(允許設(shè)備在平面上置放數(shù)字對(duì)象),而Facebook則為市場(chǎng)帶來了AR Studio(允許開發(fā)者創(chuàng)建自己的AR濾鏡)。然而,有消息稱相關(guān)的努力尚未成為用戶之間極速躥紅。

那么接下來是什么呢?對(duì)我們來說,這是新型社交AR的興起。社交AR不僅能夠作為自拍AR階段和眼鏡AR之間的橋梁,而其潛在相關(guān)的技術(shù)有可能成為未來的關(guān)鍵組成部分。要做到這一點(diǎn),我們需要開發(fā)一個(gè)神經(jīng)網(wǎng)絡(luò),在所有配置中(不僅只是自拍)實(shí)時(shí)檢測(cè)和追蹤人像。然而,這向我們提出了一系列的挑戰(zhàn)。

對(duì)于利用前置攝像頭實(shí)現(xiàn)的自拍AR追蹤,其基本上是識(shí)別和追蹤人像時(shí)的一個(gè)特殊情況。從前置攝像頭轉(zhuǎn)移到后置攝像頭,我們將有可能遇上其他情況,如:

對(duì)象更有可能偏離相對(duì)于攝像頭的中心位置。

他們可以出現(xiàn)在不同的距離,或以不同的大小呈現(xiàn)。

他們往往不是面向攝像頭,所以我們不能只是尋找人臉,而是要尋找頭部,頭發(fā),帽子和各種相關(guān)特征。

視圖中經(jīng)常出現(xiàn)多個(gè)人像。

為了實(shí)現(xiàn)我們的技術(shù),以上是我們需要克服的事項(xiàng)。那么,技術(shù)的工作原理到底是什么呢?下面我們將其分解成4個(gè)部分:

1. 多個(gè)頭部與身體的檢測(cè)

我們的技術(shù)能夠?qū)崟r(shí)檢測(cè)多個(gè)頭部與身體。在提供用戶的攝像頭圖像后,應(yīng)用程序可以識(shí)別圖像中顯示頭部及其相應(yīng)身體的區(qū)域。

這能夠做什么呢?這允許我們根據(jù)頭部大小來估計(jì)人像的距離。對(duì)于身體,我們可以錨定人像運(yùn)動(dòng)的任何視覺信息。

2. 場(chǎng)景/視圖中的持續(xù)性個(gè)人追蹤

為了追蹤場(chǎng)景中人像的動(dòng)作與特征,我們根據(jù)多個(gè)幀來比較多個(gè)頭部和身體的信息。這樣,即使他們是被其他人包圍,即使他們離開攝像頭視圖后又重新進(jìn)入,我們也能夠?qū)⒁曈X信息固定在特定的人像身上。

3. 單獨(dú)背景與全身細(xì)分

對(duì)于每個(gè)目標(biāo)追蹤人像,我們會(huì)進(jìn)一步分類屬于面部,皮膚,頭發(fā),衣服和背景的像素。就這樣,我們能夠清晰地分離開一系列不同的圖層,然后我們可以將其用于AR效果的高級(jí)混合。如果不是這樣,設(shè)備只能通過光場(chǎng)或深度感知技術(shù)實(shí)現(xiàn),而這對(duì)當(dāng)前的智能手機(jī)而言并不實(shí)際。

4.編輯器

我們專門培訓(xùn)了我們的神經(jīng)網(wǎng)絡(luò),令其產(chǎn)生任何設(shè)計(jì)師都可以輕松進(jìn)行交互和操作的圖層。由于網(wǎng)絡(luò)基于簡(jiǎn)單的數(shù)學(xué)計(jì)算,因此我們很容易在桌面和移動(dòng)設(shè)備上以相同的質(zhì)量實(shí)現(xiàn)。這使得設(shè)計(jì)人員能夠使用我們的自定義編輯器來快速迭代和設(shè)計(jì)面向Spilly應(yīng)用程序的視覺效果。

以上是具體的工作原理,下面讓我們看看技術(shù)的部分用例:

我們開發(fā)的三款社交AR應(yīng)用程序:鼓勵(lì)人們聚在一起,扮演自己喜歡的明星,來回作弄對(duì)方等等。

游戲體驗(yàn):人們現(xiàn)在可以成為游戲中的可定位和可操作的角色。

時(shí)尚應(yīng)用:將衣服/濾鏡應(yīng)用至用戶身上,不僅有趣,而且你可以進(jìn)行虛擬“試穿”和購買。

把你自己放入第三方內(nèi)容:借助我們的全圖細(xì)分技術(shù),用戶可以將頭部置放于任意視頻中的人像身上,從而完成“頭部移植手術(shù)”。不知道你想不想成為最愛電影中的主角呢?

潛在的用例很有很多。在眼鏡AR時(shí)代,人們很可能成為一系列相互作用的情境觸發(fā)器,如室內(nèi)生活情景(如特定于某人的提醒,比方說提醒丈夫做早餐),個(gè)人細(xì)節(jié),或者說更豐富的游戲體驗(yàn)。接下來,我們可能會(huì)看到涉及商業(yè)交易的戶外交互(如“分類廣告網(wǎng)站”項(xiàng)目的個(gè)人付款),以及視覺增強(qiáng),你可以期待Tumblr和Pinterest(皆為圖片分享應(yīng)用)背后的相同動(dòng)機(jī)擴(kuò)展到你個(gè)人身上。

簡(jiǎn)而言之,人管理著這個(gè)由技術(shù)驅(qū)動(dòng)的世界,而這種以人為中心的視覺技術(shù)進(jìn)步只會(huì)進(jìn)一步將人與技術(shù)聯(lián)系在一起。我們正在走向這么一個(gè)未來:以智能手機(jī)為基礎(chǔ)的商業(yè),娛樂和自我表達(dá)將從屏幕束縛中解放出來,數(shù)字世界將直接集成至我們面前的世界。我們需要謹(jǐn)慎行事,但這個(gè)潛在未來的價(jià)值已經(jīng)清晰可見。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉