增強現(xiàn)實已經(jīng)成為比VR技術還要熱門的技術,屬于它的繁榮還在后頭。近日我們來介紹一下,如何利用SLAM技術的應用進而改變增強現(xiàn)實技術的。
當這兩種不同的交互方式開始無縫融合的時候,我相信我們會看到最強大和最廣泛采用的增強現(xiàn)實實現(xiàn)。
盡管普及率有限,但增強現(xiàn)實顯然是當前最熱門的技術領域之一。這在很大程度上是因為通過標記追蹤來實現(xiàn)AR傳統(tǒng)方式,以及隨之而來的高門檻障礙。
1. 圖像識別與標記追蹤
除了3D模型和動畫之外,增強現(xiàn)實的支點是建立在兩個緊密相關的技術上:圖像識別與標記追蹤。當兩者配對在一起時,它們可以支持攝像頭識別圖像的數(shù)據(jù),從而觸發(fā)相關的體驗并在三維空間中追蹤相對于攝像頭的眼睛位置。通過將圖像上傳至處理服務器,開發(fā)者可以將一個或多個圖像關聯(lián)到單個增強現(xiàn)實體驗。這樣,設備上的攝像頭就能夠理解并追蹤疊加的數(shù)字內容。
對于其工作原理,我們首先要理解兩個核心概念。首先是Marker DetecTIon(標記檢測),即通過相機鏡頭識別圖像(通常稱為標記),并且與服務器上的對應部分建立關聯(lián)以觸發(fā)體驗;其次是Marker Tracking(標記追蹤),或者說能夠維持物理對象或標記的實時方向,并且不斷更新數(shù)字內容以模擬它的能力。
一個基于標記的AR體驗的例子
檢測和追蹤的質量由一系列的參數(shù)決定,主要是對比點的復雜度和標記所缺乏的重復模式。對于優(yōu)秀標記和糟糕點擊的各種復雜難點,我可以另起一篇文章進行闡釋。雖然這仍然為用戶提供了強大的體驗,但它具有明顯的局限性,而自其誕生依賴便一直在困擾著整個行業(yè)。從用戶體驗的角度來看,我不僅需要下載特定的應用程序,同時還需要對應的物理對象才能激活體驗。但借助SLAM,用戶只需一臺移動設備即可訪問內容。
2. 即時定位與地圖構建(SLAM)即時定位與地圖構建的英文簡稱是SLAM。這種技術直到最近才成為了一個可行的選擇,因為越來越多的設備開始搭載輔助性的深度攝像頭(在撰寫這篇文章的時候,谷歌和蘋果已經(jīng)找到了繞開專用輔助攝像頭的方法) ,而這是支持SLAM的必要條件。
這項技術基本上可以主動識別空間中的墻壁,地板和其他物理障礙。目前,大多數(shù)利用SLAM的應用程序只是采用樓層識別和位置追蹤來把AR對象放置在用戶周圍的表面上。少數(shù)幾個平臺能夠處理額外的空間信息(如墻壁,天花板和家具等等),從而可以更深入地理解周圍的環(huán)境。目前大量利用這些功能的兩大平臺是蘋果ARKit和谷歌ARCore。
3. 密集式點云重建:3D世界的點描技法這為開發(fā)者創(chuàng)建原來不可能實現(xiàn)的AR體驗提供了多樣性和靈活性。SLAM能夠主動對它認為存在的表面進行每秒數(shù)百次的粗略估計,并用描點或頂點固定這些微觀位置。通過建立一個密集式點云重建,設備攝像頭不僅可以識別物理空間,而且還可以記住物體轉向時的相對位置。下面是該技術實時處理信息時的演示:
基于追蹤的體驗能夠提供一個巨大的優(yōu)勢:情景。當用戶拾起一個物體時,激活的數(shù)字內容感覺就像是物體的一部分。假如我從全麥蜂蜜堅果麥圈中激活了一個AR體驗,然后其中的卡通吉祥物從包裝盒中飛走,這將成為一種有意義的執(zhí)行。這種行為使得應用程序能夠真正成為物理世界的“瀏覽器”。用SLAM來實現(xiàn)這一點要困難得多,因為盡管電腦可以更好地理解世界的形式,但無法根據(jù)它所看到的內容來提供實質性的反饋。
通過SLAM,用戶可以逼真地在辦公室里控制卡通水管工人(如馬里奧)收集金幣或者躲開危險的食肉植物;用實際上并不存在的家具和海報來重新裝修臥室;或者在街道上放置一系列箭頭,然后用GPS定位到最接近的咖啡店。當這兩種不同的交互方式開始無縫融合的時候,我相信我們會看到最強大和最廣泛采用的增強現(xiàn)實實現(xiàn)。這種融合技術的潛能無窮無盡。
SLAM技術的應用不僅只局限于增強現(xiàn)實。整體而言,SLAM可以幫助為計算機提供更符合字面意義的“眼睛”,使得它們能夠通過視覺輸入來理解周圍的一切。這種理解已經(jīng)擴展到機器人,自動駕駛汽車,機器學習和人工智能等領域。