增強現(xiàn)實技術(shù)的發(fā)展及應(yīng)用
人工智能論壇如今浩如煙海,有硬貨、有干貨的講座卻百里挑一。由中國科學(xué)院大學(xué)主辦,中國科學(xué)院大學(xué)學(xué)生會承辦,讀芯術(shù)作為指定合作自媒體的“AI未來說·青年學(xué)術(shù)論壇”第三期“計算機視覺”專場已于2019年3月24日下午在中科院舉行。百度李穎超老師為大家?guī)韴蟾妗栋俣仍鰪姮F(xiàn)實技術(shù)及應(yīng)用》。
李穎超,百度增強現(xiàn)實技術(shù)部高級經(jīng)、DuMixAR平臺負責人。2009年獲北京理工大學(xué)博士學(xué)位,多年從事增強現(xiàn)實、計算機視覺領(lǐng)域的研發(fā)工作。組織團隊所研發(fā)的DumixAR平臺致力于面向業(yè)界提供領(lǐng)先的AR技術(shù)和解決方案,持續(xù)推動AR技術(shù)和產(chǎn)品化進展,推動AR技術(shù)在行業(yè)廣泛落地應(yīng)用。
報告內(nèi)容:介紹百度在增強現(xiàn)實方向的技術(shù)進展,包括三維感知跟蹤、人機交互、內(nèi)容生產(chǎn)等,同時介紹增強現(xiàn)實技術(shù)的技術(shù)開放情況和落地應(yīng)用。
百度增強現(xiàn)實技術(shù)及應(yīng)用
李博士帶來了題為《百度增強現(xiàn)實技術(shù)及應(yīng)?》的分享。
李博士主要介紹了支撐增強現(xiàn)實(AR)技術(shù)的核心CV(ComputerVision,計算機視覺)能力,展示了百度DuMix AR平臺構(gòu)建及AR技術(shù)在各領(lǐng)域的應(yīng)用落地,這為開發(fā)者和用戶帶來了更多的價值。
由“基礎(chǔ)層”、“感知層”、“認知層”和“平臺應(yīng)用層”四層架構(gòu)組成的百度大腦中,AR/VR與圖像、視頻能力組合成為感知層中的視覺部分;從細分技術(shù)方向上看,包含了圖像、視頻、重要垂類(人臉識別、OCR)、邊緣計算以及AR五大特色技術(shù)能力。
從 PC 時代使用鍵盤鼠標交互,到移動時代通過指尖交互,再到智能化時代可以通過各種傳感器交互,在交互手段不斷升級的趨勢下,AR通過將現(xiàn)實世界、虛擬信息和人連接起來為人們提供了嶄新的智能化交互方式?,F(xiàn)場,李博士展示了百度DuMixAR平臺在場景探索上幾個非常有意思的實例,讓同學(xué)們對AR技術(shù)在消費層面的應(yīng)用有了更直觀的理解。
典型的AR技術(shù)工作原理是將Camera、GPS、IMU等傳感器采集的真實世界數(shù)據(jù),通過感知系統(tǒng)處理獲得關(guān)于世界的結(jié)構(gòu)、語義等信息,與后端虛擬信息實時融合,經(jīng)由顯示系統(tǒng)和人機交互能力為用戶帶來虛實結(jié)合的沉浸體驗。
AR 系統(tǒng)的構(gòu)建包含了感知跟蹤、虛實融合、人機互動和內(nèi)容生產(chǎn)這四部分關(guān)鍵能力,其中感知跟蹤與CV技術(shù)結(jié)合最為密切。在識別典型物體進行感知跟蹤場景下,系統(tǒng)設(shè)計核心在于能夠支持多模態(tài)數(shù)據(jù)的靈活性和實時性。為此,百度設(shè)計了統(tǒng)一的注冊系統(tǒng)和數(shù)據(jù)中心,通過實時構(gòu)建局部地圖有效提升穩(wěn)定性;對于3D 物體,基于輪廓特征識別和紋理特征識別兩套方案有效兼容更多應(yīng)用場景。在空間感知定位方面,在即時定位與建圖(SLAM)的技術(shù)框架下,VO方案僅基于視覺信息,可以兼容更多中低端機型,融合IMU的VIO方案則為用戶帶來更好的AR體驗。此外,李博士還介紹了在人機互動、內(nèi)容生產(chǎn)和虛實融合方向的關(guān)鍵技術(shù)、重大挑戰(zhàn)與流行趨勢。
百度DuMix AR平臺不僅將這些底層技術(shù)打包全面開放,為開發(fā)者提供了滿足不同需求的SDK集成方案;還創(chuàng)建了友好的內(nèi)容開放平臺,幫助沒有開發(fā)能力的設(shè)計師搭建AR內(nèi)容和場景。李博士認為,隨著未來硬件和網(wǎng)絡(luò)的升級,以及算法和數(shù)據(jù)的積累,真正成熟的AR 應(yīng)用會很快到來。