當(dāng)前位置:首頁 > 物聯(lián)網(wǎng) > 感知層
[導(dǎo)讀] 在上個月召開的CES Asia電子展上,大眾就展出了一輛帶有手勢控制功能的Golf R Touch。當(dāng)然,大眾并不是唯一的參與者。同樣是在這屆CES上,英特爾展出了3D實感技術(shù),不僅可以捕捉手部動作,還能夠?qū)崿F(xiàn)面部識別、3D掃

 在上個月召開的CES Asia電子展上,大眾就展出了一輛帶有手勢控制功能的Golf R Touch。當(dāng)然,大眾并不是唯一的參與者。同樣是在這屆CES上,英特爾展出了3D實感技術(shù),不僅可以捕捉手部動作,還能夠?qū)崿F(xiàn)面部識別、3D掃描建模等。而在隨后的谷歌2015年I/O開發(fā)者大會上,一款名為Project Soli的可穿戴智能設(shè)備芯片也能夠?qū)崟r檢測雙手和手指上的微小活動,并根據(jù)設(shè)定執(zhí)行相應(yīng)動作。這些看上去就酷炫無比讓人手癢癢的技術(shù),是怎么做到的吶?

 


 

手勢控制,天下三分

雖然三家公司都是手勢識別技術(shù),但是他們?nèi)齻€所采用的具體技術(shù)卻不盡相同。據(jù)透露,大眾的Golf R Touch上采用的是ToF技術(shù),英特爾的是結(jié)構(gòu)光技術(shù),而谷歌則使用了毫米波雷達(dá)的技術(shù)。下面就分別來說道說道。

ToF的全稱為飛行時間(Time of Flight),是一種通過計算光線的傳播時間來測量距離的技術(shù)。根據(jù)距離的不同來判斷出不同手指的具體位置,從而判斷出具體的手勢,再對應(yīng)到相應(yīng)的控制命令之上。

要通過光線傳播來測算距離,那么就需要一個能夠發(fā)射光線的裝置和接收光線的感應(yīng)裝置。大眾使用了一個3D相機模塊來發(fā)射脈沖光,再利用內(nèi)置的感應(yīng)器接收用戶手部反射回的光線。然后,根據(jù)二者的時間差,處理芯片就可以構(gòu)建出手部目前的位置和姿勢。

 


 

大眾手勢識別技術(shù)中藏在換擋桿后方的ToF攝像頭(紅點位置)

通過實時采集這些信息,中控系統(tǒng)就可以調(diào)用相應(yīng)的數(shù)據(jù)庫獲得用戶正在進(jìn)行的動作。再根據(jù)預(yù)先定義的功能,就可以實現(xiàn)不同的操作。由于光的傳播速度非???,基于ToF技術(shù)的感光芯片需要飛秒級的快門來測量光飛行時間。這也是ToF技術(shù)難以普及的原因之一,這樣的感光芯片成本過高。

結(jié)構(gòu)光技術(shù)基本原理與ToF技術(shù)類似,所不同之處在于其采用的是具有點、線或者面等模式圖案的光。以英特爾公司的集成式前置實感攝像頭為例,其包括了紅外激光發(fā)射器、紅外傳感器、色彩傳感器以及實感圖像處理芯片。

 


 

英特爾實感技術(shù)所用攝像頭

其基本原理為:首先激光發(fā)射器將結(jié)構(gòu)光投射至前方的人體表面,再使用紅外傳感器接收人體反射的結(jié)構(gòu)光圖案。然后,處理芯片根據(jù)接收圖案在攝像機上的位置和形變程度來計算物體人體的空間信息。結(jié)合三角測距原理,再進(jìn)行深度計算,即可進(jìn)行三維物體的識別。攝像頭把采集到的信息發(fā)送到負(fù)責(zé)實感計算的軟件開發(fā)包(Software Development Kit,SDK)后,該SDK結(jié)合加速度計算器,就可以提供手勢識別等功能。

作為一種快速、便攜、高精度的三維測量技術(shù),結(jié)構(gòu)光測量技術(shù)在航空、模具、醫(yī)療等領(lǐng)域均得到了廣泛的應(yīng)用。手勢識別只是其中的一個應(yīng)用案例。

毫米波雷達(dá)的原理同樣與ToF技術(shù)基本相同,只不過用于測量的介質(zhì)從光線變成了無線電波。Project Soli利用內(nèi)置的毫米波發(fā)生器把無線電波(雷達(dá)波)發(fā)射出去,然后利用接收器接收回波。這時,內(nèi)置的處理芯片會根據(jù)收發(fā)之間的時間差實時計算目標(biāo)的位置數(shù)據(jù)。

通過比較不同時間段手指位置的不同,Project Soli就可以與內(nèi)置的數(shù)據(jù)比較,得到手指正在進(jìn)行的動作。毫米波雷達(dá)的缺點在于信號容易被空氣阻擋,掃描范圍有限,因而對遠(yuǎn)距離目標(biāo)探測不清楚,但對近距離目標(biāo)勘測十分清晰。在主動安全技術(shù)中,毫米波雷達(dá)的身影已經(jīng)不可或缺。另外,在近程高分辨力防空系統(tǒng)、導(dǎo)彈制導(dǎo)系統(tǒng)、目標(biāo)測量系統(tǒng)等均有應(yīng)用。

車載路漫漫

大眾的手勢識別技術(shù)在體驗過程中雖然反應(yīng)略慢,但是準(zhǔn)確率還不錯;英特爾的實感技術(shù)據(jù)稱已經(jīng)研發(fā)了三年之久,在游戲上也已經(jīng)開始實用;谷歌的Project Soli則還只是個展示,尚未正式應(yīng)用。但是不管是哪一個,車載的路依然很長。大眾的工程師表示至少還需要兩年的時間才能夠把手勢識別正式帶到量產(chǎn)車型之上,英特爾的實感技術(shù)還在與車企接洽,至于谷歌的,就更遠(yuǎn)了。

ToF技術(shù)在應(yīng)用時具有明顯的缺點——“外部疊加誤差”。所謂外部疊加誤差,是相對于由于光線散射導(dǎo)致的內(nèi)部疊加誤差而言的。誤差產(chǎn)生的原因在于相機發(fā)射的光線在到達(dá)手部時沒有直接返回相機的感光原件,而是通過幾次不規(guī)則漫反射才回到相機模塊。這樣測量出來的距離就與實際距離不匹配。然而,如果相機中的背景是固定的,感應(yīng)器就可以忽略外部疊加誤差引起的測量錯誤。大眾Golf正是利用車廂這一固定的背景來減少誤差帶來的影響。

 


 

谷歌Project Soli芯片

Project Soil采用的是60GHz、波長為5毫米的極高頻毫米波無線電波來捕捉動作、距離、速度等信息,感應(yīng)誤差精細(xì)到毫米。然而,如何把具有如此精度的設(shè)備微小化是一件十分苦難的事情,最難的地方在于微小化會影響器件的發(fā)射功率和效率、感應(yīng)靈敏度等。谷歌用了十個月左右才將其從PC主機大小縮小到了硬幣大小,且為了提高精度與排除干擾,用到了兩個發(fā)射器與四個接收器。目前,Project Soli還沒有正式應(yīng)用到具體設(shè)備中。

至于英特爾的實感技術(shù),從技術(shù)本身來說,最需要解決的問題首先是需要驗證是否適合用在車內(nèi)。另外,從現(xiàn)場體驗來看,識別的準(zhǔn)確度還有待提升。

除了技術(shù)研發(fā)上的難題之外,用戶在使用時的體驗也對開發(fā)者提出了挑戰(zhàn)。

與傳統(tǒng)操作方式的不同就要求開發(fā)團(tuán)隊設(shè)計一套新手教程,以此來讓用戶逐步體感技術(shù)的使用方法;用戶在使用過程中可能手的一部分會在探測區(qū)域之外;在實際的應(yīng)用中,系統(tǒng)也會需要根據(jù)環(huán)境進(jìn)行攝像頭的矯正,存在一個學(xué)習(xí)的過程。這些都是需要開發(fā)團(tuán)隊提前想好應(yīng)對策略。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉