新 3D 視覺技術(shù),以幫助機(jī)器更像人類一樣感知環(huán)境
可以幫助做家務(wù)、為我們提供司機(jī)和替代工廠工人的自主機(jī)器人的夢(mèng)想比 1960 年代播出的 Jetsons 系列的存在時(shí)間更長(zhǎng)。現(xiàn)實(shí)情況是,許多公司已承諾到 2020 年推出自動(dòng)駕駛汽車,但我們?nèi)栽诘却7?wù)機(jī)器人和工業(yè)自動(dòng)化領(lǐng)域的情況并沒有太大的不同。
為什么需要這么長(zhǎng)時(shí)間?
一個(gè)關(guān)鍵方面是機(jī)器如何感知他們的環(huán)境。雖然機(jī)器人視覺在過去十年中取得了長(zhǎng)足的進(jìn)步,部分原因在于更高分辨率的相機(jī)和新的 3D 視覺技術(shù),但它在感知環(huán)境方面的效率仍然遠(yuǎn)低于人類。
事實(shí)上,目前的方法可能從一開始就錯(cuò)了。例如,我們?nèi)祟惒粫?huì)以數(shù)百萬像素的分辨率將我們的周圍環(huán)境數(shù)字化,然后小心翼翼地嘗試尋找物體的輪廓并逐幀比較這些輪廓以得出它們的運(yùn)動(dòng)路徑。
想象一下,我們用放大鏡篩選數(shù)百萬像素的圖像,將對(duì)比度和顏色的細(xì)微變化標(biāo)記為可能的對(duì)象,然后以每秒 10 幀的速度進(jìn)行此操作,以跟蹤和預(yù)測(cè)假設(shè)對(duì)象的運(yùn)動(dòng)。
人類感知的工作方式不同。我們的眼睛是大腦的延伸,可以預(yù)處理大量信息。結(jié)果,我們的視網(wǎng)膜中有更多的運(yùn)動(dòng)敏感細(xì)胞,如果有東西在我們的視野中移動(dòng),我們會(huì)立即意識(shí)到。只有這樣,我們才能使用黃斑中的高分辨率細(xì)胞來識(shí)別感興趣的對(duì)象——這是一種更有效的對(duì)象識(shí)別、跟蹤和預(yù)測(cè)方式。
輸入現(xiàn)在可用的新 3D 視覺技術(shù),以幫助機(jī)器更像人類一樣感知環(huán)境。它被稱為連貫的視覺。
該技術(shù)發(fā)出相干激光并捕獲的不僅僅是來自返回光子的強(qiáng)度信息。它還捕獲由物體運(yùn)動(dòng)引起的微小頻率變化,并提供有關(guān)通過偏振變化感測(cè)到的材料和表面的信息。
現(xiàn)有的 3D 傳感技術(shù)包括直接和間接飛行時(shí)間方法、投影 IR 模式(也稱為結(jié)構(gòu)光)和立體視覺等三角測(cè)量技術(shù)。并非所有這些都提供瞬時(shí)運(yùn)動(dòng)信息,并且通常在范圍、眼睛安全、串?dāng)_抗擾度和精度方面存在重大權(quán)衡。
相干 3D 傳感方法不依賴于檢測(cè)光強(qiáng)度變化(現(xiàn)有 3D 傳感技術(shù)的常用方法),而是依賴于來自高相干激光器的低功率頻率啁啾。這也稱為調(diào)頻連續(xù)波 (FMCW) 技術(shù),已用于最先進(jìn)的雷達(dá)傳感器。
相干光子可以行進(jìn)數(shù)百米,相互作用并獲取目標(biāo)的特征,然后在保持相干狀態(tài)的同時(shí)返回,它們可以與一部分出射光混合,實(shí)現(xiàn)近乎無損的放大。
將返回的光子與出射光子混合會(huì)導(dǎo)致拍頻從太赫茲區(qū)域的光頻率下變頻到低千兆赫茲區(qū)域,并且可以通過可用的電子電路輕松分析。
測(cè)量的距離以光學(xué)頻移的形式反映。如果測(cè)量點(diǎn)也具有徑向速度,則反射啁啾會(huì)增加多普勒頻移。
使用上下啁啾允許連貫的 3D 傳感器即時(shí)解析每個(gè)像素的范圍和速度。此功能有效地將 3D 感測(cè)擴(kuò)展到 4D,這意味著同時(shí)感測(cè)對(duì)象的 x、y、z 和速度矢量。
返回光子與一部分出射激光的混合導(dǎo)致幾乎無損的光學(xué)放大,從而實(shí)現(xiàn)更高的檢測(cè)靈敏度和準(zhǔn)確度。由于相干系統(tǒng)具有更高的檢測(cè)靈敏度,百毫瓦區(qū)域內(nèi)的激光功率水平通常足以測(cè)量數(shù)百米外的物體,從而使該技術(shù)能夠集成到芯片上以用于移動(dòng)應(yīng)用。
線偏振光子還可以在與目標(biāo)相互作用時(shí)改變它們的偏振狀態(tài),從而可以檢測(cè)材料和表面特征,例如窗戶或人體皮膚。
技術(shù)進(jìn)步和成本降低使 3D 視覺成為工業(yè)制造自動(dòng)化中用于提高生產(chǎn)力、效率和質(zhì)量的關(guān)鍵技術(shù)。由于有許多競(jìng)爭(zhēng)技術(shù)可用,技術(shù)的選擇通常由應(yīng)用程序決定,范圍從一般質(zhì)量檢查、驗(yàn)證、驗(yàn)證和分類以及安全和安保。
FMCW 承諾在多個(gè)維度上提高性能向量,允許在更遠(yuǎn)的范圍內(nèi)進(jìn)行更高精度的掃描,同時(shí)對(duì)人眼安全且不受室外照明條件或多系統(tǒng)串?dāng)_的影響。最重要的是,它通過為每次測(cè)量提供速度信息來提供原生 4D 視覺。
為什么連貫的 3D 傳感系統(tǒng)需要這么長(zhǎng)時(shí)間才能成為主流?
創(chuàng)建 FMCW 解決方案的關(guān)鍵挑戰(zhàn)是低成本、大批量制造高性能組件。相干方法需要具有長(zhǎng)相干長(zhǎng)度(窄線寬)的激光器和相干光處理來提取光子攜帶的額外信息。
這需要非常精確和低噪聲的光信號(hào)處理電路來形成相干接收器。此外,偏振在這里也起作用,因?yàn)橄喔膳念l僅適用于具有相同偏振的光子。激光源的波長(zhǎng)穩(wěn)定性和線性度在測(cè)量過程中至關(guān)重要;否則,信噪比會(huì)顯著降低。
使用分立元件創(chuàng)建這樣一個(gè)穩(wěn)定、穩(wěn)健且精確定義的光學(xué)系統(tǒng)非常具有挑戰(zhàn)性且成本高昂。為了解決這個(gè)問題,SiLC Technologies 創(chuàng)建了一種解決方案,該解決方案使用用于制造電子 IC 的半導(dǎo)體制造工藝將所有需要的光學(xué)功能集成到單個(gè)硅芯片中。
換句話說,集成到硅中的非常復(fù)雜的電子電路背后的相同方法已經(jīng)可以以非常低的成本實(shí)現(xiàn)消費(fèi)產(chǎn)品,現(xiàn)在可以部署用于制造用于光子學(xué)應(yīng)用的高度復(fù)雜的光學(xué)電路。
硅光子集成平臺(tái)使用成熟的半導(dǎo)體制造工藝將高性能組件集成到單個(gè)芯片中,提供低成本、緊湊和低功耗的解決方案。硅制造還為復(fù)雜的設(shè)備和技術(shù)提供了經(jīng)濟(jì)實(shí)惠的大批量擴(kuò)展。
總之,3D 視覺對(duì)于機(jī)器感知至關(guān)重要。使用 FMCW 技術(shù)的相干 3D 傳感是這些技術(shù)中的最新技術(shù),將視覺系統(tǒng)的性能特征擴(kuò)展到多個(gè)層面——甚至擴(kuò)展到第四維度。FMCW 傳感不是依賴飛行時(shí)間、立體視覺、三角測(cè)量或結(jié)構(gòu)光,而是利用光子本身的特性。
成本和所需的組件數(shù)量阻礙了利用這種方法??梢岳霉杓傻牧α亢蛯⒐韫庾赢a(chǎn)品推向市場(chǎng)的傳統(tǒng),最終將具有成本效益的相干視覺傳感器商業(yè)化。使用額外的瞬時(shí)速度信息,這將幫助機(jī)器更像人類一樣感知他們的環(huán)境。