新 3D 視覺技術(shù),以幫助機器更像人類一樣感知環(huán)境
可以幫助做家務(wù)、為我們提供司機和替代工廠工人的自主機器人的夢想比 1960 年代播出的 Jetsons 系列的存在時間更長。現(xiàn)實情況是,許多公司已承諾到 2020 年推出自動駕駛汽車,但我們?nèi)栽诘却?。服?wù)機器人和工業(yè)自動化領(lǐng)域的情況并沒有太大的不同。
為什么需要這么長時間?
一個關(guān)鍵方面是機器如何感知他們的環(huán)境。雖然機器人視覺在過去十年中取得了長足的進步,部分原因在于更高分辨率的相機和新的 3D 視覺技術(shù),但它在感知環(huán)境方面的效率仍然遠低于人類。
事實上,目前的方法可能從一開始就錯了。例如,我們?nèi)祟惒粫詳?shù)百萬像素的分辨率將我們的周圍環(huán)境數(shù)字化,然后小心翼翼地嘗試尋找物體的輪廓并逐幀比較這些輪廓以得出它們的運動路徑。
想象一下,我們用放大鏡篩選數(shù)百萬像素的圖像,將對比度和顏色的細微變化標記為可能的對象,然后以每秒 10 幀的速度進行此操作,以跟蹤和預(yù)測假設(shè)對象的運動。
人類感知的工作方式不同。我們的眼睛是大腦的延伸,可以預(yù)處理大量信息。結(jié)果,我們的視網(wǎng)膜中有更多的運動敏感細胞,如果有東西在我們的視野中移動,我們會立即意識到。只有這樣,我們才能使用黃斑中的高分辨率細胞來識別感興趣的對象——這是一種更有效的對象識別、跟蹤和預(yù)測方式。
輸入現(xiàn)在可用的新 3D 視覺技術(shù),以幫助機器更像人類一樣感知環(huán)境。它被稱為連貫的視覺。
該技術(shù)發(fā)出相干激光并捕獲的不僅僅是來自返回光子的強度信息。它還捕獲由物體運動引起的微小頻率變化,并提供有關(guān)通過偏振變化感測到的材料和表面的信息。
現(xiàn)有的 3D 傳感技術(shù)包括直接和間接飛行時間方法、投影 IR 模式(也稱為結(jié)構(gòu)光)和立體視覺等三角測量技術(shù)。并非所有這些都提供瞬時運動信息,并且通常在范圍、眼睛安全、串擾抗擾度和精度方面存在重大權(quán)衡。
相干 3D 傳感方法不依賴于檢測光強度變化(現(xiàn)有 3D 傳感技術(shù)的常用方法),而是依賴于來自高相干激光器的低功率頻率啁啾。這也稱為調(diào)頻連續(xù)波 (FMCW) 技術(shù),已用于最先進的雷達傳感器。
相干光子可以行進數(shù)百米,相互作用并獲取目標的特征,然后在保持相干狀態(tài)的同時返回,它們可以與一部分出射光混合,實現(xiàn)近乎無損的放大。
將返回的光子與出射光子混合會導(dǎo)致拍頻從太赫茲區(qū)域的光頻率下變頻到低千兆赫茲區(qū)域,并且可以通過可用的電子電路輕松分析。
測量的距離以光學(xué)頻移的形式反映。如果測量點也具有徑向速度,則反射啁啾會增加多普勒頻移。
使用上下啁啾允許連貫的 3D 傳感器即時解析每個像素的范圍和速度。此功能有效地將 3D 感測擴展到 4D,這意味著同時感測對象的 x、y、z 和速度矢量。
返回光子與一部分出射激光的混合導(dǎo)致幾乎無損的光學(xué)放大,從而實現(xiàn)更高的檢測靈敏度和準確度。由于相干系統(tǒng)具有更高的檢測靈敏度,百毫瓦區(qū)域內(nèi)的激光功率水平通常足以測量數(shù)百米外的物體,從而使該技術(shù)能夠集成到芯片上以用于移動應(yīng)用。
線偏振光子還可以在與目標相互作用時改變它們的偏振狀態(tài),從而可以檢測材料和表面特征,例如窗戶或人體皮膚。
技術(shù)進步和成本降低使 3D 視覺成為工業(yè)制造自動化中用于提高生產(chǎn)力、效率和質(zhì)量的關(guān)鍵技術(shù)。由于有許多競爭技術(shù)可用,技術(shù)的選擇通常由應(yīng)用程序決定,范圍從一般質(zhì)量檢查、驗證、驗證和分類以及安全和安保。
FMCW 承諾在多個維度上提高性能向量,允許在更遠的范圍內(nèi)進行更高精度的掃描,同時對人眼安全且不受室外照明條件或多系統(tǒng)串擾的影響。最重要的是,它通過為每次測量提供速度信息來提供原生 4D 視覺。
為什么連貫的 3D 傳感系統(tǒng)需要這么長時間才能成為主流?
創(chuàng)建 FMCW 解決方案的關(guān)鍵挑戰(zhàn)是低成本、大批量制造高性能組件。相干方法需要具有長相干長度(窄線寬)的激光器和相干光處理來提取光子攜帶的額外信息。
這需要非常精確和低噪聲的光信號處理電路來形成相干接收器。此外,偏振在這里也起作用,因為相干拍頻僅適用于具有相同偏振的光子。激光源的波長穩(wěn)定性和線性度在測量過程中至關(guān)重要;否則,信噪比會顯著降低。
使用分立元件創(chuàng)建這樣一個穩(wěn)定、穩(wěn)健且精確定義的光學(xué)系統(tǒng)非常具有挑戰(zhàn)性且成本高昂。為了解決這個問題,SiLC Technologies 創(chuàng)建了一種解決方案,該解決方案使用用于制造電子 IC 的半導(dǎo)體制造工藝將所有需要的光學(xué)功能集成到單個硅芯片中。
換句話說,集成到硅中的非常復(fù)雜的電子電路背后的相同方法已經(jīng)可以以非常低的成本實現(xiàn)消費產(chǎn)品,現(xiàn)在可以部署用于制造用于光子學(xué)應(yīng)用的高度復(fù)雜的光學(xué)電路。
硅光子集成平臺使用成熟的半導(dǎo)體制造工藝將高性能組件集成到單個芯片中,提供低成本、緊湊和低功耗的解決方案。硅制造還為復(fù)雜的設(shè)備和技術(shù)提供了經(jīng)濟實惠的大批量擴展。
總之,3D 視覺對于機器感知至關(guān)重要。使用 FMCW 技術(shù)的相干 3D 傳感是這些技術(shù)中的最新技術(shù),將視覺系統(tǒng)的性能特征擴展到多個層面——甚至擴展到第四維度。FMCW 傳感不是依賴飛行時間、立體視覺、三角測量或結(jié)構(gòu)光,而是利用光子本身的特性。
成本和所需的組件數(shù)量阻礙了利用這種方法。可以利用硅集成的力量和將硅光子產(chǎn)品推向市場的傳統(tǒng),最終將具有成本效益的相干視覺傳感器商業(yè)化。使用額外的瞬時速度信息,這將幫助機器更像人類一樣感知他們的環(huán)境。