如何為機器人規(guī)劃路線
引述外媒報道,在不久的將來,可能會派遣機器人作為最后一英里的送貨車輛,在您可以找到門的時候,在您家門口放下您的外賣訂單,包裹或餐包。
機器人導(dǎo)航的標(biāo)準(zhǔn)方法包括提前繪制區(qū)域,然后使用算法將機器人引向地圖上的特定目標(biāo)或GPS坐標(biāo)。盡管這種方法對于探索特定環(huán)境(例如特定建筑物的布局或計劃的障礙物路線)可能有意義,但在最后一英里交付的情況下可能變得笨拙。
例如,想象一下,必須預(yù)先繪制機器人交付區(qū)域內(nèi)的每個鄰居,包括該鄰居內(nèi)每個房子的配置以及每個房子前門的特定坐標(biāo)。這樣的任務(wù)可能難以擴展到整個城市,尤其是隨著房屋的外觀經(jīng)常隨季節(jié)變化而變化時。繪制每所房屋的地圖也可能會遇到安全和隱私問題。
現(xiàn)在,麻省理工學(xué)院的工程師已經(jīng)開發(fā)出一種導(dǎo)航方法,不需要預(yù)先繪制區(qū)域。取而代之的是,他們的方法使機器人能夠利用其環(huán)境中的線索來規(guī)劃到達其目的地的路線,這可以用一般的語義術(shù)語(例如“前門”或“車庫”)來描述,而不是作為地圖上的坐標(biāo)來描述。例如,如果指示機器人將包裹運送到某人的前門,則它可能會在道路上啟動并看到一條車道,該車道已經(jīng)過訓(xùn)練,可以識別出可能通往人行道,進而又可能導(dǎo)致人行道到前門。
這項新技術(shù)可以大大減少機器人在確定目標(biāo)之前花費在探索某處上的時間,而且它不依賴于特定住宅的地圖。
麻省理工學(xué)院機械工程系的研究生邁克爾·埃弗里特(Michael Everett)說:“我們不需要為每座需要參觀的建筑物繪制地圖?!?“通過這種技術(shù),我們希望將機器人放到任何車道的盡頭,讓它找到一扇門?!?/p>
埃弗里特(Everett)將在本周的國際智能機器人和系統(tǒng)會議上介紹該小組的成果。該論文由麻省理工學(xué)院的航空與航天學(xué)教授喬納森·霍(Jonathan How)與福特汽車公司的賈斯汀·米勒(Justin Miller)合著,是“認(rèn)知機器人最佳論文”的決賽入圍者。
“對事物的感覺”
近年來,研究人員致力于將自然的語義語言引入機器人系統(tǒng),訓(xùn)練機器人通過其語義標(biāo)簽識別對象,以便他們可以視覺上將門當(dāng)作一扇門,例如,而不是簡單地作為一個堅實的矩形障礙物。 。
“現(xiàn)在,我們有能力使機器人實時了解事物的狀態(tài),”埃弗里特說。
Everett,How和Miller將類似的語義技術(shù)用作其新導(dǎo)航方法的跳板,該方法利用了現(xiàn)有的算法,這些算法從可視數(shù)據(jù)中提取特征,以生成同一場景的新地圖,表示為語義線索或上下文。
在他們的案例中,研究人員使用一種算法在機器人四處移動時使用每個對象的語義標(biāo)簽和深度圖像來構(gòu)建環(huán)境圖。該算法稱為語義SLAM(同步本地化和映射)。
盡管其他語義算法使機器人能夠識別并映射環(huán)境中的對象,但它們并不允許機器人在導(dǎo)航新環(huán)境時即以最有效的路徑到達語義目的地時做出決定。例如“前門”。
“在進行探索之前,先放下一個機器人,然后說‘開始’,它會四處移動并最終到達那里,但是速度會很慢,” How說。
成本計算很重要
研究人員希望通過語義,上下文彩色的世界來加快機器人的路徑規(guī)劃。他們開發(fā)了一種新的“待用成本估算器”,該算法將通過預(yù)先存在的SLAM算法創(chuàng)建的語義圖轉(zhuǎn)換為第二張圖,表示任何給定位置接近目標(biāo)的可能性。
“這是受到圖像到圖像轉(zhuǎn)換的啟發(fā),您可以在其中拍攝貓的照片并使它看起來像狗,”埃弗里特說?!霸谶@里發(fā)生了相同類型的想法,您拍攝一張看起來像世界地圖的圖像,然后將其轉(zhuǎn)換為另一張看起來看起來像世界地圖的圖像,但是現(xiàn)在根據(jù)地圖上不同點的接近程度對其進行著色達到最終目標(biāo)。”
此“成本計算”地圖以彩色著色,以將較暗的區(qū)域表示為遠離目標(biāo)的位置,將較亮的區(qū)域表示為靠近目標(biāo)的區(qū)域。例如,在語義地圖中以黃色編碼的人行道,可以通過成本核算算法將其翻譯為新地圖中較暗的區(qū)域,而車道則在接近前門時逐漸變輕,新地圖中最亮的區(qū)域。
研究人員在來自Bing地圖的衛(wèi)星圖像上訓(xùn)練了這種新算法,該圖像包含來自一個城市和三個郊區(qū)的77棟房屋。該系統(tǒng)將語義圖轉(zhuǎn)換為可使用的成本圖,并按照最輕的區(qū)域映射出最有效的路徑,直至最終目標(biāo)。對于每個衛(wèi)星圖像,埃弗里特為典型的前院中的上下文特征分配語義標(biāo)簽和顏色,例如前門為灰色,車道為藍色,綠籬為綠色。
在此培訓(xùn)過程中,團隊還對每個圖像應(yīng)用了蒙版,以模仿機器人的攝像機經(jīng)過院子時可能具有的局部視圖。
“我們方法的部分技巧是[提供系統(tǒng)]許多局部圖像,” How解釋道?!耙虼?,它真的必須弄清楚所有這些東西是如何相互關(guān)聯(lián)的。這就是使這項工作穩(wěn)定進行的部分原因?!?/p>
然后,研究人員在訓(xùn)練數(shù)據(jù)集之外的一所全新房屋的圖像模擬中測試了他們的方法,首先使用預(yù)先存在的SLAM算法生成語義圖,然后使用其新的成本估算器生成第二張地圖和通往目標(biāo)的路徑(在這種情況下為前門)。
該小組的新的成本管理技術(shù)發(fā)現(xiàn)前門的速度比經(jīng)典導(dǎo)航算法快了189%,后者沒有考慮上下文或語義,而是花了過多的步驟來探索不太可能達到其目標(biāo)的區(qū)域。
埃弗里特說,結(jié)果說明了即使在陌生的,未映射的環(huán)境中,機器人也可以使用上下文有效地定位目標(biāo)。
埃弗里特說:“即使機器人將包裹運送到從未去過的環(huán)境中,也可能會有與所見過的其他地方相同的線索?!?“因此,世界的布局可能有所不同,但是可能存在一些共同點?!?/p>
這項研究得到福特汽車公司的部分支持。