如何為機(jī)器人規(guī)劃路線
引述外媒報(bào)道,在不久的將來,可能會(huì)派遣機(jī)器人作為最后一英里的送貨車輛,在您可以找到門的時(shí)候,在您家門口放下您的外賣訂單,包裹或餐包。
機(jī)器人導(dǎo)航的標(biāo)準(zhǔn)方法包括提前繪制區(qū)域,然后使用算法將機(jī)器人引向地圖上的特定目標(biāo)或GPS坐標(biāo)。盡管這種方法對于探索特定環(huán)境(例如特定建筑物的布局或計(jì)劃的障礙物路線)可能有意義,但在最后一英里交付的情況下可能變得笨拙。
例如,想象一下,必須預(yù)先繪制機(jī)器人交付區(qū)域內(nèi)的每個(gè)鄰居,包括該鄰居內(nèi)每個(gè)房子的配置以及每個(gè)房子前門的特定坐標(biāo)。這樣的任務(wù)可能難以擴(kuò)展到整個(gè)城市,尤其是隨著房屋的外觀經(jīng)常隨季節(jié)變化而變化時(shí)。繪制每所房屋的地圖也可能會(huì)遇到安全和隱私問題。
現(xiàn)在,麻省理工學(xué)院的工程師已經(jīng)開發(fā)出一種導(dǎo)航方法,不需要預(yù)先繪制區(qū)域。取而代之的是,他們的方法使機(jī)器人能夠利用其環(huán)境中的線索來規(guī)劃到達(dá)其目的地的路線,這可以用一般的語義術(shù)語(例如“前門”或“車庫”)來描述,而不是作為地圖上的坐標(biāo)來描述。例如,如果指示機(jī)器人將包裹運(yùn)送到某人的前門,則它可能會(huì)在道路上啟動(dòng)并看到一條車道,該車道已經(jīng)過訓(xùn)練,可以識(shí)別出可能通往人行道,進(jìn)而又可能導(dǎo)致人行道到前門。
這項(xiàng)新技術(shù)可以大大減少機(jī)器人在確定目標(biāo)之前花費(fèi)在探索某處上的時(shí)間,而且它不依賴于特定住宅的地圖。
麻省理工學(xué)院機(jī)械工程系的研究生邁克爾·埃弗里特(Michael Everett)說:“我們不需要為每座需要參觀的建筑物繪制地圖?!?“通過這種技術(shù),我們希望將機(jī)器人放到任何車道的盡頭,讓它找到一扇門?!?/p>
埃弗里特(Everett)將在本周的國際智能機(jī)器人和系統(tǒng)會(huì)議上介紹該小組的成果。該論文由麻省理工學(xué)院的航空與航天學(xué)教授喬納森·霍(Jonathan How)與福特汽車公司的賈斯汀·米勒(Justin Miller)合著,是“認(rèn)知機(jī)器人最佳論文”的決賽入圍者。
“對事物的感覺”
近年來,研究人員致力于將自然的語義語言引入機(jī)器人系統(tǒng),訓(xùn)練機(jī)器人通過其語義標(biāo)簽識(shí)別對象,以便他們可以視覺上將門當(dāng)作一扇門,例如,而不是簡單地作為一個(gè)堅(jiān)實(shí)的矩形障礙物。 。
“現(xiàn)在,我們有能力使機(jī)器人實(shí)時(shí)了解事物的狀態(tài),”埃弗里特說。
Everett,How和Miller將類似的語義技術(shù)用作其新導(dǎo)航方法的跳板,該方法利用了現(xiàn)有的算法,這些算法從可視數(shù)據(jù)中提取特征,以生成同一場景的新地圖,表示為語義線索或上下文。
在他們的案例中,研究人員使用一種算法在機(jī)器人四處移動(dòng)時(shí)使用每個(gè)對象的語義標(biāo)簽和深度圖像來構(gòu)建環(huán)境圖。該算法稱為語義SLAM(同步本地化和映射)。
盡管其他語義算法使機(jī)器人能夠識(shí)別并映射環(huán)境中的對象,但它們并不允許機(jī)器人在導(dǎo)航新環(huán)境時(shí)即以最有效的路徑到達(dá)語義目的地時(shí)做出決定。例如“前門”。
“在進(jìn)行探索之前,先放下一個(gè)機(jī)器人,然后說‘開始’,它會(huì)四處移動(dòng)并最終到達(dá)那里,但是速度會(huì)很慢,” How說。
成本計(jì)算很重要
研究人員希望通過語義,上下文彩色的世界來加快機(jī)器人的路徑規(guī)劃。他們開發(fā)了一種新的“待用成本估算器”,該算法將通過預(yù)先存在的SLAM算法創(chuàng)建的語義圖轉(zhuǎn)換為第二張圖,表示任何給定位置接近目標(biāo)的可能性。
“這是受到圖像到圖像轉(zhuǎn)換的啟發(fā),您可以在其中拍攝貓的照片并使它看起來像狗,”埃弗里特說?!霸谶@里發(fā)生了相同類型的想法,您拍攝一張看起來像世界地圖的圖像,然后將其轉(zhuǎn)換為另一張看起來看起來像世界地圖的圖像,但是現(xiàn)在根據(jù)地圖上不同點(diǎn)的接近程度對其進(jìn)行著色達(dá)到最終目標(biāo)。”
此“成本計(jì)算”地圖以彩色著色,以將較暗的區(qū)域表示為遠(yuǎn)離目標(biāo)的位置,將較亮的區(qū)域表示為靠近目標(biāo)的區(qū)域。例如,在語義地圖中以黃色編碼的人行道,可以通過成本核算算法將其翻譯為新地圖中較暗的區(qū)域,而車道則在接近前門時(shí)逐漸變輕,新地圖中最亮的區(qū)域。
研究人員在來自Bing地圖的衛(wèi)星圖像上訓(xùn)練了這種新算法,該圖像包含來自一個(gè)城市和三個(gè)郊區(qū)的77棟房屋。該系統(tǒng)將語義圖轉(zhuǎn)換為可使用的成本圖,并按照最輕的區(qū)域映射出最有效的路徑,直至最終目標(biāo)。對于每個(gè)衛(wèi)星圖像,埃弗里特為典型的前院中的上下文特征分配語義標(biāo)簽和顏色,例如前門為灰色,車道為藍(lán)色,綠籬為綠色。
在此培訓(xùn)過程中,團(tuán)隊(duì)還對每個(gè)圖像應(yīng)用了蒙版,以模仿機(jī)器人的攝像機(jī)經(jīng)過院子時(shí)可能具有的局部視圖。
“我們方法的部分技巧是[提供系統(tǒng)]許多局部圖像,” How解釋道?!耙虼耍娴谋仨毰宄羞@些東西是如何相互關(guān)聯(lián)的。這就是使這項(xiàng)工作穩(wěn)定進(jìn)行的部分原因?!?/p>
然后,研究人員在訓(xùn)練數(shù)據(jù)集之外的一所全新房屋的圖像模擬中測試了他們的方法,首先使用預(yù)先存在的SLAM算法生成語義圖,然后使用其新的成本估算器生成第二張地圖和通往目標(biāo)的路徑(在這種情況下為前門)。
該小組的新的成本管理技術(shù)發(fā)現(xiàn)前門的速度比經(jīng)典導(dǎo)航算法快了189%,后者沒有考慮上下文或語義,而是花了過多的步驟來探索不太可能達(dá)到其目標(biāo)的區(qū)域。
埃弗里特說,結(jié)果說明了即使在陌生的,未映射的環(huán)境中,機(jī)器人也可以使用上下文有效地定位目標(biāo)。
埃弗里特說:“即使機(jī)器人將包裹運(yùn)送到從未去過的環(huán)境中,也可能會(huì)有與所見過的其他地方相同的線索。” “因此,世界的布局可能有所不同,但是可能存在一些共同點(diǎn)?!?/p>
這項(xiàng)研究得到福特汽車公司的部分支持。