如何為機(jī)器人規(guī)劃路線

時(shí)間：2020-05-18 17:24:01

關(guān)鍵字：機(jī)器人映射 EV 麻省理工學(xué)院

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀] 引述外媒報(bào)道，在不久的將來，可能會(huì)派遣機(jī)器人作為最后一英里的送貨車輛，在您可以找到門的時(shí)候，在您家門口放下您的外賣訂單，包裹或餐包。機(jī)器人導(dǎo)航的標(biāo)準(zhǔn)方法包括提前繪制區(qū)域，然后使用算法將

引述外媒報(bào)道，在不久的將來，可能會(huì)派遣機(jī)器人作為最后一英里的送貨車輛，在您可以找到門的時(shí)候，在您家門口放下您的外賣訂單，包裹或餐包。

機(jī)器人導(dǎo)航的標(biāo)準(zhǔn)方法包括提前繪制區(qū)域，然后使用算法將機(jī)器人引向地圖上的特定目標(biāo)或GPS坐標(biāo)。盡管這種方法對于探索特定環(huán)境（例如特定建筑物的布局或計(jì)劃的障礙物路線）可能有意義，但在最后一英里交付的情況下可能變得笨拙。

例如，想象一下，必須預(yù)先繪制機(jī)器人交付區(qū)域內(nèi)的每個(gè)鄰居，包括該鄰居內(nèi)每個(gè)房子的配置以及每個(gè)房子前門的特定坐標(biāo)。這樣的任務(wù)可能難以擴(kuò)展到整個(gè)城市，尤其是隨著房屋的外觀經(jīng)常隨季節(jié)變化而變化時(shí)。繪制每所房屋的地圖也可能會(huì)遇到安全和隱私問題。

現(xiàn)在，麻省理工學(xué)院的工程師已經(jīng)開發(fā)出一種導(dǎo)航方法，不需要預(yù)先繪制區(qū)域。取而代之的是，他們的方法使機(jī)器人能夠利用其環(huán)境中的線索來規(guī)劃到達(dá)其目的地的路線，這可以用一般的語義術(shù)語（例如“前門”或“車庫”）來描述，而不是作為地圖上的坐標(biāo)來描述。例如，如果指示機(jī)器人將包裹運(yùn)送到某人的前門，則它可能會(huì)在道路上啟動(dòng)并看到一條車道，該車道已經(jīng)過訓(xùn)練，可以識(shí)別出可能通往人行道，進(jìn)而又可能導(dǎo)致人行道到前門。

這項(xiàng)新技術(shù)可以大大減少機(jī)器人在確定目標(biāo)之前花費(fèi)在探索某處上的時(shí)間，而且它不依賴于特定住宅的地圖。

麻省理工學(xué)院機(jī)械工程系的研究生邁克爾·埃弗里特（Michael Everett）說：“我們不需要為每座需要參觀的建筑物繪制地圖?！?“通過這種技術(shù)，我們希望將機(jī)器人放到任何車道的盡頭，讓它找到一扇門?！?/p>

埃弗里特（Everett）將在本周的國際智能機(jī)器人和系統(tǒng)會(huì)議上介紹該小組的成果。該論文由麻省理工學(xué)院的航空與航天學(xué)教授喬納森·霍（Jonathan How）與福特汽車公司的賈斯汀·米勒（Justin Miller）合著，是“認(rèn)知機(jī)器人最佳論文”的決賽入圍者。

“對事物的感覺”

近年來，研究人員致力于將自然的語義語言引入機(jī)器人系統(tǒng)，訓(xùn)練機(jī)器人通過其語義標(biāo)簽識(shí)別對象，以便他們可以視覺上將門當(dāng)作一扇門，例如，而不是簡單地作為一個(gè)堅(jiān)實(shí)的矩形障礙物。。

“現(xiàn)在，我們有能力使機(jī)器人實(shí)時(shí)了解事物的狀態(tài)，”埃弗里特說。

Everett，How和Miller將類似的語義技術(shù)用作其新導(dǎo)航方法的跳板，該方法利用了現(xiàn)有的算法，這些算法從可視數(shù)據(jù)中提取特征，以生成同一場景的新地圖，表示為語義線索或上下文。

在他們的案例中，研究人員使用一種算法在機(jī)器人四處移動(dòng)時(shí)使用每個(gè)對象的語義標(biāo)簽和深度圖像來構(gòu)建環(huán)境圖。該算法稱為語義SLAM（同步本地化和映射）。

盡管其他語義算法使機(jī)器人能夠識(shí)別并映射環(huán)境中的對象，但它們并不允許機(jī)器人在導(dǎo)航新環(huán)境時(shí)即以最有效的路徑到達(dá)語義目的地時(shí)做出決定。例如“前門”。

“在進(jìn)行探索之前，先放下一個(gè)機(jī)器人，然后說‘開始’，它會(huì)四處移動(dòng)并最終到達(dá)那里，但是速度會(huì)很慢，” How說。

成本計(jì)算很重要

研究人員希望通過語義，上下文彩色的世界來加快機(jī)器人的路徑規(guī)劃。他們開發(fā)了一種新的“待用成本估算器”，該算法將通過預(yù)先存在的SLAM算法創(chuàng)建的語義圖轉(zhuǎn)換為第二張圖，表示任何給定位置接近目標(biāo)的可能性。

“這是受到圖像到圖像轉(zhuǎn)換的啟發(fā)，您可以在其中拍攝貓的照片并使它看起來像狗，”埃弗里特說?！霸谶@里發(fā)生了相同類型的想法，您拍攝一張看起來像世界地圖的圖像，然后將其轉(zhuǎn)換為另一張看起來看起來像世界地圖的圖像，但是現(xiàn)在根據(jù)地圖上不同點(diǎn)的接近程度對其進(jìn)行著色達(dá)到最終目標(biāo)。”

此“成本計(jì)算”地圖以彩色著色，以將較暗的區(qū)域表示為遠(yuǎn)離目標(biāo)的位置，將較亮的區(qū)域表示為靠近目標(biāo)的區(qū)域。例如，在語義地圖中以黃色編碼的人行道，可以通過成本核算算法將其翻譯為新地圖中較暗的區(qū)域，而車道則在接近前門時(shí)逐漸變輕，新地圖中最亮的區(qū)域。

研究人員在來自Bing地圖的衛(wèi)星圖像上訓(xùn)練了這種新算法，該圖像包含來自一個(gè)城市和三個(gè)郊區(qū)的77棟房屋。該系統(tǒng)將語義圖轉(zhuǎn)換為可使用的成本圖，并按照最輕的區(qū)域映射出最有效的路徑，直至最終目標(biāo)。對于每個(gè)衛(wèi)星圖像，埃弗里特為典型的前院中的上下文特征分配語義標(biāo)簽和顏色，例如前門為灰色，車道為藍(lán)色，綠籬為綠色。

在此培訓(xùn)過程中，團(tuán)隊(duì)還對每個(gè)圖像應(yīng)用了蒙版，以模仿機(jī)器人的攝像機(jī)經(jīng)過院子時(shí)可能具有的局部視圖。

“我們方法的部分技巧是［提供系統(tǒng)］許多局部圖像，” How解釋道?！耙虼耍娴谋仨毰宄羞@些東西是如何相互關(guān)聯(lián)的。這就是使這項(xiàng)工作穩(wěn)定進(jìn)行的部分原因?！?/p>

然后，研究人員在訓(xùn)練數(shù)據(jù)集之外的一所全新房屋的圖像模擬中測試了他們的方法，首先使用預(yù)先存在的SLAM算法生成語義圖，然后使用其新的成本估算器生成第二張地圖和通往目標(biāo)的路徑（在這種情況下為前門）。

該小組的新的成本管理技術(shù)發(fā)現(xiàn)前門的速度比經(jīng)典導(dǎo)航算法快了189％，后者沒有考慮上下文或語義，而是花了過多的步驟來探索不太可能達(dá)到其目標(biāo)的區(qū)域。

埃弗里特說，結(jié)果說明了即使在陌生的，未映射的環(huán)境中，機(jī)器人也可以使用上下文有效地定位目標(biāo)。

埃弗里特說：“即使機(jī)器人將包裹運(yùn)送到從未去過的環(huán)境中，也可能會(huì)有與所見過的其他地方相同的線索。” “因此，世界的布局可能有所不同，但是可能存在一些共同點(diǎn)?！?/p>

這項(xiàng)研究得到福特汽車公司的部分支持。