機(jī)器人中加入導(dǎo)航技術(shù)可以使其變得更智能
掃描二維碼
隨時(shí)隨地手機(jī)看文章
在不遠(yuǎn)的將來(lái),機(jī)器人可能會(huì)作為最后一英里的運(yùn)輸工具被派往你家門(mén)口,如果他們能找到門(mén)的話,就可以把你的外賣訂單、包裹或餐盒訂購(gòu)單放到你家門(mén)口。
機(jī)器人導(dǎo)航的標(biāo)準(zhǔn)方法包括預(yù)先繪制一個(gè)區(qū)域的地圖,然后使用算法引導(dǎo)機(jī)器人朝向地圖上的特定目標(biāo)或GPS坐標(biāo)。雖然這種方法對(duì)于探索特定環(huán)境(如特定建筑的布局或計(jì)劃的障礙路線)可能是有意義的,但在最后一英里交付的情況下,這種方法可能會(huì)變得笨拙。
例如,想象一下,公司必須事先繪制機(jī)器人傳送區(qū)域內(nèi)每個(gè)鄰居的地圖,包括該鄰居內(nèi)每個(gè)房子的配置以及每個(gè)房子前門(mén)的特定坐標(biāo),這個(gè)任務(wù)量會(huì)讓人崩潰。同樣,這樣的任務(wù)額很難擴(kuò)展到整個(gè)城市,特別是房屋的外觀經(jīng)常隨著季節(jié)的變化而變化(羨慕國(guó)外)。繪制每間房子的地圖也可能會(huì)遇到安全和隱私問(wèn)題。
新技術(shù)
現(xiàn)在麻省理工學(xué)院的工程師已經(jīng)開(kāi)發(fā)出一種導(dǎo)航方法,不需要事先繪制一個(gè)區(qū)域。相反,他們的方法使機(jī)器人能夠利用環(huán)境中的線索規(guī)劃到目的地的路線,這可以用一般的語(yǔ)義術(shù)語(yǔ)來(lái)描述,例如“前門(mén)”或“車庫(kù)”,而不是地圖上的坐標(biāo)。例如,如果一個(gè)機(jī)器人接到指令,要把包裹送到某人的前門(mén),它可能會(huì)從馬路上開(kāi)始,看到一條車道,經(jīng)過(guò)訓(xùn)練,它認(rèn)識(shí)到這條車道有可能通向人行道,而人行道又有可能通向前門(mén)。
這項(xiàng)新技術(shù)可以大大減少機(jī)器人在識(shí)別目標(biāo)之前探索一處房產(chǎn)的時(shí)間,而且它不依賴特定住宅的地圖。麻省理工學(xué)院機(jī)械工程系的研究生邁克爾·埃弗雷特(Michael Everett)說(shuō):“我們不想把我們需要去的每一棟建筑都繪制成地圖?!庇辛诉@項(xiàng)技術(shù),我們希望在任何車道的盡頭都能放下一個(gè)機(jī)器人,讓它找到一扇門(mén)?!?/p>
埃弗雷特將在本周的智能機(jī)器人和系統(tǒng)國(guó)際會(huì)議上介紹該技術(shù)的成果。這篇論文由麻省理工學(xué)院航空航天學(xué)教授喬納森·豪斯(jonathan how)和福特汽車公司(ford motor company)的賈斯汀·米勒(justin miller)共同撰寫(xiě),是“認(rèn)知機(jī)器人最佳論文”的最終入圍者。
“對(duì)事物的感覺(jué)”
近年來(lái),研究人員致力于將自然的語(yǔ)義語(yǔ)言引入機(jī)器人系統(tǒng),訓(xùn)練機(jī)器人通過(guò)語(yǔ)義標(biāo)簽識(shí)別物體,這樣他們就可以將一扇門(mén)視為一扇門(mén),而不僅僅是一個(gè)實(shí)心的矩形障礙物。
埃弗雷特說(shuō):“現(xiàn)在我們有能力讓機(jī)器人實(shí)時(shí)感知事物的本質(zhì)。”埃弗雷特、豪斯和米勒正在使用類似的語(yǔ)義技術(shù)作為他們的新導(dǎo)航方法的跳板,它利用預(yù)先存在的算法從視覺(jué)數(shù)據(jù)中提取特征以生成同一場(chǎng)景的新地圖,從而用語(yǔ)義線索或上下文進(jìn)行分析。
在他們的案例中,研究人員使用一種算法來(lái)建立機(jī)器人移動(dòng)時(shí)的環(huán)境地圖,使用每個(gè)物體的語(yǔ)義標(biāo)簽和深度圖像這種算法稱為語(yǔ)義SLAM(同時(shí)定位和映射)。雖然其他語(yǔ)義算法使機(jī)器人能夠識(shí)別和映射環(huán)境中的對(duì)象,但它們不允許機(jī)器人在導(dǎo)航新環(huán)境的同時(shí),在最有效的路徑上做出決策,以到達(dá)語(yǔ)義目的地,如“前門(mén)”,霍華德說(shuō):“以前,探索只是把一個(gè)機(jī)器人撲通一聲放下來(lái),對(duì)它說(shuō)‘走’,它會(huì)四處移動(dòng),雖然最終到達(dá)那里,但速度會(huì)很慢?!?/p>
去的代價(jià)
研究人員希望通過(guò)一個(gè)語(yǔ)義的、背景色的世界來(lái)加速機(jī)器人的路徑規(guī)劃。他們開(kāi)發(fā)了一種新的“去代價(jià)估計(jì)器”,該算法將現(xiàn)有SLAM算法創(chuàng)建的語(yǔ)義映射轉(zhuǎn)換成第二個(gè)映射,表示任何給定位置接近目標(biāo)的可能性。
埃弗雷特說(shuō):“這是從一個(gè)圖像到另一個(gè)圖像的轉(zhuǎn)換中得到的靈感,在這里你拍下一只貓的照片,讓它看起來(lái)像一只狗。”同樣的想法也會(huì)在這里發(fā)生,以前你把一張看起來(lái)像世界地圖的圖像,可以變成另一張看起來(lái)像世界地圖的圖像,但現(xiàn)在是根據(jù)地圖上不同點(diǎn)與最終目標(biāo)的距離來(lái)著色的?!?/p>
這個(gè)成本地圖是彩色的,用灰度表示,把較暗的區(qū)域表示為遠(yuǎn)離目標(biāo)的位置,把較亮的區(qū)域表示為接近目標(biāo)的區(qū)域。例如,在語(yǔ)義地圖中用黃色編碼的人行道,可能會(huì)被cost-to-go算法轉(zhuǎn)換為新地圖中較暗的區(qū)域,而車道在接近前門(mén)時(shí)會(huì)逐漸變亮,這是新地圖中最亮的區(qū)域。
研究人員在Bing地圖的衛(wèi)星圖像上訓(xùn)練了這種新算法,這些圖像包含來(lái)自一個(gè)城市和三個(gè)郊區(qū)的77棟房屋。該系統(tǒng)將語(yǔ)義映射轉(zhuǎn)換為代價(jià)映射,并按照映射中較輕的區(qū)域映射出最有效的路徑,以達(dá)到最終目標(biāo)對(duì)于每個(gè)衛(wèi)星圖像,埃弗雷特都為典型前院的上下文特征指定語(yǔ)義標(biāo)簽和顏色,例如灰色表示前門(mén),藍(lán)色表示車道,綠色表示樹(shù)籬。
在這個(gè)訓(xùn)練過(guò)程中,研究小組還對(duì)每幅圖像應(yīng)用了蒙版,以模擬機(jī)器人的相機(jī)在穿越院子時(shí)可能擁有的部分視圖?!拔覀兎椒ǖ囊徊糠衷E竅是(給系統(tǒng))提供許多部分圖像,”How解釋道。所以它必須弄清楚這些東西是如何相互關(guān)聯(lián)的,這正是這項(xiàng)工作得以穩(wěn)健開(kāi)展的部分原因?!?/p>
然后,研究人員在訓(xùn)練數(shù)據(jù)集之外的一所全新房屋的圖像模擬中測(cè)試了他們的方法,首先使用預(yù)先存在的SLAM算法生成語(yǔ)義圖,然后使用其新的成本估算器生成第二張地圖和通往目標(biāo)的路徑(在這種情況下為前門(mén))。
對(duì)比傳統(tǒng)的導(dǎo)航算法,該集團(tuán)的“去發(fā)現(xiàn)前車門(mén)”新技術(shù)更高效與低成本,這種算法比不考慮上下文或語(yǔ)義的經(jīng)典導(dǎo)航算法快189%,以往的方法花費(fèi)了過(guò)多的步驟來(lái)探索不太可能接近目標(biāo)的領(lǐng)域。埃弗雷特說(shuō),研究結(jié)果說(shuō)明了機(jī)器人是如何利用上下文來(lái)有效地定位目標(biāo),即使是在不熟悉的、未映射的環(huán)境中。
埃弗雷特說(shuō):“即使一個(gè)機(jī)器人正在把一個(gè)包裹送到一個(gè)它從未去過(guò)的環(huán)境中,也可能會(huì)有一些線索和它看到的其他地方一樣?!彼?,即便世界的布局可能有點(diǎn)不同,但必然可能有一些共同點(diǎn)?!蔽覀円龅闹皇亲寵C(jī)器人發(fā)現(xiàn)和使用這些共通點(diǎn)!