經(jīng)過(guò)訓(xùn)練 機(jī)器人或許能學(xué)會(huì)建造笨拙的宜家家具
掃描二維碼
隨時(shí)隨地手機(jī)看文章
這已經(jīng)成為人們進(jìn)入他們的第一套公寓的真實(shí)途徑:從一組神秘的圖片中組裝一件宜家家具,而不會(huì)讓您或有問(wèn)題的物品掉落。
南加州大學(xué)的研究人員認(rèn)為,還有更好的方法是用拷問(wèn)教機(jī)器人來(lái)操縱周?chē)氖澜?。繼去年研究人員的腳步之后,研究人員用機(jī)器人手臂組裝了那些經(jīng)典的Stefan椅子(機(jī)器人學(xué)家喜歡宜家),他們正在向機(jī)器人技術(shù)界贈(zèng)送一個(gè)新的模擬器,以訓(xùn)練機(jī)器人將廉價(jià)的瑞典家具組裝在一起。最終,他們希望機(jī)器將開(kāi)始對(duì)新穎的物體采用我們自己的靈巧性和適應(yīng)性。女士們,先生們和機(jī)器人們,抓住您的內(nèi)六角扳手。
對(duì)于您和我來(lái)說(shuō),從宜家(Ikea)組裝東西既簡(jiǎn)單又令人討厭:您為這一過(guò)程感到遺憾,但是您的大腦可以(大部分)將抽象的指令轉(zhuǎn)換為真實(shí)的東西。您遇到了各種各樣的問(wèn)題,但是您的創(chuàng)造力可以輕松克服。內(nèi)六角扳手使您的手抽筋,但您的操作力無(wú)與倫比。
對(duì)于機(jī)器人來(lái)說(shuō),這完全是恐怖。當(dāng)然,機(jī)器人已經(jīng)在流水線上工作了數(shù)十年,但它們只是肌肉。例如,它們將車(chē)門(mén)之類(lèi)的大件抬起就位,而人類(lèi)則負(fù)責(zé)精細(xì)的操作,例如擰入微小的零件。機(jī)器人的環(huán)境是高度組織化,這樣的機(jī)器從來(lái)沒(méi)有湊合,即使它們是足夠聰明的話,他們的不可預(yù)測(cè)性將會(huì)把他們的人類(lèi)同事的風(fēng)險(xiǎn)。
但是,如果我們希望機(jī)器人能在我們的房屋中得到任何使用,那么它們必須更加靈活。為了使它們到達(dá)那里,也許他們需要練習(xí)建造宜家家具-這是一個(gè)多方面的問(wèn)題,可以教給機(jī)器很多課程。
這些研究人員通過(guò)模擬現(xiàn)實(shí)世界的物理原理(如重力和摩擦力)來(lái)構(gòu)建3D數(shù)字游樂(lè)場(chǎng)。它們還可以使用諸如光照和紋理之類(lèi)的變量。在這種環(huán)境下,他們將模擬不同的機(jī)器人,例如單臂索耶(Sawyer)和兩臂百特(Baxter),并讓他們玩80多種不同的椅子,桌子,書(shū)柜等。所有這些都是由游戲引擎Unity渲染的,因此我們?nèi)祟?lèi)可以看到機(jī)器人的進(jìn)度。
當(dāng)Sawyer和Baxter存在于現(xiàn)實(shí)世界中并且可以在任何數(shù)量的機(jī)器人實(shí)驗(yàn)室中學(xué)習(xí)時(shí),為什么還要經(jīng)歷所有這些麻煩呢?因?yàn)樽屛锢淼模芰系臋C(jī)器人學(xué)習(xí)是一種正義的痛苦。通常,這是通過(guò)強(qiáng)化學(xué)習(xí)來(lái)完成的,在強(qiáng)化學(xué)習(xí)中,機(jī)器會(huì)嘗試不同的策略,并會(huì)獲得對(duì)良好抓地力的獎(jiǎng)勵(lì),對(duì)較差抓地力的懲罰。經(jīng)過(guò)無(wú)數(shù)次迭代之后,機(jī)器人終于迷失了解決方案。在模擬中,您可以旋轉(zhuǎn)數(shù)千次迭代,其速度比物理定律所允許的快得多。當(dāng)然,這樣的模擬是不完美的表示,但是它們的效率要高得多。
這個(gè)宜家新奇境的想法是為機(jī)器人研究人員提供一個(gè)標(biāo)準(zhǔn)化的平臺(tái),用于教授機(jī)器人如何操縱零件和組裝復(fù)雜的物體。USC機(jī)器人專(zhuān)家約瑟夫·林(Joseph Lim)說(shuō):“雖然看上去對(duì)人類(lèi)來(lái)說(shuō)微不足道,但不僅僅是我們抓住了一部分,我們還必須確切地知道要在哪里抓住它以及用多少力?!睂?duì)于機(jī)器人技術(shù)而言,這是一個(gè)很大的開(kāi)放性問(wèn)題。”
然后是將一堆操作串在一起以構(gòu)造椅子的問(wèn)題。各個(gè)部分必須以某種方式組合在一起,并且步驟必須以某種順序組合在一起。為此,研究人員可能會(huì)采用“模仿學(xué)習(xí)”方法,或者通過(guò)首先操縱桿來(lái)演示機(jī)器的操作方法。Lim說(shuō):“我們的目標(biāo)之一是學(xué)習(xí)如何學(xué)習(xí)人類(lèi)的行為。我們觀看人類(lèi)如何組裝家具(例如錄像帶),然后學(xué)習(xí)如何從根本上復(fù)制或模仿家具?!?/p>
不過(guò),不要指望機(jī)器人助手會(huì)隨您的下一張Hattefj?ll辦公椅一起提供。一方面,該系統(tǒng)尚無(wú)法模擬機(jī)器人如何將零件釘或擰在一起。南洋理工大學(xué)的工程師Quang-Cuong Pham說(shuō),還有兩個(gè),仍然存在從模擬到真實(shí)的問(wèn)題,他通過(guò)構(gòu)建宜家椅子的物理機(jī)器人進(jìn)行了上述實(shí)驗(yàn)。就是說(shuō),要將機(jī)器人在模擬中學(xué)到的東西轉(zhuǎn)化為現(xiàn)實(shí)技能是極其困難的。Pham說(shuō):“因此,尚不清楚物理機(jī)器人能否成功地在仿真環(huán)境中成功完成任務(wù),例如在我們之前的實(shí)驗(yàn)中。”
但是,也許經(jīng)過(guò)幾年的培訓(xùn)和不止幾把椅子折斷,我們的刨花板苦難將是機(jī)器的收獲。