快來(lái)看,機(jī)器人都可以玩魔方了
據(jù)國(guó)外媒體報(bào)道,人工智能研究人員讓機(jī)器人來(lái)玩魔方,以此測(cè)試它的靈巧度。
人類可以相對(duì)輕松地玩弄魔方,但對(duì)于機(jī)器人來(lái)說(shuō),這一直以來(lái)都非常困難。(常見(jiàn)的2x2x2魔方共有367.416萬(wàn)個(gè)內(nèi)部組合。)這并不是說(shuō)沒(méi)有機(jī)器人能玩得轉(zhuǎn)魔方——麻省理工學(xué)院的一項(xiàng)發(fā)明最近以破紀(jì)錄的0.38秒內(nèi)解出魔方——但這種機(jī)器人通常都涉及專門制造的馬達(dá)和控制器。
令人鼓舞的是,騰訊和香港中文大學(xué)的一組研究人員表示,他們?cè)O(shè)計(jì)了一款使用多指手的魔方操縱手。在發(fā)布在預(yù)印論文網(wǎng)站Arxiv.org上的一篇論文(“學(xué)習(xí)用靈巧的手來(lái)解魔方”)中,研究人員稱他們由人工智能驅(qū)動(dòng)的系統(tǒng)——包括一個(gè)用來(lái)求出最優(yōu)動(dòng)作順序的魔方求解器,以及一個(gè)可控制五個(gè)手指的魔方操作器——在1400多次試驗(yàn)中取得90.3%的平均成功率。
“靈巧的手部操作是機(jī)器人達(dá)到人類水平的靈活性,完成涉及大量接觸的日常任務(wù)的關(guān)鍵部分。”研究人員寫道,“盡管取得了進(jìn)展,但可靠的多指靈巧手操作仍然是一個(gè)開(kāi)放的挑戰(zhàn),因?yàn)樗哂袕?fù)雜的接觸模式、高維的動(dòng)作空間和脆弱的機(jī)械結(jié)構(gòu)。”
研究人員的系統(tǒng)在虛擬環(huán)境中操縱魔方。
該團(tuán)隊(duì)的解決方案是一個(gè)分層系統(tǒng),它結(jié)合了基于模型和無(wú)模型的規(guī)劃和操作組件。上面提到的魔方求解器負(fù)責(zé)尋找恢復(fù)魔方的最優(yōu)動(dòng)作順序,而控制器——涉及兩個(gè)原子動(dòng)作、魔方旋轉(zhuǎn)和分層操作——則負(fù)責(zé)一步一步地執(zhí)行每個(gè)動(dòng)作。
研究人員指出,運(yùn)動(dòng)學(xué)和關(guān)節(jié)運(yùn)動(dòng)使得部分動(dòng)作比其他的動(dòng)作更難完成。他們分別訓(xùn)練了幾個(gè)模型,以便定量比較它們的可靠性。為了提高魔方旋轉(zhuǎn)和分層操作(在沒(méi)有得到反饋信號(hào)的情況下循序執(zhí)行)的穩(wěn)健性,他們實(shí)施了一個(gè)回退機(jī)制來(lái)一步步檢查魔方的狀態(tài)。
該團(tuán)隊(duì)利用Roboti的Mujoco(多關(guān)節(jié)接觸動(dòng)力學(xué))來(lái)驗(yàn)證他們的方法。Mujoco是為機(jī)器人和生物力學(xué)的研究和開(kāi)發(fā)而設(shè)計(jì)的一個(gè)物理引擎。在Mujoco內(nèi),他們使用了一個(gè)靈巧的人手大小的機(jī)械手。該機(jī)械手被稱為“影子手”(Shadow Hand),它的中指和無(wú)名指各有三個(gè)驅(qū)動(dòng)關(guān)節(jié)和一個(gè)欠驅(qū)動(dòng)關(guān)節(jié),小指和拇指有五個(gè)驅(qū)動(dòng)關(guān)節(jié)(手腕有兩個(gè)驅(qū)動(dòng)關(guān)節(jié))。在一個(gè)實(shí)驗(yàn)中,影子手的任務(wù)是操縱一個(gè)虛擬的魔方來(lái)實(shí)現(xiàn)一個(gè)目標(biāo)姿態(tài),而在另一個(gè)實(shí)驗(yàn)中,它必須操縱兩層來(lái)實(shí)現(xiàn)一個(gè)目標(biāo)角度。
研究人員表示,他們的模型的立方體旋轉(zhuǎn)成功率穩(wěn)定在90%以上(經(jīng)過(guò)3萬(wàn)次訓(xùn)練后,他們將該數(shù)字提高到95.2%),分層操作的平均成功率為90.3%。他們說(shuō),一起優(yōu)化這兩個(gè)原子操作,并將該系統(tǒng)部署到實(shí)際硬件上,可以進(jìn)一步提高性能。