據國外媒體報道,人工智能研究人員讓機器人來玩魔方,以此測試它的靈巧度。
人類可以相對輕松地玩弄魔方,但對于機器人來說,這一直以來都非常困難。(常見的2x2x2魔方共有367.416萬個內部組合。)這并不是說沒有機器人能玩得轉魔方——麻省理工學院的一項發(fā)明最近以破紀錄的0.38秒內解出魔方——但這種機器人通常都涉及專門制造的馬達和控制器。
令人鼓舞的是,騰訊和香港中文大學的一組研究人員表示,他們設計了一款使用多指手的魔方操縱手。在發(fā)布在預印論文網站Arxiv.org上的一篇論文(“學習用靈巧的手來解魔方”)中,研究人員稱他們由人工智能驅動的系統(tǒng)——包括一個用來求出最優(yōu)動作順序的魔方求解器,以及一個可控制五個手指的魔方操作器——在1400多次試驗中取得90.3%的平均成功率。
“靈巧的手部操作是機器人達到人類水平的靈活性,完成涉及大量接觸的日常任務的關鍵部分。”研究人員寫道,“盡管取得了進展,但可靠的多指靈巧手操作仍然是一個開放的挑戰(zhàn),因為它具有復雜的接觸模式、高維的動作空間和脆弱的機械結構。”
研究人員的系統(tǒng)在虛擬環(huán)境中操縱魔方。
該團隊的解決方案是一個分層系統(tǒng),它結合了基于模型和無模型的規(guī)劃和操作組件。上面提到的魔方求解器負責尋找恢復魔方的最優(yōu)動作順序,而控制器——涉及兩個原子動作、魔方旋轉和分層操作——則負責一步一步地執(zhí)行每個動作。
研究人員指出,運動學和關節(jié)運動使得部分動作比其他的動作更難完成。他們分別訓練了幾個模型,以便定量比較它們的可靠性。為了提高魔方旋轉和分層操作(在沒有得到反饋信號的情況下循序執(zhí)行)的穩(wěn)健性,他們實施了一個回退機制來一步步檢查魔方的狀態(tài)。
該團隊利用Roboti的Mujoco(多關節(jié)接觸動力學)來驗證他們的方法。Mujoco是為機器人和生物力學的研究和開發(fā)而設計的一個物理引擎。在Mujoco內,他們使用了一個靈巧的人手大小的機械手。該機械手被稱為“影子手”(Shadow Hand),它的中指和無名指各有三個驅動關節(jié)和一個欠驅動關節(jié),小指和拇指有五個驅動關節(jié)(手腕有兩個驅動關節(jié))。在一個實驗中,影子手的任務是操縱一個虛擬的魔方來實現(xiàn)一個目標姿態(tài),而在另一個實驗中,它必須操縱兩層來實現(xiàn)一個目標角度。
研究人員表示,他們的模型的立方體旋轉成功率穩(wěn)定在90%以上(經過3萬次訓練后,他們將該數(shù)字提高到95.2%),分層操作的平均成功率為90.3%。他們說,一起優(yōu)化這兩個原子操作,并將該系統(tǒng)部署到實際硬件上,可以進一步提高性能。