OpenAI的AI機器人可用單手就能還原魔方

時間：2020-05-20 14:48:01

關(guān)鍵字： AI 機器人 PEN DAC

手機看文章

掃描二維碼
隨時隨地手機看文章

[導讀] （文章來源：環(huán)球網(wǎng)）人工智能（AI）研究組織OpenAI在制造具有通用性、能夠自我學習的機器人方面取得了新的里程碑。該組織的機器人部門表示，其去年首次亮相的機器人手Dactyl已經(jīng)學會

（文章來源：環(huán)球網(wǎng)）

人工智能（AI）研究組織OpenAI在制造具有通用性、能夠自我學習的機器人方面取得了新的里程碑。該組織的機器人部門表示，其去年首次亮相的機器人手Dactyl已經(jīng)學會了單手解魔方。OpenAI將這個壯舉視為一次飛躍，這既體現(xiàn)在機器人手的靈巧性上，也體現(xiàn)在其自主研發(fā)的AI軟件上。這種軟件允許Dactyl在面臨真正的物理挑戰(zhàn)之前，利用虛擬模擬來學習如何執(zhí)行新任務。

在展示Dactyl新才藝的演示視頻中，我們可以看到機器人手以摸索的方式逐漸破解魔方，雖然其動作顯得有點兒笨拙，但卻十分精確。盡管破解的過程有點兒長，但Dactyl最終解決了這個難題。這個機器人手的動作看起來明顯不如真正的人手靈活，甚至有點兒脫節(jié)，更無法與那些能在短短幾秒鐘內(nèi)破解魔方的人的驚人速度和敏捷相比。

但對于OpenAI而言，Dactyl的成就使其向更廣泛的AI和機器人行業(yè)令人向往的目標又邁進了一步。這個行業(yè)希望研發(fā)出能夠?qū)W習執(zhí)行各種現(xiàn)實世界任務的機器人，它們無需培訓數(shù)月乃至數(shù)年時間，也無需專門進行編程。

韋林德指的是過去幾年中出現(xiàn)的各種機器人，這些機器人已經(jīng)將破解魔方的方法推向遠遠超越人類雙手和思維的極限。2016年，半導體制造商英飛凌(Infineon)開發(fā)了一款專門用于以超快速度破解魔方的機器人，該機器人成功地在一秒鐘內(nèi)完成了這個任務。這打破了當時由人類保持的世界紀錄（不到5秒）。兩年后，麻省理工學院開發(fā)的一臺機器在不到0.4秒的時間破解了魔方。

換句話說，為某一特定任務而設計的機器人，并被編程為盡可能高效地執(zhí)行該任務，通常最適合人類，而破解魔方是軟件很久以前就掌握的東西。因此，開發(fā)機器人來破解魔方，即使是與人手相似的機器人，本身也并不是那么引人注目。Dactyl操作的速度十分緩慢，這讓其取得的成就更顯得不起眼兒。

但是OpenAI的Dactyl機器人和驅(qū)動它的軟件，在設計和用途上與專用的魔防破解及其有很大的不同。正如韋林德所說的那樣，OpenAI正在進行的機器人研發(fā)工作并不是為了在狹隘任務中獲得卓越的結(jié)果，因為這只需要你開發(fā)更好的機器人并相應地對它進行編程就可做到。這甚至可以在沒有現(xiàn)代AI支持的情況下完成。

但直到最近，訓練AI代理做些虛擬的事情（例如玩電腦游戲）比訓練它執(zhí)行現(xiàn)實世界任務要容易得多。這是因為，研究人員可以加快訓練軟件在虛擬世界中做某些事情的速度，這樣AI就可以在現(xiàn)實世界的短短幾個月時間內(nèi)接受相當于數(shù)萬年的訓練，這得益于數(shù)千個高端CPU和超強大GPU并行工作的結(jié)果。

用物理機器人進行同樣水平的訓練并執(zhí)行物理任務是不可行的。這就是為何OpenAI試圖用模擬環(huán)境代替現(xiàn)實世界來開創(chuàng)機器人訓練新方法的理由，這也是機器人行業(yè)幾乎沒有嘗試過的東西。在這種情況下，該軟件可以同時在許多不同的計算機上以加速方式進行廣泛的練習，并希望它在開始控制真正的機器人時保留這些知識。

由于訓練的局限性和存在明顯的安全問題，今天商業(yè)中使用的機器人不使用AI，而是用非常具體的指令進行編程。韋林德解釋稱：“過去的方法是，你需要使用非常專業(yè)的算法來解決特定任務，你可以對機器人模型和環(huán)境進行精確操控。對于工廠機器人來說，你有非常精確的模型，而且你也確切地知道自己所處的工作環(huán)境，因此你非常了解它將如何執(zhí)行特定的任務?！?/p>

這也是為何當前機器人遠沒有人類那么多才多藝的最重要原因。人們需要大量的時間、精力和金錢來重新給特定的機器人編程，比如組裝汽車特定部件或計算機組件的機器人。沒有經(jīng)過適當訓練的機器人，即使是在執(zhí)行人類看起來非常簡單的任務，它都會經(jīng)歷慘敗。然而，有了現(xiàn)代AI技術(shù)，機器人可以模仿人類，這樣它們就可以使用對世界同樣直觀的理解來做從開門到煎蛋等各種事情。至少，這是我們的夢想。

我們距離機器人能夠執(zhí)行這種復雜程度的任務仍然有幾十年的距離，AI社區(qū)在軟件方面所取得的飛躍，比如自動駕駛汽車、機器翻譯和圖像識別，還沒有完全轉(zhuǎn)化為下一代機器人身上。目前，OpenAI只是試圖模仿人體某一部位的復雜性，并讓機器人的模擬操作變得更自然。

這就是為何Dactyl會被模仿人手設計成擁有24個關(guān)節(jié)機械手的原因，它與我們在工廠里看到的機械爪或機械鉗完全不同。對于支持Dactyl學習如何以人類的方式利用所有這些關(guān)節(jié)的軟件，OpenAI嘗試在現(xiàn)實世界中破解魔方之前，已經(jīng)在模擬環(huán)境中對其進行了數(shù)千年的訓練。