機(jī)器人，英偉達(dá)的下一場(chǎng)革命

時(shí)間：2018-08-21 10:01:30

關(guān)鍵字：機(jī)器人英偉達(dá)

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]幾年下來(lái)，英偉達(dá)在人工智能領(lǐng)域有了自己的積累，它開始有了新的判斷，專注于底層算力的英偉達(dá)開始思考上層應(yīng)用的方向。

很多游戲粉絲聽說(shuō)英偉達(dá)發(fā)了新卡，激動(dòng)得去搜索相關(guān)的新聞，可看來(lái)看去，發(fā)布會(huì)上把“十年來(lái)最重要?jiǎng)?chuàng)新”、“全球首款光線追蹤 GPU”掛在嘴邊的老黃卻沒怎么提起新品在游戲上的應(yīng)用。游戲粉絲有些失望，核彈還是那個(gè)核彈，皮衣也還是那件皮衣，但發(fā)布會(huì)上屢屢提起、演示的關(guān)鍵詞卻并不是他們熟悉的 3A 大作了。

類似的情況也出現(xiàn)在顯卡測(cè)評(píng)的視頻里，當(dāng)一位 up 主通過(guò)機(jī)器學(xué)習(xí)的訓(xùn)練效果來(lái)講解 NVIDIA Titan V 顯卡的性能時(shí)，彈幕上馬上刷起了“聽不懂”、“在說(shuō)啥”的聲音。

游戲粉絲們也許不是很買賬，但對(duì)英偉達(dá)而言，人工智能卻是這家以圖形和計(jì)算起家的半導(dǎo)體公司遇上的最好機(jī)會(huì)。在深度學(xué)習(xí)井噴式爆發(fā)的那幾年，擅長(zhǎng)向量和矩陣運(yùn)算的英偉達(dá) GPU 被許多學(xué)者、研究員用來(lái)進(jìn)行研究和訓(xùn)練自己的算法模型，甚至 Google Brain 和吳恩達(dá)這樣頂級(jí)的人工智能研究團(tuán)隊(duì)和科學(xué)家也在使用英偉達(dá)的設(shè)備，久而久之，英偉達(dá)也將自己的注意力轉(zhuǎn)移到了深度學(xué)習(xí)這一剛剛在產(chǎn)業(yè)里興起的領(lǐng)域。

“不夠，還不夠智能”

幾年下來(lái)，英偉達(dá)在人工智能領(lǐng)域有了自己的積累，它開始有了新的判斷，專注于底層算力的英偉達(dá)開始思考上層應(yīng)用的方向。

“人工智能的第一階段，是開發(fā)自動(dòng)化編程的軟件。第二階段，是將軟件應(yīng)用于行業(yè)的自動(dòng)化，這種自動(dòng)化帶來(lái)的效率提升會(huì)刺激原有的市場(chǎng)。”在今年的臺(tái)北電腦展上，黃仁勛把人工智能的發(fā)展分為了三個(gè)階段，“第三階段，是 AI 走出計(jì)算機(jī)，影響外部的世界。”

依黃仁勛的定義，目前我們已經(jīng)處于人工智能發(fā)展的第二階段，即人工智能開始初步應(yīng)用于各行各業(yè)。

比如工廠里的人機(jī)協(xié)作，大型機(jī)械很容易在使用時(shí)誤傷到人，但如果給這些設(shè)備裝上傳感器，檢測(cè)身邊是否有人，實(shí)時(shí)作出是否要減速的判斷，在使用時(shí)就會(huì)安全許多。

再比如傳統(tǒng)的拆垛、堆垛設(shè)備，只要給設(shè)備加一個(gè)深度傳感器，它就能判斷出箱子的大小位置和重心，這時(shí)機(jī)器就能夠判斷出最佳操作位置，從而以最快的速度完成操作。

還有超市商場(chǎng)里，每天營(yíng)業(yè)員都會(huì)在關(guān)門后花數(shù)個(gè)小時(shí)的時(shí)間整理、統(tǒng)計(jì)當(dāng)天所剩貨品，現(xiàn)在市面上已經(jīng)有能夠完成點(diǎn)貨和理貨功能的機(jī)器人，這些設(shè)備能給店家省下不少的人力。

這些都是時(shí)下已經(jīng)投入使用的一些智能機(jī)器，但在英偉達(dá)高級(jí)軟件經(jīng)理李銘博士看來(lái)，“這些智能是遠(yuǎn)遠(yuǎn)不夠的”。

“加一點(diǎn)智能進(jìn)去，解決當(dāng)前場(chǎng)景最急需的問題，看起來(lái)是個(gè)智能機(jī)械，但其實(shí)它對(duì)整個(gè)機(jī)器人本身的促進(jìn)并沒有想象中那么大。”

李銘博士認(rèn)為，這些智能機(jī)器人普遍存在著一些問題：

第一，軟件成本上升太快，在安防、服務(wù)、工廠，不同的場(chǎng)景里有著不同的需求，體現(xiàn)在軟件編程上，軟件架構(gòu)的邏輯可能會(huì)全局推翻，這就導(dǎo)致了軟件開發(fā)的成本居高不下。

第二，具體到場(chǎng)景里，單個(gè)機(jī)械在應(yīng)用時(shí)還需要單獨(dú)的調(diào)試。以工業(yè)機(jī)器人的機(jī)械臂為例，在工廠里需要為車床量身調(diào)試，設(shè)置具體操作參數(shù)，比如距離產(chǎn)線的距離，50cm 還是 60cm，10cm± 的誤差在生產(chǎn)線上是絕對(duì)不允許的。

第三，面對(duì)環(huán)境的變化適應(yīng)性差，比如工廠里的光線發(fā)生變化，比如室外可能會(huì)發(fā)生的各種意外，現(xiàn)有的機(jī)器人是無(wú)法應(yīng)對(duì)的。

第四，軟件更新，當(dāng)功能有增加或者修改時(shí)，需要做很多額外的工作，比如改變程序的邏輯，甚至重新編程等等。

如前面黃仁勛提到人工智能的三個(gè)階段，智能從軟件開始，機(jī)器人從完成固定程序動(dòng)作的普通機(jī)械，到今天“有一點(diǎn)點(diǎn)智能”的機(jī)器人，依賴的正是人工智能在各自行業(yè)的初步應(yīng)用。所以要解決以上這些智能機(jī)器的問題，還需要回到軟件的層面，回到人工智能身上。

機(jī)器該怎么學(xué)習(xí)?

人工智能的發(fā)展“越來(lái)越抽象，越來(lái)越復(fù)雜”。從早期簡(jiǎn)單的是與否的判斷，到后來(lái)精準(zhǔn)的識(shí)別，可以在復(fù)雜的場(chǎng)景里找出特定的目標(biāo)，再到后來(lái)，出現(xiàn) AlphaGo 這樣可以做出主動(dòng)的決策的 AI，甚至智能如 AlphaGo Zero，可以完全依靠“自學(xué)”實(shí)現(xiàn)快速成長(zhǎng)?？梢钥吹?，軟件的智能水平是領(lǐng)先于我們常見的硬件智能的。

那么，人工智能在硬件上的部署遇到了哪些困難呢?

首先是計(jì)算力。硬件，尤其移動(dòng)機(jī)器人上能夠搭載的計(jì)算力非常有限，這與 AlphaGo 這樣傾全公司算力訓(xùn)練出來(lái)的 AI 不同。

人工智能經(jīng)過(guò)這么長(zhǎng)時(shí)間的發(fā)展，在網(wǎng)絡(luò)的種類、復(fù)雜程度和處理的信息量上都發(fā)生了天翻地覆的變化。網(wǎng)絡(luò)種類上，從早期的 AlexNet 和 GoogleNet 到現(xiàn)在各種各樣的 GAN(生成對(duì)抗網(wǎng)絡(luò))以及各種深度強(qiáng)化學(xué)習(xí)的網(wǎng)絡(luò)，它們各自網(wǎng)絡(luò)結(jié)構(gòu)都有不同，開發(fā)者在適應(yīng)最新的網(wǎng)絡(luò)上常常會(huì)遇到一些麻煩。

網(wǎng)絡(luò)變得越來(lái)越復(fù)雜，處理的信息量也在成倍地增長(zhǎng)，算力需求越來(lái)越高的情況下，對(duì)搭載處理單元的體積有更多限制的機(jī)器人實(shí)際上存在著在智能水平上升級(jí)的障礙。

其次是訓(xùn)練環(huán)境。對(duì)于 AlphaGo、DeepMind，科學(xué)家們可以設(shè)定一個(gè)基本規(guī)則，讓它永遠(yuǎn)跑在計(jì)算機(jī)里，不停地訓(xùn)練，技巧磨煉得越來(lái)越強(qiáng)大，但機(jī)器人的訓(xùn)練卻遠(yuǎn)遠(yuǎn)沒有這么簡(jiǎn)單。

在去年的 GTC 大會(huì)上，黃仁勛展示了加州大學(xué)伯克利分校的 AI 實(shí)驗(yàn)室所做的曲棍球機(jī)器人實(shí)驗(yàn)，在一個(gè)僅一米左右的直線上，伯克利的曲棍球機(jī)器人“艾達(dá)”足足試了 200 次才熟練地掌握了將球打入門框的技巧。

“這還只是曲棍球!”黃仁勛說(shuō)道，“如果我想抬起一輛汽車呢?如果我想開門呢?如果我想讓機(jī)器人和醫(yī)生配合做手術(shù)呢?”

“我們不可能讓機(jī)器這么學(xué)習(xí)。”

這里，英偉達(dá)高級(jí)軟件經(jīng)理李銘博士指出，在使用深度強(qiáng)化學(xué)習(xí)對(duì)機(jī)器人進(jìn)行訓(xùn)練時(shí)，有三個(gè)主要的障礙。

第一，真實(shí)世界的訓(xùn)練進(jìn)程太過(guò)緩慢，并且成本昂貴。Google 的機(jī)器人實(shí)驗(yàn)室曾經(jīng)用三個(gè)月的時(shí)間拿 14 臺(tái)機(jī)械手臂完成了 30 萬(wàn)次的拾取動(dòng)作的訓(xùn)練，同時(shí)還配備了一整隊(duì)的工程師“鞍前馬后地照料”這些機(jī)器人。對(duì)其他公司或者普通研究人員而言，這樣的成本是完全負(fù)擔(dān)不起的。

第二，訓(xùn)練的部分非常危險(xiǎn)，可能會(huì)造成一定程度的損失。機(jī)器人在訓(xùn)練時(shí)是直接與物理世界交互的，任何的碰撞都可能會(huì)導(dǎo)致機(jī)體的損傷，甚至可能會(huì)對(duì)訓(xùn)練的“陪護(hù)”人員造成傷害。

第三，訓(xùn)練環(huán)境的搭建非常耗時(shí)耗力。以自動(dòng)駕駛為例，如果要訓(xùn)練汽車在面對(duì)前面汽車追尾時(shí)的表現(xiàn)，連日常生活中的數(shù)據(jù)都很難收集，更不要說(shuō)搭建起類似的場(chǎng)景了。

NVIDIA 的答案

在今年臺(tái)北電腦展的發(fā)布會(huì)上，英偉達(dá)發(fā)布了 NVIDIA Isaac 機(jī)器人平臺(tái)，包含硬件、軟件和虛擬世界機(jī)器人模擬器的 NVIDIA Isaac。

同樣在這場(chǎng)發(fā)布會(huì)上，黃仁勛還發(fā)布了“世界首臺(tái)專為機(jī)器人打造的處理器”NVIDIA Jetson Xavier，他手托著這臺(tái)沒有巴掌大的計(jì)算機(jī)，面對(duì)媒體說(shuō)道：“這就是未來(lái)智能機(jī)器人的『大腦』。”

Jetson Xavier 擁有超過(guò) 90 億個(gè)晶體管，可提供每秒 30 萬(wàn)億次操作以上的性能，這一處理能力甚至比高性能的工作站還要強(qiáng)大。同時(shí)，Xavier 擁有 6 個(gè)高性能處理器，包括 1 個(gè) Volta Tensor Core GPU、1 個(gè) 8 核 ARM64 CPU、2 個(gè) NVDLA 深度學(xué)習(xí)加速器、1 個(gè)圖像處理器、1 個(gè)視覺處理器和 1 個(gè)視頻處理器。超高的計(jì)算能力讓可以直接部署在終端機(jī)器人上的 Jetson Xavier 能夠?yàn)闄C(jī)器人的感知和計(jì)算提供基礎(chǔ)算力的保障。

軟件上，Jetson Xavier 配備了一個(gè)工具箱，包含 API 工具包 Isaac SDK、智能機(jī)器加速應(yīng)用 Isaac IMX 以及高度逼真的虛擬仿真環(huán)境 Isaac Sim。

英偉達(dá)在 2017 年的 GTC 上首次發(fā)布了 Isaac 虛擬仿真環(huán)境的部分。只需要普通游戲引擎，開發(fā)者們就可以打造出一個(gè)非常仿真的虛擬環(huán)境，在這個(gè) VR 世界里，開發(fā)者可以在其算力支持的條件下，對(duì)機(jī)器進(jìn)行盡可能多、盡可能快的訓(xùn)練，訓(xùn)練完成后，機(jī)器可以直接部署到機(jī)器人上，完成物理世界里的測(cè)試。這樣一來(lái)就解決了訓(xùn)練環(huán)境的諸多問題。

在英偉達(dá)看來(lái)，機(jī)器人終歸是要擁有超強(qiáng)的邊緣計(jì)算能力的，而目前遠(yuǎn)遠(yuǎn)超越現(xiàn)階段機(jī)器人應(yīng)用需求的 Jetson Xavier，正是為了下一代自主機(jī)器打造的 AI 計(jì)算芯片，在 Isaac 平臺(tái)的支持下，機(jī)器無(wú)處不在地助力我們?nèi)粘Ｉ罟ぷ鳎岣哒麄€(gè)社會(huì)的效率，終將在不久后成為現(xiàn)實(shí)。