生成式 AI 通過 NVIDIA Isaac 平臺提高機(jī)器人的智能化水平
生成式 AI 正在重塑價(jià)值數(shù)萬億美元的產(chǎn)業(yè)。NVIDIA 作為智能機(jī)器人領(lǐng)域的領(lǐng)跑者,正在抓住這一機(jī)遇。
今日,NVIDIA 機(jī)器人和邊緣計(jì)算副總裁 Deepu Talla 在CES上的特別演講中,詳細(xì)介紹了 NVIDIA 及合作伙伴是如何將生成式 AI 與機(jī)器人技術(shù)相結(jié)合的。
這一切都是水到渠成,有越來越多的合作伙伴正在使用由 GPU 加速的大語言模型,為各類機(jī)器帶來前所未有的智能和適應(yīng)能力,這些合作伙伴包括波士頓動力公司、Collaborative Robotics、Covariant、Sanctuary AI、宇樹科技等。
現(xiàn)在正是一個(gè)千載難逢的好時(shí)機(jī)。
Talla 表示:“由 AI 驅(qū)動的自主機(jī)器人越來越多地應(yīng)用于提高效率、降低成本和解決勞動力短缺問題?!?
共創(chuàng)變革
從一開始,NVIDIA 就一直是這場生成式 AI 變革的核心。
十年前,NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛親手將第一臺 NVIDIA DGX AI 超級計(jì)算機(jī)交付給 OpenAI。如今,得益于 OpenAI 的 ChatGPT,生成式 AI 已成為當(dāng)代發(fā)展最快的技術(shù)之一。
而這一切才剛剛開始。
Talla 預(yù)測,生成式 AI 的影響將超越文本和圖像生成,進(jìn)入到家庭和辦公室、農(nóng)場和工廠、醫(yī)院和實(shí)驗(yàn)室中。
其關(guān)鍵在于,類似于人類大腦語言中心的大語言模型(LLM),使機(jī)器人能夠更自然地理解和響應(yīng)人類指令。這些機(jī)器能夠不斷地向人類、彼此和周圍的世界學(xué)習(xí)。
Talla 表示:“鑒于這些特性,生成式 AI 非常適合用于機(jī)器人技術(shù)。”
機(jī)器人如何使用生成式 AI
Agility Robotics、NTT 和其他公司正在將生成式 AI 整合到他們的機(jī)器人中,以幫助理解文本或語音命令。追覓科技的機(jī)器人吸塵器,正在由生成式 AI 模型創(chuàng)建的模擬生活空間中接受訓(xùn)練。同時(shí),Electric Sheep 也正在開發(fā)一種自動割草的全球范式。
NVIDIA Isaac 和 Jetson 平臺等 NVIDIA 技術(shù)能夠?yàn)?AI 機(jī)器人的開發(fā)和部署提供助力,被超過 120 萬名開發(fā)人員和 10,000 名客戶和合作伙伴所依賴。
其中的許多企業(yè)都參加了本周的 CES,包括亞德諾半導(dǎo)體、Aurora Labs、Canonical、追覓創(chuàng)新科技、DriveU、e-con Systems 、Ecotron、Enchanted Tools、GlüxKind、禾賽科技、Leopard Imaging、九號公司(未嵐大陸(北京)科技有限公司)、Nodar、奧比中光、QT Group、速騰聚創(chuàng)、Spartan Radar、TDK、Telit、宇樹科技、Voyant Photonics 和一徑科技等。
雙機(jī)勝于單機(jī)
為了展示該模式的運(yùn)作方式,Talla 在演講中展示了將 AI 部署到機(jī)器人技術(shù)中所必需的雙計(jì)算機(jī)模型(如下),展現(xiàn)出 NVIDIA 在 AI 開發(fā)和應(yīng)用方面的全面性。
第一臺計(jì)算機(jī)被稱為“AI 工廠”,是創(chuàng)建和不斷改進(jìn) AI 模型的核心。
AI 工廠使用了 NVIDIA 數(shù)據(jù)中心計(jì)算基礎(chǔ)設(shè)施以及 NVIDIA AI 和 NVIDIA Omniverse平臺,可以仿真和訓(xùn)練 AI 模型。
第二臺計(jì)算機(jī)代表機(jī)器人的運(yùn)行環(huán)境。
運(yùn)行環(huán)境根據(jù)應(yīng)用的不同而有所變化,比如可以是云或數(shù)據(jù)中心;對于半導(dǎo)體制造中的缺陷檢測等任務(wù)則是本地服務(wù)器;配備多個(gè)傳感器和攝像頭的自主機(jī)器也可能成為運(yùn)行環(huán)境。
生成高質(zhì)量資產(chǎn)和場景
Talla 還重點(diǎn)介紹了 LLM 在打破技術(shù)壁壘方面的作用。LLM 可以將普通用戶變成技術(shù)藝術(shù)家,能夠創(chuàng)建復(fù)雜機(jī)器人工作單元或整個(gè)倉庫仿真。
借助 NVIDIA Picasso等生成式 AI 工具,用戶可以根據(jù)簡單的文字提示來生成逼真的 3D 資產(chǎn),并將其添加到數(shù)字場景中,以實(shí)現(xiàn)動態(tài)、全面的機(jī)器人訓(xùn)練環(huán)境。
這一功能還可擴(kuò)展到在 Omniverse 中創(chuàng)建多樣化且符合物理學(xué)的場景,從而加強(qiáng)機(jī)器人的測試和訓(xùn)練,保證機(jī)器人在現(xiàn)實(shí)世界中的適用性。
這與生成式 AI 在重新構(gòu)建機(jī)器人部署方式上的變革潛力不謀而合。
以前的機(jī)器人是為特定任務(wù)而專門制造的,而根據(jù)不同任務(wù)來修改機(jī)器人十分耗時(shí)。
Talla 還解釋道,LLM 和視覺語言模型領(lǐng)域的進(jìn)步正在消除這一瓶頸,使我們能夠通過自然語言與機(jī)器人進(jìn)行更直觀的交互。
這種適應(yīng)性強(qiáng)、能感知周圍環(huán)境的機(jī)器將很快遍布世界各地。