Nvidia研出自學(xué)駕駛神經(jīng)網(wǎng)絡(luò) 會成為自動駕駛的未來嗎？

時間：2020-08-26 15:09:02

關(guān)鍵字： dave2 NVIDIA 自動駕駛

手機(jī)看文章

掃描二維碼
隨時隨地手機(jī)看文章

[導(dǎo)讀] 　　自動駕駛技術(shù)一直是近年的研究熱點，特斯拉已研制出能在較少車輛的道路上實現(xiàn)自動駕駛的系統(tǒng)，據(jù)稱兩年左右就能上市。而在過去的9個月里，Nvidia工程團(tuán)隊用一個攝像頭、一臺Drive-PX嵌入式

　　自動駕駛技術(shù)一直是近年的研究熱點，特斯拉已研制出能在較少車輛的道路上實現(xiàn)自動駕駛的系統(tǒng)，據(jù)稱兩年左右就能上市。而在過去的9個月里，Nvidia工程團(tuán)隊用一個攝像頭、一臺Drive-PX嵌入式電腦、72小時的訓(xùn)練數(shù)據(jù)開發(fā)了一臺自動駕駛汽車。在Cornell Research Library擁有的arXiv.org（全球最大的預(yù)印本系統(tǒng)）上，Nvidia以學(xué)術(shù)預(yù)印本的形式發(fā)表了DAVE2的研究結(jié)果，標(biāo)題名為《自動駕駛汽車的端到端學(xué)習(xí)》。

　　Nvidia的項目名叫DAVE2，為什么這樣命名？因為美國國防部先進(jìn)研究項目局（Defense Advanced Research Projects Agency）有一個項目名叫DARPA Autonomous Vehicle（DAVE，既DARPA無人駕駛汽車）。雖然神經(jīng)網(wǎng)絡(luò)、自動駕駛汽車看起來是一門新發(fā)明的技術(shù)，實際上谷歌的Geoffrey Hinton、Facebook的Yann Lecune、蒙特利爾大學(xué)的Yoshua Bengio在過去20年里一直在攜手研究它，這些技術(shù)是AI的一個分支。DARPA DAVE項目申請研究神經(jīng)網(wǎng)絡(luò)自動駕駛汽車，它的前身是ALVINN項目，這個項目是Carnegie Mellon 1989年提出的。有一點已經(jīng)改變：由于GPU的發(fā)展，研究變得經(jīng)濟(jì)可行了。

　　神經(jīng)網(wǎng)絡(luò)、圖像識別應(yīng)用（比如無人駕駛汽車）最近出現(xiàn)了大爆發(fā)，主要原因有兩個。第一個，手機(jī)上渲染圖像的GPU已經(jīng)很強大，很便宜，將GPU大規(guī)模裝載到板件等級的超級電腦上可以很好地解決龐大的并行神經(jīng)網(wǎng)絡(luò)問題，而且它的價格也足夠便宜，每一名AI研究人員和軟件開發(fā)者都買得起。第二，大型、標(biāo)簽式圖片數(shù)據(jù)集已經(jīng)存在，我們可以用它來訓(xùn)練大型并行神經(jīng)網(wǎng)絡(luò)，這些神經(jīng)網(wǎng)絡(luò)用GPU來執(zhí)行，可以看見、感知攝像頭捕捉的物體。

　　繪制人類駕駛模式

　　Nvidia團(tuán)隊訓(xùn)練了一個卷積神經(jīng)網(wǎng)絡(luò)，它可以繪制單個前置攝像頭捕捉的原始像素，攝像頭跟駕駛命令直接聯(lián)系。Nvidia技術(shù)的突破之處在于：無人駕駛汽車可以自動自學(xué)，通過觀看人類的駕駛方式自學(xué)。

　　雖然操作系統(tǒng)使用的是一個攝像頭和一臺Drive-PX嵌入式電腦，但是訓(xùn)練系統(tǒng)使用的卻是三個攝像頭、兩臺電腦，它們可以抓取3D視頻圖像、轉(zhuǎn)向角度（來自人類駕駛的汽車），這些信息可以訓(xùn)練系統(tǒng)學(xué)會“看見”和“駕駛”能力。

　　Nvidia會監(jiān)視轉(zhuǎn)向角度的變化，將它作為訓(xùn)練信號，然后將人類駕駛模式映射到攝像頭記錄的位圖圖像中去。系統(tǒng)會利用卷積神經(jīng)網(wǎng)絡(luò)為駕駛處理步驟介定內(nèi)部表征，比如偵測有用的道路特征——線路、汽車和道路輪廓。

　　自動駕駛汽車會感知路況、其它汽車及障礙物，開源機(jī)器學(xué)習(xí)系統(tǒng)Torch 7會對處理過程進(jìn)行深入學(xué)習(xí)，然后用來操縱測試汽車。實際訓(xùn)練以每秒10幀的速度進(jìn)行，因為即使速度達(dá)到30幀區(qū)別也不會太大，學(xué)習(xí)的價值并不會提高。測試車包括一輛2016款林肯MKZ和一輛2013款福特?？怂?。

　　機(jī)器學(xué)習(xí)處理的核心就是用Torch 7構(gòu)建的卷積神經(jīng)網(wǎng)絡(luò)模擬操縱情況。人類駕駛的汽車會拍攝一些10fps圖像，卷積神經(jīng)網(wǎng)絡(luò)會下達(dá)操縱命令，對10fps圖像進(jìn)行模擬響應(yīng)，研究人員需要將模擬響應(yīng)和人類轉(zhuǎn)向角度進(jìn)行對比。一個是人類轉(zhuǎn)向角度，一個是卷積神經(jīng)網(wǎng)絡(luò)模擬的操縱命令，它可以教會系統(tǒng)“看”和“操縱”的能力，研究者需要對兩者進(jìn)行對比，分析其中的差異。汽車會在測試路線上行駛3小時，總里程相當(dāng)于100英里，行程會被記錄為視頻，模擬時使用的測試數(shù)據(jù)來自于視頻。

　　公路測試

　　當(dāng)卷積神經(jīng)網(wǎng)絡(luò)模擬駕駛表現(xiàn)良好時，就可以在公路上對測試車輛進(jìn)行更進(jìn)一步的機(jī)器學(xué)習(xí)和測試了。公路測試可以改進(jìn)系統(tǒng)，在整個過程中需要由人類司機(jī)監(jiān)督無人駕駛汽車，當(dāng)系統(tǒng)出錯時及時介入。每修正一次，結(jié)果就會輸入到機(jī)器學(xué)習(xí)系統(tǒng)，從而改進(jìn)操縱過程的精準(zhǔn)度。在新澤西Turnpike的行駛過程中，前10英里汽車完全自動行駛。在早期測試中，98%的操作是無人駕駛的。

　　Nvidia證明卷積神經(jīng)網(wǎng)絡(luò)可以學(xué)會以下任務(wù)：道路偵測，非手動道路追隨，對道路及道路標(biāo)識、語義抽象、路線規(guī)劃、控制進(jìn)行明確的分解和分類。讓汽車在不同天氣、燈光條件、高速公路或者旁路上行駛，獲得內(nèi)部處理過程，形成不到100小時的訓(xùn)練數(shù)據(jù)，然后用Torch 7渲染這些數(shù)據(jù)，系統(tǒng)就可以學(xué)會上述操作。

　　從報告看，Nvidia暗示系統(tǒng)還沒有準(zhǔn)備好投入生產(chǎn)，它在報告中寫道：“如果要提高網(wǎng)絡(luò)的穩(wěn)定性、找到好辦法核實這種穩(wěn)定性，提高網(wǎng)絡(luò)內(nèi)部處理過程的可視化水平，我們還有更多的工作要做。”