Nvidia研出自學(xué)駕駛神經(jīng)網(wǎng)絡(luò) 會成為自動駕駛的未來嗎?
自動駕駛技術(shù)一直是近年的研究熱點,特斯拉已研制出能在較少車輛的道路上實現(xiàn)自動駕駛的系統(tǒng),據(jù)稱兩年左右就能上市。而在過去的9個月里,Nvidia工程團(tuán)隊用一個攝像頭、一臺Drive-PX嵌入式電腦、72小時的訓(xùn)練數(shù)據(jù)開發(fā)了一臺自動駕駛汽車。在Cornell Research Library擁有的arXiv.org(全球最大的預(yù)印本系統(tǒng))上,Nvidia以學(xué)術(shù)預(yù)印本的形式發(fā)表了DAVE2的研究結(jié)果,標(biāo)題名為《自動駕駛汽車的端到端學(xué)習(xí)》。
Nvidia的項目名叫DAVE2,為什么這樣命名?因為美國國防部先進(jìn)研究項目局(Defense Advanced Research Projects Agency)有一個項目名叫DARPA Autonomous Vehicle(DAVE,既DARPA無人駕駛汽車)。雖然神經(jīng)網(wǎng)絡(luò)、自動駕駛汽車看起來是一門新發(fā)明的技術(shù),實際上谷歌的Geoffrey Hinton、Facebook的Yann Lecune、蒙特利爾大學(xué)的Yoshua Bengio在過去20年里一直在攜手研究它,這些技術(shù)是AI的一個分支。DARPA DAVE項目申請研究神經(jīng)網(wǎng)絡(luò)自動駕駛汽車,它的前身是ALVINN項目,這個項目是Carnegie Mellon 1989年提出的。有一點已經(jīng)改變:由于GPU的發(fā)展,研究變得經(jīng)濟(jì)可行了。
神經(jīng)網(wǎng)絡(luò)、圖像識別應(yīng)用(比如無人駕駛汽車)最近出現(xiàn)了大爆發(fā),主要原因有兩個。第一個,手機(jī)上渲染圖像的GPU已經(jīng)很強大,很便宜,將GPU大規(guī)模裝載到板件等級的超級電腦上可以很好地解決龐大的并行神經(jīng)網(wǎng)絡(luò)問題,而且它的價格也足夠便宜,每一名AI研究人員和軟件開發(fā)者都買得起。第二,大型、標(biāo)簽式圖片數(shù)據(jù)集已經(jīng)存在,我們可以用它來訓(xùn)練大型并行神經(jīng)網(wǎng)絡(luò),這些神經(jīng)網(wǎng)絡(luò)用GPU來執(zhí)行,可以看見、感知攝像頭捕捉的物體。
繪制人類駕駛模式
Nvidia團(tuán)隊訓(xùn)練了一個卷積神經(jīng)網(wǎng)絡(luò),它可以繪制單個前置攝像頭捕捉的原始像素,攝像頭跟駕駛命令直接聯(lián)系。Nvidia技術(shù)的突破之處在于:無人駕駛汽車可以自動自學(xué),通過觀看人類的駕駛方式自學(xué)。
雖然操作系統(tǒng)使用的是一個攝像頭和一臺Drive-PX嵌入式電腦,但是訓(xùn)練系統(tǒng)使用的卻是三個攝像頭、兩臺電腦,它們可以抓取3D視頻圖像、轉(zhuǎn)向角度(來自人類駕駛的汽車),這些信息可以訓(xùn)練系統(tǒng)學(xué)會“看見”和“駕駛”能力。
Nvidia會監(jiān)視轉(zhuǎn)向角度的變化,將它作為訓(xùn)練信號,然后將人類駕駛模式映射到攝像頭記錄的位圖圖像中去。系統(tǒng)會利用卷積神經(jīng)網(wǎng)絡(luò)為駕駛處理步驟介定內(nèi)部表征,比如偵測有用的道路特征——線路、汽車和道路輪廓。
自動駕駛汽車會感知路況、其它汽車及障礙物,開源機(jī)器學(xué)習(xí)系統(tǒng)Torch 7會對處理過程進(jìn)行深入學(xué)習(xí),然后用來操縱測試汽車。實際訓(xùn)練以每秒10幀的速度進(jìn)行,因為即使速度達(dá)到30幀區(qū)別也不會太大,學(xué)習(xí)的價值并不會提高。測試車包括一輛2016款林肯MKZ和一輛2013款福特??怂?。
機(jī)器學(xué)習(xí)處理的核心就是用Torch 7構(gòu)建的卷積神經(jīng)網(wǎng)絡(luò)模擬操縱情況。人類駕駛的汽車會拍攝一些10fps圖像,卷積神經(jīng)網(wǎng)絡(luò)會下達(dá)操縱命令,對10fps圖像進(jìn)行模擬響應(yīng),研究人員需要將模擬響應(yīng)和人類轉(zhuǎn)向角度進(jìn)行對比。一個是人類轉(zhuǎn)向角度,一個是卷積神經(jīng)網(wǎng)絡(luò)模擬的操縱命令,它可以教會系統(tǒng)“看”和“操縱”的能力,研究者需要對兩者進(jìn)行對比,分析其中的差異。汽車會在測試路線上行駛3小時,總里程相當(dāng)于100英里,行程會被記錄為視頻,模擬時使用的測試數(shù)據(jù)來自于視頻。
公路測試
當(dāng)卷積神經(jīng)網(wǎng)絡(luò)模擬駕駛表現(xiàn)良好時,就可以在公路上對測試車輛進(jìn)行更進(jìn)一步的機(jī)器學(xué)習(xí)和測試了。公路測試可以改進(jìn)系統(tǒng),在整個過程中需要由人類司機(jī)監(jiān)督無人駕駛汽車,當(dāng)系統(tǒng)出錯時及時介入。每修正一次,結(jié)果就會輸入到機(jī)器學(xué)習(xí)系統(tǒng),從而改進(jìn)操縱過程的精準(zhǔn)度。在新澤西Turnpike的行駛過程中,前10英里汽車完全自動行駛。在早期測試中,98%的操作是無人駕駛的。
Nvidia證明卷積神經(jīng)網(wǎng)絡(luò)可以學(xué)會以下任務(wù):道路偵測,非手動道路追隨,對道路及道路標(biāo)識、語義抽象、路線規(guī)劃、控制進(jìn)行明確的分解和分類。讓汽車在不同天氣、燈光條件、高速公路或者旁路上行駛,獲得內(nèi)部處理過程,形成不到100小時的訓(xùn)練數(shù)據(jù),然后用Torch 7渲染這些數(shù)據(jù),系統(tǒng)就可以學(xué)會上述操作。
從報告看,Nvidia暗示系統(tǒng)還沒有準(zhǔn)備好投入生產(chǎn),它在報告中寫道:“如果要提高網(wǎng)絡(luò)的穩(wěn)定性、找到好辦法核實這種穩(wěn)定性,提高網(wǎng)絡(luò)內(nèi)部處理過程的可視化水平,我們還有更多的工作要做。”