適用于自動駕駛的神經(jīng)網(wǎng)絡(luò)解決方案及學(xué)習(xí)方法
高級輔助駕駛系統(tǒng) (ADAS) 可提供解決方案,用以滿足駕乘人員對道路安全及出行體驗(yàn)的更高要求。諸如車道偏離警告、自動剎車及泊車輔助等系統(tǒng)廣泛應(yīng)用于當(dāng)前的車型,甚至是功能更為強(qiáng)大的車道保持、塞車輔助及自適應(yīng)巡航控制等系統(tǒng)的配套使用也讓未來的全自動駕駛車輛成為現(xiàn)實(shí)。
如今,車輛的很多系統(tǒng)使用的都是機(jī)器視覺。機(jī)器視覺采用傳統(tǒng)信號處理技術(shù)來檢測識別物體。
對于正熱衷于進(jìn)一步提高拓展 ADAS 功能的汽車制造業(yè)而言,深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)開辟了令人興奮的研究途徑。為了實(shí)現(xiàn)從諸如高速公路全程自動駕駛儀的短時(shí)輔助模式到專職無人駕駛旅行的自動駕駛,汽車制造業(yè)一直在尋求讓響應(yīng)速度更快、識別準(zhǔn)確度更高的方法,而深度學(xué)習(xí)技術(shù)無疑為其指明了道路。
以知名品牌為首的汽車制造業(yè)正在深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)技術(shù)上進(jìn)行投資,并向先進(jìn)的計(jì)算企業(yè)、硅谷等技術(shù)引擎及學(xué)術(shù)界看齊。在中國,百度一直在此技術(shù)上保持領(lǐng)先。百度計(jì)劃在 2019 年將全自動汽車投入商用,并加大全自動汽車的批量生產(chǎn)力度,使其在 2021 年可廣泛投入使用。汽車制造業(yè)及技術(shù)領(lǐng)軍者之間的密切合作是嵌入式系統(tǒng)神經(jīng)網(wǎng)絡(luò)發(fā)展的催化劑。這類神經(jīng)網(wǎng)絡(luò)需要滿足汽車應(yīng)用環(huán)境對系統(tǒng)大小、成本及功耗的要求。
輕型嵌入式神經(jīng)網(wǎng)絡(luò)卷積式神經(jīng)網(wǎng)絡(luò) (CNN) 的應(yīng)用可分為三個(gè)階段:訓(xùn)練、轉(zhuǎn)化及 CNN 在生產(chǎn)就緒解決方案中的執(zhí)行。要想獲得一個(gè)高性價(jià)比、針對大規(guī)模車輛應(yīng)用的高效結(jié)果,必須在每階段使用最為有利的系統(tǒng)。
訓(xùn)練往往在線下通過基于 CPU 的系統(tǒng)、圖形處理器 (GPU) 或現(xiàn)場可編程門陣列 (FPGA) 來完成。由于計(jì)算功能強(qiáng)大且設(shè)計(jì)人員對其很熟悉,這些是用于神經(jīng)網(wǎng)絡(luò)訓(xùn)練的最為理想的系統(tǒng)。
在訓(xùn)練階段,開發(fā)商利用諸如 Caffe 等的框架對 CNN 進(jìn)行訓(xùn)練及優(yōu)化。參考圖像數(shù)據(jù)庫用于確定網(wǎng)絡(luò)中神經(jīng)元的最佳權(quán)重參數(shù)。訓(xùn)練結(jié)束即可采用傳統(tǒng)方法在 CPU、GPU 或 FPGA 上生成網(wǎng)絡(luò)及原型,尤其是執(zhí)行浮點(diǎn)運(yùn)算以確保最高的精確度。
作為一種車載使用解決方案,這種方法有一些明顯的缺點(diǎn)。運(yùn)算效率低及成本高使其無法在大批量量產(chǎn)系統(tǒng)中使用。
CEVA 已經(jīng)推出了另一種解決方案。這種解決方案可降低浮點(diǎn)運(yùn)算的工作負(fù)荷,并在汽車應(yīng)用可接受的功耗水平上獲得實(shí)時(shí)的處理性能表現(xiàn)。隨著全自動駕駛所需的計(jì)算技術(shù)的進(jìn)一步發(fā)展,對關(guān)鍵功能進(jìn)行加速的策略才能保證這些系統(tǒng)得到廣泛應(yīng)用。
利用被稱為 CDNN 的框架對網(wǎng)絡(luò)生成策略進(jìn)行改進(jìn)。經(jīng)過改進(jìn)的策略采用在高功耗浮點(diǎn)計(jì)算平臺上(利用諸如 Caffe 的傳統(tǒng)網(wǎng)絡(luò)生成器)開發(fā)的受訓(xùn)網(wǎng)絡(luò)結(jié)構(gòu)和權(quán)重,并將其轉(zhuǎn)化為基于定點(diǎn)運(yùn)算,結(jié)構(gòu)緊湊的輕型的定制網(wǎng)絡(luò)模型。接下來,此模型會在一個(gè)基于專門優(yōu)化的成像和視覺 DSP 芯片的低功耗嵌入式平臺上運(yùn)行。圖 1 顯示了輕型嵌入式神經(jīng)網(wǎng)絡(luò)的生成過程。與原始網(wǎng)絡(luò)相比,這種技術(shù)可在當(dāng)今量產(chǎn)型車輛的有限功率預(yù)算下帶來高性能的神經(jīng)處理表現(xiàn),而圖像識別精確度降低不到 1%。
圖 1. CDNN 將通過傳統(tǒng)方法生成的網(wǎng)絡(luò)權(quán)重轉(zhuǎn)化為一個(gè)定點(diǎn)網(wǎng)絡(luò)
一個(gè)由低功耗嵌入式平臺托管的輸入大小為 224x224、卷積過濾器分別為 11x11、5x5 及 3x3 的 24 層卷積神經(jīng)網(wǎng)絡(luò), 其性能表現(xiàn)幾乎是一個(gè)在典型的 GPU/CPU 綜合處理引擎上運(yùn)行的類似 CNN 的三倍,盡管其所需的內(nèi)存帶寬只是后者的五分之一且功耗大幅降低。
下一代深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)汽車制造業(yè)進(jìn)入神經(jīng)網(wǎng)絡(luò)領(lǐng)域所習(xí)得的經(jīng)驗(yàn)不斷推動技術(shù)的發(fā)展,并因此開發(fā)出了更先進(jìn)的網(wǎng)絡(luò)架構(gòu)及更復(fù)雜的拓?fù)?,如每級多層拓?fù)?、多?多出及全卷積網(wǎng)絡(luò)。新推出的重要網(wǎng)絡(luò)類型不僅可用來識別物體,也可用來識別場景,從而提供用以解決汽車領(lǐng)域應(yīng)用程序(如自動駕駛功能)所需的圖像分割。
當(dāng)然,中國 40 家左右的汽車制造商并不會在此道路上踽踽獨(dú)行。他們會與百度等技術(shù)公司進(jìn)行密切合作。技術(shù)公司是這些網(wǎng)絡(luò)和架構(gòu)發(fā)展的核心。CNN 網(wǎng)絡(luò)生成器功能的完善也為新的網(wǎng)絡(luò)架構(gòu)和拓?fù)涮峁┝酥С?,?SegNet 及 GoogLeNet 與 ResNet 等其它網(wǎng)絡(luò)結(jié)構(gòu)以及高級網(wǎng)絡(luò)層(圖 2)。此外,一鍵啟用也讓預(yù)訓(xùn)網(wǎng)絡(luò)轉(zhuǎn)換成優(yōu)化的實(shí)時(shí)網(wǎng)絡(luò)執(zhí)行更為便捷。為確保給常用的網(wǎng)絡(luò)生成器提供支持,CDNN 框架與 Caffe 和 TensorFlow (谷歌的機(jī)器學(xué)習(xí)軟件庫)都有合作。
圖 2網(wǎng)絡(luò)生成器的發(fā)展為新網(wǎng)絡(luò)層及更深的架構(gòu)提供了支持
由于最新推出的嵌入式處理平臺在可擴(kuò)展性及靈活性上都有了很大改進(jìn),因此嵌入式部署也可以利用這些改進(jìn)來完善自身。由于深度學(xué)習(xí)領(lǐng)域的發(fā)展越來越多樣化,因此擁有一個(gè)不僅能滿足當(dāng)今處理需求,也具有適應(yīng)未來的技術(shù)創(chuàng)新的靈活架構(gòu)非常重要。
鋪好路第一批神經(jīng)網(wǎng)絡(luò)應(yīng)用程序?qū)W⒂谝曈X處理,以支持諸如自動行人、交通信號或道路特征識別等功能。由于這些系統(tǒng)的性能不斷改進(jìn),例如處理越來越大的來自高分辨率相機(jī)的數(shù)據(jù)集,因此神經(jīng)網(wǎng)絡(luò)也有望在未來的汽車中發(fā)揮更大的作用。這些作用將包括承擔(dān)系統(tǒng)中其它復(fù)雜的信號處理任務(wù),例如雷達(dá)模塊及語音識別系統(tǒng)。
隨著神經(jīng)網(wǎng)絡(luò)首次應(yīng)用于車載自動駕駛系統(tǒng),(據(jù)報(bào)道,某些國家將在 2019-2020 年型的新車輛中使用神經(jīng)網(wǎng)絡(luò),)對同時(shí)兼具安全性及可靠性的系統(tǒng)的需求會越來越大。中國政府計(jì)劃在 2021 至 2025 年推出自動駕駛車輛。要讓此類系統(tǒng)具備可讓客戶使用的條件,汽車制造商必須同時(shí)確保其符合相關(guān)的安全標(biāo)準(zhǔn),如 ISO 26262 功能安全性。這需要硬件、軟件及系統(tǒng)的綜合發(fā)展。
由于這些系統(tǒng)變得越來越復(fù)雜,因此確保系統(tǒng)可靠安全且能滿足處理需求也成為汽車制造商所面臨的越來越大的挑戰(zhàn)。
結(jié)論機(jī)器學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)將沿著一條挑戰(zhàn)高效處理性能的發(fā)展道路繼續(xù)闊步前進(jìn)。先進(jìn)的神經(jīng)網(wǎng)絡(luò)架構(gòu)已經(jīng)顯現(xiàn)出優(yōu)于人類的識別精確性。用于生成網(wǎng)絡(luò)的最新框架,如 CDNN2,正在推動輕型、低功耗嵌入式神經(jīng)網(wǎng)絡(luò)的發(fā)展。這種神經(jīng)網(wǎng)絡(luò)將使目前的高級輔助駕駛系統(tǒng)具有較高的精確性及實(shí)時(shí)處理能力。