基于驍龍820A平臺(tái)并運(yùn)用深度學(xué)習(xí)的ADAS產(chǎn)品原型方案介紹
本篇對(duì)ADAS做一個(gè)基本介紹,在接下來(lái)的更新中將會(huì)描述各個(gè)模塊用到的技術(shù)以及解決方案簡(jiǎn)介
汽車行業(yè)是一個(gè)有百年歷史的行業(yè),且在這100多年來(lái),一直循序漸進(jìn)的發(fā)展,很少有突破性的進(jìn)展。但最近幾年,由于技術(shù)上的一些新突破,從傳感器,到計(jì)算機(jī)技術(shù),新能源技術(shù),尤其是人工智能領(lǐng)域的一些突破,給傳統(tǒng)的汽車行業(yè)帶來(lái)了深刻的變革。其中最突出的就是對(duì)自動(dòng)駕駛的研究和實(shí)施。
汽車給人類帶來(lái)的巨大便利,極大的提高了生產(chǎn)效率,但同時(shí)也帶來(lái)了很多負(fù)面影響。包括人員的傷亡(交通事故),空氣污染,以及交通擁堵帶來(lái)的巨大時(shí)間成本。
在2017年全球最前沿科技展示大會(huì)電子消費(fèi)展上,專注輔助駕駛(ADAS)和自動(dòng)駕駛研發(fā)的縱目科技與高通聯(lián)合展示了,首個(gè)基于驍龍820A平臺(tái)并運(yùn)用深度學(xué)習(xí)的最新ADAS產(chǎn)品原型,贏得了全球業(yè)界大佬的廣泛關(guān)注。
這臺(tái)搭載ADAS原型系統(tǒng)的裝備,運(yùn)用了運(yùn)行在驍龍820A神經(jīng)網(wǎng)絡(luò)處理引擎(SNPE)上的統(tǒng)一神經(jīng)網(wǎng)絡(luò)算法。在縱目科技和清華大學(xué)聯(lián)合自主開(kāi)發(fā)完成, 能夠?qū)崿F(xiàn)高速公路和市區(qū)道路場(chǎng)景下的ADAS功能,可對(duì)車輛、行人、自行車等多類物體識(shí)別,以及對(duì)像素級(jí)別可行駛區(qū)域的實(shí)時(shí)語(yǔ)義分割。
毫無(wú)疑問(wèn),深度學(xué)習(xí)的嘗試已經(jīng)在服務(wù)器上嘗試了多年,但挑戰(zhàn)在于,如何把復(fù)雜的算法放到線下的處理器上。
高通提供了神經(jīng)網(wǎng)絡(luò)處理引擎(SNPE)。這款深度學(xué)習(xí)開(kāi)發(fā)套件SDK今年五月初發(fā)布,可運(yùn)行于搭載了高通Zeroth機(jī)器智能平臺(tái)的820芯片處理器。 開(kāi)發(fā)者可以在SNPE上搭建自己的深度學(xué)習(xí)網(wǎng)絡(luò)模型,縱目這款原型產(chǎn)品使用的網(wǎng)絡(luò)模型是聯(lián)合清華大學(xué)3D Image實(shí)驗(yàn)室共同定義的,清華大學(xué)提供了初始的網(wǎng)絡(luò)模型原型,后期優(yōu)化和算法的工程化、細(xì)節(jié)的調(diào)試和實(shí)現(xiàn)是由縱目主導(dǎo)完成的。
高通驍龍820A是從手機(jī)平臺(tái)進(jìn)行車規(guī)化的,它的功耗優(yōu)化做得相當(dāng)好;其次,高通背后是基于手機(jī)等移動(dòng)終端的大規(guī)模市場(chǎng),芯片上的IP研發(fā)費(fèi)用在最大的手 機(jī)市場(chǎng)上得到了攤銷,具有非常明顯的成本優(yōu)勢(shì);最后,未來(lái)只是單純強(qiáng)調(diào)計(jì)算能力或具備深度學(xué)習(xí)能力的芯片不太可能成為汽車行業(yè)大規(guī)模應(yīng)用的產(chǎn)品。類似高通 820A這樣,在一塊電路板上集成了5G通信模塊、神經(jīng)網(wǎng)絡(luò)處理引擎、GPS、DSRC、無(wú)線WiFi等諸多功能的芯片,是適應(yīng)未來(lái)智能互聯(lián)/自動(dòng)駕駛汽 車發(fā)展趨勢(shì)的產(chǎn)品。
未來(lái)有望能利用高通820A平臺(tái)較強(qiáng)的擴(kuò)展性打造一系列產(chǎn)品,應(yīng)用場(chǎng)景囊括了從低速的2D/3D環(huán)視泊車輔助、自動(dòng)泊車、自主泊車、高速的AEB/ACC /LDW駕駛輔助,以及屬于更高階段的自動(dòng)駕駛等范疇。而隨著產(chǎn)品功能的變化,會(huì)陸續(xù)增加攝像頭的數(shù)量,接入其他功能的傳感器。未來(lái)再逐步將這些原型產(chǎn)品 推向量產(chǎn)。
系統(tǒng)首先需要進(jìn)行感知,感知車輛、感知環(huán)境來(lái)回答我在哪里? 周邊環(huán)境如何? 這塊采用的傳感器技術(shù)包括了激光雷達(dá)、毫米波雷達(dá)、攝像頭、超聲雷達(dá)、高精度定位、以及高精度地圖、V2X等技術(shù)。系統(tǒng)通過(guò)分析決策來(lái)分析 “接下來(lái)會(huì)發(fā)生什么”以及“接下來(lái)我該做什么”。最后通過(guò)執(zhí)行結(jié)構(gòu)完成相應(yīng)的操控動(dòng)作。
感知部分主要通過(guò)不同的傳感器作為數(shù)據(jù)源來(lái)獲取周邊的環(huán)境信息。目前使用的傳感器包括激光雷達(dá),毫米波雷達(dá)和攝像頭。
激光雷達(dá),能夠生成數(shù)字搞成模型。它的工作過(guò)程包括,LiDAR以一定的角速度勻速轉(zhuǎn)動(dòng),在這個(gè)過(guò)程中不斷地發(fā)出激光并收集反射點(diǎn)的信息,計(jì)算出所有反射點(diǎn)的坐標(biāo)。LiDAR每旋轉(zhuǎn)一周收集到的所有反射點(diǎn)坐標(biāo)的集合就形成了該時(shí)刻的點(diǎn)云(point cloud)。
攝像頭由于成本低、分辨率高、也是唯一可獲得外觀信息的傳感器,在目前技術(shù)條件下成為主要的傳感器硬件。攝像頭有單目、雙目、甚至多目的解決方案。單目攝像頭在測(cè)距等應(yīng)用中需要維護(hù)大量樣本進(jìn)行訓(xùn)練,而雙目和多目由于采用了立體視覺(jué)的技術(shù),可以不再依賴大量樣本數(shù)據(jù)但需要復(fù)雜的算法和大量的實(shí)時(shí)計(jì)算才能得出。
鏡頭的角度、有效識(shí)別距離、分辨率三者之間是矛盾的。比 如 ADAS 系統(tǒng)對(duì)攝像頭的要求是縱深方向的視野要好、低像素、高感光度(給機(jī)器用的)。而行車記錄儀(給人用的)要求大廣角,像素要高得多(即使只有 200萬(wàn)像素),因此,現(xiàn)在一些市面上的行車記錄儀也可實(shí)現(xiàn)ADAS 中如FCW的一些功能,這種方式從傳感器上本身就有缺陷。
以上大概介紹了ADAS的技術(shù)路線以及發(fā)展趨勢(shì)。