從L2+到L4:多技術(shù)路徑的ADAS發(fā)展,究竟需要什么樣的芯片?
在剛結(jié)束的CES上,車載計(jì)算芯片成為了展會(huì)的重頭戲,汽車自動(dòng)駕駛成為了行業(yè)巨頭爭(zhēng)奪的熱門市場(chǎng)。安霸也發(fā)布了其搭載最新一代CVflow架構(gòu)的汽車域控制器芯片——CV3系列。本文從CV3出發(fā),看到當(dāng)前汽車域控制器的市場(chǎng)需求和走向;以及如何在市場(chǎng)發(fā)展前期多樣化的局面下,把握車載計(jì)算芯片的專用性和通用性的平衡。
從L2+到L4:多路徑、百花齊放
當(dāng)前的智能汽車的ADAS處在蓬勃發(fā)展的階段,正在實(shí)現(xiàn)從L2+到L4的邁進(jìn)。SAE將L0~L2級(jí)定義為駕駛輔助類,L3~L5級(jí)定義為自動(dòng)駕駛類。在當(dāng)前的自動(dòng)駕駛發(fā)展階段,目前既有特斯拉蔚來(lái)這種新勢(shì)力車廠、也有谷歌百度這種大型IT公司、也有亞馬遜阿里這樣的云服務(wù)商、也有福特大眾傳統(tǒng)車企、也有小米蘋果這樣的消費(fèi)類廠商。從不同的定位、不同的落地場(chǎng)景和不同的技術(shù)儲(chǔ)備出發(fā),也就有著不同的考量,所以ADAS當(dāng)前的技術(shù)路線也呈現(xiàn)多樣性。到車載計(jì)算芯片的定義上,PPA雖然是一致的追求,但具體的架構(gòu)、片上接口資源和特性等也就各不相同。不同的芯片廠商例如高通、TI、英偉達(dá)等,結(jié)合自己對(duì)于ADAS應(yīng)用的理解,也就開發(fā)出了不一樣的產(chǎn)品。
圖:SAE給出的六個(gè)自動(dòng)駕駛級(jí)別
“關(guān)于自動(dòng)駕駛的產(chǎn)業(yè)生態(tài),尤其是在中國(guó),會(huì)有多種發(fā)展路徑。很多家公司因?yàn)樗涞貓?chǎng)景不一樣,對(duì)成本要求不一樣,會(huì)采取非常不一樣的路徑?!卑舶灾袊?guó)區(qū)總經(jīng)理馮羽濤分享到,“有非常多的公司采取了不同的發(fā)展路徑,有一些是直接進(jìn)入全自動(dòng)駕駛的方向,它會(huì)跳過(guò)前面部分。大家常用的自動(dòng)駕駛L1、L2的分級(jí),后面直接研發(fā)到全自動(dòng)駕駛,但是也有很多公司會(huì)采取逐漸發(fā)展的方式,多種路徑在國(guó)內(nèi)都會(huì)存在,而且在快速發(fā)展期會(huì)非常多樣化。”所以,在這個(gè)蓬勃發(fā)展的初期過(guò)程,各個(gè)公司的智能駕駛方案的會(huì)從其落地場(chǎng)景出發(fā),平衡其傳感器配置以及系統(tǒng)整體成本。
圖源:Yole
在市場(chǎng)和行業(yè)的當(dāng)前發(fā)展階段,沒(méi)有強(qiáng)合作綁定關(guān)系的汽車計(jì)算芯片的廠商,在進(jìn)行自己的產(chǎn)品定義的時(shí)候,需要在ADAS專用的前提下,架構(gòu)上有一定的張力,也就是通用性,保證能夠適應(yīng)各種不同的技術(shù)路線,不同的ADAS處理算法。這也就是安霸最新的CV3系列芯片的定義出發(fā)點(diǎn),馮羽濤表示,“ 安霸作為芯片供應(yīng)商,我是希望能夠服務(wù)于所有的這些自動(dòng)駕駛廠商。所以我們對(duì)自動(dòng)駕駛的判斷就像我開篇說(shuō)的,我覺(jué)得會(huì)多種發(fā)展路徑,多傳感器感知融合,這也是CV3的設(shè)計(jì)思路?!?
汽車計(jì)算芯片——算法為先優(yōu)化架構(gòu)
在ADAS興起之前,汽車上對(duì)于圖像和視頻的采集最終都是需要人來(lái)觀看處理,ISP相關(guān)技術(shù)是關(guān)鍵。所以安霸最初涉足汽車電子領(lǐng)域,專注行車記錄儀和電子后視鏡等圖像和視頻處理芯片,當(dāng)時(shí)的“算法優(yōu)先”考慮于處理好顏色、對(duì)比度和清晰度等細(xì)節(jié)。在這個(gè)階段,安霸就開始奉行“算法優(yōu)先”的理念,A12、H22和H32芯片架構(gòu)非常適合這些圖像處理的算法需求,這也是其在這一領(lǐng)域首先取得成功的關(guān)鍵原因。
而后隨著駕駛輔助應(yīng)用的興起,AI視覺(jué)感知技術(shù)成為了關(guān)鍵。AI視覺(jué)感知對(duì)于算法的依賴程度更高,為了實(shí)現(xiàn)更高的計(jì)算效率,需要架構(gòu)與算法實(shí)現(xiàn)更緊密的耦合。安霸于2015年收購(gòu)了有著25年自動(dòng)駕駛經(jīng)驗(yàn)的VisLab公司,深入了解自動(dòng)駕駛汽車的算法對(duì)于芯片的需求,做出適應(yīng)更多算法和自動(dòng)駕駛的AI加速硬件架構(gòu)CVflow,這一架構(gòu)下的產(chǎn)品有CV2x系列、CV2FS系列和CV5系列。而后又在2021年收購(gòu)了傲酷,這是一家全球領(lǐng)先的4D成像雷達(dá)算法公司,可以用較少的硬件資源達(dá)到非常清晰的雷達(dá)成像。通過(guò)對(duì)傲酷的算法吸收,安霸在雷達(dá)感知與視覺(jué)融合算法有了更深入的理解。通過(guò)這些一系列的在視覺(jué)、雷達(dá)等傳感器數(shù)據(jù)處理算法上的積累和沉淀,安霸在此次CES上推出了搭載新一代CVflow架構(gòu)的CV3系列,實(shí)現(xiàn)ADAS專用的同時(shí)又保證了算法的通用性,布局汽車AI域控制器領(lǐng)域。
因?yàn)槭菍iT為算法優(yōu)化的架構(gòu),所以不能單純的看TOPS這一參數(shù),安霸的芯片在算力表達(dá)上有所不同,從CV2x系列產(chǎn)品開始就用“eTOPS”來(lái)表示。e代表著Equivalent,也就是等效TOPS的意思。將同一個(gè)神經(jīng)網(wǎng)絡(luò)運(yùn)算,跑在CVflow架構(gòu)的芯片上和跑在GPU上來(lái)進(jìn)行對(duì)比。如果能把相同的神經(jīng)網(wǎng)絡(luò)算法跑到等效的這么快,就叫做Equivalent TOPS,簡(jiǎn)稱eTOPS。這是源自專用的CVflow更接近系統(tǒng)表現(xiàn)的算力的一種表達(dá)。
單芯片域控制器CV3:高算力、雷達(dá)和視覺(jué)原始數(shù)據(jù)融合
新一代的CV3為單芯片域控制器,首發(fā)的型號(hào)為最高性能的旗艦版,后續(xù)會(huì)在旗艦版的基礎(chǔ)上陸續(xù)推出新的低成本型號(hào)。CV3采用了和CV5相同的5nm 低功耗制程,內(nèi)置了16個(gè)Arm Cortex-A78AE內(nèi)核,搭載了新一代的CVflow架構(gòu),AI算力高達(dá)500 eTOPS,比CV2 系列提高了42 倍,每瓦性能比提高了4倍。單芯片集成多傳感器進(jìn)行集中化AI 感知處理(包括高像素視覺(jué)處理、毫米波雷達(dá)、激光雷達(dá)和超聲波雷達(dá))、多傳感器深度融合以及自動(dòng)駕駛車的路徑規(guī)劃。
新一代的CVflow中包含NVP和GVP兩個(gè)向量處理器,從命名就可以看出,一個(gè)是專門做神經(jīng)網(wǎng)絡(luò)的向量處理,一個(gè)是通用的向量處理。NVP針對(duì)4bit、8bit、16bit這種定點(diǎn)運(yùn)算有著專門的優(yōu)化。GVP對(duì)16bit、32bit浮點(diǎn)運(yùn)算的支持比較好。據(jù)馮羽濤分享,新一代CVflow的設(shè)計(jì)思路來(lái)自于和當(dāng)前行業(yè)客戶的深入溝通。目前很多客戶的算法是混合的,既有傳統(tǒng)算法,也有神經(jīng)網(wǎng)絡(luò)的算法。定點(diǎn)運(yùn)算和浮點(diǎn)運(yùn)算需求混合存在,所以針對(duì)不同的需求設(shè)計(jì)了不同的向量處理資源,來(lái)實(shí)現(xiàn)更高效率的處理。例如最近非常流行的Transformer網(wǎng)絡(luò),需要的運(yùn)算就是直接的多維向量矩陣乘法,這種計(jì)算需求在NVP上處理的效率就會(huì)高很多,安霸也在NVP中對(duì)這一網(wǎng)絡(luò)進(jìn)行了專門的硬件支持。此外,CVflow的靈活性不僅僅體現(xiàn)在針對(duì)不同計(jì)算需求的處理上,在整個(gè)CV3的產(chǎn)品map里, 也可以通過(guò)調(diào)整CVflow中NVP和GVP的數(shù)量,來(lái)調(diào)整芯片的計(jì)算資源,結(jié)合其他的芯片資源的調(diào)整,實(shí)現(xiàn)產(chǎn)品型號(hào)由高到低的布局。
CV3的另一個(gè)特點(diǎn)在于可以將雷達(dá)數(shù)據(jù)和視頻數(shù)據(jù)在原始的數(shù)據(jù)集上進(jìn)行處理,實(shí)現(xiàn)傳感器數(shù)據(jù)的深度融合計(jì)算。這也是行業(yè)內(nèi)傳感器融合的一個(gè)發(fā)展趨勢(shì),在前端完成原始數(shù)據(jù)的分析、學(xué)習(xí)和融合處理。
據(jù)安霸中國(guó)區(qū)市場(chǎng)營(yíng)銷副總裁郄建軍分享,在視頻和雷達(dá)的融合方面,一般的做法都是“后融合”或目標(biāo)級(jí)融合。而在CV3芯片里就可以做“前融合”,也就是視頻的像素和雷達(dá)的點(diǎn)云做原始數(shù)據(jù)級(jí)的融合。這種融合的挑戰(zhàn)在于處理的數(shù)據(jù)量很大,處理的實(shí)時(shí)性要求更高。需要保證點(diǎn)云和像素對(duì)位準(zhǔn)確,時(shí)空同步做的非常好。CV3上的這種“前融合”會(huì)使感知的整體性能包括置信度大幅度提升,誤檢率、漏檢率大幅度下降。CV3中結(jié)合了傲酷的4D成像雷達(dá)算法,在和視頻做前融合以后,整體性能可以做到類似低線束激光雷達(dá)的效果,在某種程度上可以取代低線束激光雷達(dá)。
從CV2的4核A53到CV3的16核A78AE(4個(gè)集群),是跟進(jìn)Arm架構(gòu)的升級(jí),響應(yīng)某些用戶對(duì)于傳統(tǒng)算法和算力提升的需求。采用四個(gè)集群的設(shè)計(jì),也是從系統(tǒng)開發(fā)的角度出發(fā),可以分別在不同的集群上部署不同的功能,實(shí)現(xiàn)更為獨(dú)立的軟件開發(fā)。結(jié)合CV3支持20個(gè)攝像頭的接入,這些特性對(duì)于有“硬件預(yù)埋”需求的廠商而言,也是非常必要的,保證一定的硬件資源冗余。
總結(jié)
當(dāng)安霸在2015年收購(gòu)VisLab的時(shí)候,VisLab自己做的自動(dòng)駕駛demo車?yán)?,后備箱里滿滿的PC處理器。當(dāng)時(shí)安霸就想到,下一代能夠用一顆芯片取代這滿滿一后備箱的PC處理器,達(dá)到同樣的計(jì)算能力。現(xiàn)在CV3的出現(xiàn),單芯片高算力、前置雷達(dá)和視覺(jué)原始數(shù)據(jù)融合、靈活的CVflow架構(gòu)、4集群16核的通用計(jì)算能力...已經(jīng)將這一愿景達(dá)成。
在當(dāng)前百舸爭(zhēng)流的ADAS賽道上,既要做ADAS算法專用的芯片,架構(gòu)上優(yōu)化算法 ,堅(jiān)持算法優(yōu)先策略;又要考慮各家不同算法的需求、不同傳感器的需求、實(shí)現(xiàn)一定的通用性。CV3的出現(xiàn),可以幫助不同類型的玩家,讓ADAS從L2+到L4的發(fā)展更加精彩。