未來智能汽車的變革、數(shù)據(jù)的處理效率、汽車的安全保障,以及新的電子架構(gòu)和自動駕駛的技術(shù)等等都離不開芯片。而最近Arm發(fā)布了三款芯片,面向自動駕駛車輛的高強度工作負載。
Arm近日發(fā)布了幾款全新的IP,旨在讓智能汽車開發(fā)商更容易將他們的設(shè)計方案推向量產(chǎn)市場。據(jù)該公司介紹,三種新處理器IP將集成到一個系統(tǒng)芯片上——Arm Cortex-A78AE處理器、Mali-G78AE圖形處理器和Mali-C71AE圖像信號處理器。
Arm表示,Cortex-A78AE、Mali-G78AE和Mali-C71AE是現(xiàn)有的Cortex-A78、Mali-G78和Mali-C71的高階版本,面向自動駕駛車輛的高強度工作負載。
在軟件開發(fā)支持方面,Arm提供了Arm Fast Models,可用于構(gòu)建功能精確的虛擬平臺,使軟件開發(fā)和驗證先于硬件可用性。還有Arm Development Studio,其中包括由德國TUV SUD認證的Arm編譯器。
這些新產(chǎn)品方案的推出,目的是為了提供更高效和安全的數(shù)據(jù)處理,以實現(xiàn)自主決策的效率、安全和潛力。
盡管,完全自動駕駛車輛或無人駕駛汽車可能還需要數(shù)年時間才能投入商用,但先進的駕駛輔助系統(tǒng)(ADAS)已經(jīng)可以幫助減少多達40%的事故。
Arm汽車和物聯(lián)網(wǎng)副總裁Chet Babla表示,新技術(shù)將安全放在首位,但也提供了能效和性能提升。
一、提高性能功耗比
Cortex-A78AE是Cortex-A76AE的后續(xù)產(chǎn)品,其微架構(gòu)已經(jīng)在多個方面進行了改進。它的特點是額外的帶寬,改進的分支檢測,以及比上一代帶寬高50%的內(nèi)存子系統(tǒng)。
但是Cortex-A78AE最突出的特性可能是宏操作緩存,這種結(jié)構(gòu)設(shè)計用于保存解碼指令,解耦獲取引擎和執(zhí)行,以支持動態(tài)代碼序列優(yōu)化。
Arm表示,這些創(chuàng)新使得整型和浮點計算的性能比Spec2006綜合基準套件提高了30%以上。此外,它們還有助于提高Cortex-A78AE的功率效率。
在7納米器件上,Cortex-A78AE以低60%的功率實現(xiàn)了目標性能,在相同的功率(耗電量)下性能提高了25%。
此次,Arm將Cortex-A78AE的安全特性作為主要進步進行重點“宣傳”。
當Cortex-A76AE引入Split-Lock架構(gòu)時,它被視為安全計算新時代的誕生。及時檢測邏輯中的故障對解決行業(yè)標準(如ISO 26262/IEC 61508)規(guī)定的功能性安全問題大有幫助。
但是新的架構(gòu)帶來了新的挑戰(zhàn)——可用性、ASIL B支持和全系統(tǒng)功能安全性。Cortex-A78AE通過一系列的安全功能直面這些挑戰(zhàn)。
首先,Arm通過增加時間多樣性來增強原來的鎖步能力,以防止常見原因的故障,這是一個很小但非常重要的增加。
除了拆分模式操作之外,還增強了混合模式——這是一種進步,允許共享的DSU-AE邏輯在鎖模式下繼續(xù)運行,而cpu保持獨立(拆分)。
這樣做的好處有兩方面:
1、在FMEDA中,DSU-AE計數(shù)對診斷覆蓋率的額外覆蓋;2、cpu可以單獨離線進行測試,而集群本身仍可用于計算,盡管計算能力有所降低。
此外,標準的安全措施,如緩存保護邏輯在Cortex-A78AE中仍然是強制性的,可用性進一步增強,增加了線鎖定支持,以避免觸及緩存結(jié)構(gòu)中的錯誤位置。
最后,Cortex-A78AE帶有AMBA奇偶性保護功能,它的架構(gòu)與AE IP組合套件一起工作。這是一種簡單且有效的方式,可以在SoC的其余部分擴展功能安全保護傘,從而實現(xiàn)端到端(E2E)保護能力的目標。
此外,Cortex-A78AE可以在處理器集群中擴展到最多4個核,并且可以在L1、L2和L3中使用不同大小的緩存。
盡管Cortex-A78AE的性能令人印象深刻,但汽車及工業(yè)領(lǐng)域的計算平臺需要混合功率效率、算法強度和直接計算吞吐量。
正確大小的計算是當今的口號。簡單地說,沒有一個微體系結(jié)構(gòu)能夠滿足這些細分市場的應(yīng)用程序需求。
例如,一個自動駕駛平臺需要在使用車輛控制之前感知數(shù)據(jù)、感知障礙物并決定正確的路徑矢量。只有中間的兩個任務(wù),需要大量不同的算法來執(zhí)行。
為此,除了內(nèi)存接口和類型之外,CPU還支持以各種緩存大小(L1、L2和L3)進行配置。比如,Cortex-A78AE可以與Cortex-A65AE在異質(zhì)計算集群中配對,并且可以通過加速器相干端口與加速器耦合。
這種新的混合模式允許分割鎖功能,其中處理器成對運行,在不影響性能的情況下滿足較低級別的安全要求,而SoC計算體系結(jié)構(gòu)也可以部署到不同的域控制器上。
二、硬件分離
與Cortex-A78AE互補的是最新推出的Mali-G78AE,這是一個全新的圖形組件,可以解決自動駕駛系統(tǒng)中的異構(gòu)計算需求。
G78AE GPU提供了一種新的資源分配方法,它具有一種稱為靈活分區(qū)的特性,這使得圖形資源可以專用于不同的工作負載,同時保持彼此獨立。
基本上,Mali-G78AE可以被分割成一個系統(tǒng)中的多個GPU,有多達4個用于工作負載分離的專用分區(qū),這些分區(qū)可以使用用于事務(wù)的單獨內(nèi)存接口分別上機、關(guān)機和復(fù)位。
Mali-G78AE可以從1個shader core擴展到24個,在新的架構(gòu)中,這意味著可以按照8個slices配置,每個slices有三個shader core。
每個slices有獨立的內(nèi)存接口、工作控制和L2緩存,以確保分離的功能安全和信息安全,slices也可以組合在一起,在多達四個分區(qū)可配置軟件。
Mali-G78AE還包括專用的硬件虛擬化,這意味著GPU作為一個整體(即每個單獨的分區(qū))可以在多個虛擬機之間進行虛擬化。
除此之外,它還具有安全特性,包括鎖步、內(nèi)置自測試、接口奇偶校驗、隔離檢查和只讀內(nèi)存保護。
新Mali-G78AE GPU為獨立的安全工作負載提供了多達4個獨立分區(qū)的靈活分區(qū)。例如,汽車上的信息娛樂系統(tǒng)、具有安全要求的儀表和駕駛員監(jiān)控系統(tǒng)現(xiàn)在都可以通過硬件分離同時獨立運行。
三、視覺感知,仍是大難題
Mali-C71AE,利用硬件安全機制和診斷軟件來預(yù)防和檢測故障,并確保“每一個像素的可靠性”。
Arm表示,事實上,Mali-C71AE是Mali相機系列ISPs中首款內(nèi)置安全功能的產(chǎn)品。同時,支持ASIL B/SIL 2安全能力,提供1.2千兆像素/秒的吞吐量。
Mali-C71AE支持最多4個實時攝像頭輸入或者16個來自內(nèi)存的攝像頭數(shù)據(jù)流。相機輸入可以用多種方法進行處理,包括按接收順序、按編程順序或按各種其他軟件定義的模式。
先進的空間降噪、每次曝光噪聲分析和色差校正為計算機視覺應(yīng)用提供了優(yōu)化的數(shù)據(jù),為ADAS和人機界面應(yīng)用提供了實時安全功能,使系統(tǒng)級功能安全符合400多個專用故障檢測電路和內(nèi)置自檢。
此外,Mali-C71AE具有超寬動態(tài)范圍的24位處理,提供了獨立的動態(tài)范圍管理、感興趣的區(qū)域操作和用于進一步分析的平面直方圖。