分布式安全機(jī)制實(shí)現(xiàn)更高效的ASIL-B級(jí)功能安全構(gòu)建,Imagination發(fā)布最新汽車(chē)級(jí)GPU IP——IMG DXS GPU
掃描二維碼
隨時(shí)隨地手機(jī)看文章
近年來(lái),隨著汽車(chē)智能化和電動(dòng)化的快速發(fā)展,汽車(chē)半導(dǎo)體市場(chǎng)展現(xiàn)出了前所未有的增長(zhǎng)潛力。根據(jù)S&P Global Mobility的預(yù)測(cè),到2029年,全球汽車(chē)半導(dǎo)體市場(chǎng)的收入預(yù)計(jì)將大幅增長(zhǎng),超過(guò)1300億美元。2022年該市場(chǎng)的收入為680億美元,意味著未來(lái)幾年將實(shí)現(xiàn)一倍的增長(zhǎng)。這一增長(zhǎng)主要得益于先進(jìn)駕駛輔助系統(tǒng)(ADAS)、電動(dòng)化以及信息娛樂(lè)系統(tǒng)的普及,尤其是在電動(dòng)汽車(chē)領(lǐng)域,半導(dǎo)體內(nèi)容的增加更為顯著。未來(lái)十年,隨著這些技術(shù)的廣泛應(yīng)用,汽車(chē)半導(dǎo)體市場(chǎng)將迎來(lái)爆發(fā)式的增長(zhǎng)。
高性能計(jì)算需求上升正在推動(dòng)著包括車(chē)規(guī)級(jí)GPU在內(nèi),發(fā)揮出更為關(guān)鍵的作用尤。隨著ADAS(高級(jí)駕駛輔助系統(tǒng))和自動(dòng)駕駛對(duì)高性能計(jì)算需求的增加,車(chē)規(guī)級(jí)GPU不僅是圖像處理的核心,更在駕駛輔助、自動(dòng)駕駛決策和傳感器數(shù)據(jù)融合等方面發(fā)揮著重要作用。車(chē)規(guī)級(jí)GPU正在推動(dòng)汽車(chē)從輔助駕駛逐步邁向完全自動(dòng)駕駛的未來(lái)。
作為深耕GPU領(lǐng)域近40年的專(zhuān)家,Imagination的半導(dǎo)體解決方案在各類(lèi)市場(chǎng)中已經(jīng)出貨超過(guò)13億臺(tái)設(shè)備,其中3.95億設(shè)備是應(yīng)用在汽車(chē)領(lǐng)域的。尤其是在座艙和信息娛樂(lè)系統(tǒng)GPU IP供應(yīng)上,是當(dāng)之無(wú)愧的的全球領(lǐng)先者。通過(guò)統(tǒng)一的PowerVR GPU架構(gòu),Imagination在汽車(chē)領(lǐng)域內(nèi)提供了高效、安全且可擴(kuò)展的圖形和計(jì)算處理能力,滿(mǎn)足了現(xiàn)代汽車(chē)對(duì)計(jì)算性能日益增長(zhǎng)的需求。
近日Imagination發(fā)布了其最新的汽車(chē)級(jí)GPU IP——IMG DXS GPU,相比上一代汽車(chē)GPU IP,DXS GPU的峰值性能提升了50%,并結(jié)合了最新的D系列架構(gòu)效率和圖形功能,使其成為強(qiáng)大的圖形處理器。新推出的分布式安全機(jī)制(Distributed Safety Mechanisms)在不影響性能的前提下,簡(jiǎn)化了實(shí)現(xiàn)ASIL-B(汽車(chē)功能安全等級(jí))的成本。通過(guò)軟硬件的協(xié)同優(yōu)化,DXS GPU的計(jì)算性能提升高達(dá)10倍,極大增強(qiáng)了GPU在自動(dòng)駕駛等高計(jì)算需求場(chǎng)景下的表現(xiàn)。
最新的PowerVR架構(gòu),突破GPU計(jì)算能力新高度
最新的IMG DXS GPU在圖形處理和計(jì)算性能上的強(qiáng)大表現(xiàn)。首先,相比上一代產(chǎn)品,DXS GPU的每核心性能提升了50%,顯著提高了圖形和計(jì)算任務(wù)的處理能力。此外,DXS GPU具有極強(qiáng)的可擴(kuò)展性,支持?jǐn)U展至四個(gè)核心,最大化系統(tǒng)的處理能力。在1GHz時(shí),DXS MC1能夠達(dá)到1.5 TFLOPS的浮點(diǎn)性能,并在INT8計(jì)算中實(shí)現(xiàn)6 TOPS(每秒萬(wàn)億次操作),圖形像素填充率達(dá)到48 GPixels/s。而當(dāng)頻率提升至1.5GHz,DXS MC4的整體性能能夠達(dá)到9 TFLOPS的浮點(diǎn)性能、36 TOPS的INT8性能以及288 GPixels/s的像素填充率。通過(guò)這些優(yōu)化,DXS GPU在計(jì)算性能、圖形處理能力和可擴(kuò)展性方面都達(dá)到了一個(gè)新的高度。
IMG DXS GPU的強(qiáng)大性能表現(xiàn)來(lái)自其最新一代PowerVR GPU架構(gòu)。通過(guò)采用2D雙速率紋理處理、數(shù)據(jù)主線(xiàn)、固件處理器、片段著色率以及ASTC HDR等先進(jìn)技術(shù),該架構(gòu)實(shí)現(xiàn)了性能密度提升20%。這種提升不僅增強(qiáng)了乘客的游戲體驗(yàn),還改善了車(chē)載用戶(hù)界面的響應(yīng)速度,提供了更順暢的操作體驗(yàn)。同時(shí),PowerVR GPU顯著增強(qiáng)了環(huán)視系統(tǒng)的圖像渲染能力,提升了駕駛安全性,并為車(chē)內(nèi)座艙提供了更個(gè)性化的體驗(yàn),使每輛車(chē)的座艙設(shè)計(jì)更加差異化、與眾不同。
據(jù)悉,IMG DXS GPU在多種工作負(fù)載下相較于競(jìng)爭(zhēng)對(duì)手的顯著性能優(yōu)勢(shì)。首先,在峰值性能方面,IMG DXS的表現(xiàn)達(dá)到了競(jìng)爭(zhēng)對(duì)手的四倍,這意味著在處理高強(qiáng)度任務(wù)時(shí),它能夠提供極為強(qiáng)大的處理能力。此外,在填充率為中心的圖形工作負(fù)載中,其性能可以達(dá)到競(jìng)爭(zhēng)對(duì)手的兩倍。而對(duì)于計(jì)算密集型圖形任務(wù),IMG DXS GPU的性能提升高達(dá)28%。特別是在安全關(guān)鍵的工作負(fù)載中,IMG DXS的性能還能進(jìn)一步提升,最高可達(dá)兩倍。這些表現(xiàn)凸顯了IMG DXS GPU在處理復(fù)雜圖形和計(jì)算任務(wù)時(shí)的出色能力,尤其在對(duì)安全性和性能有高要求的應(yīng)用場(chǎng)景中,優(yōu)勢(shì)更加明顯。
“首先DXS完美地匹配了今天汽車(chē)對(duì)于中央計(jì)算的要求,迎合了整車(chē)架構(gòu)正在從分布式轉(zhuǎn)向中央計(jì)算的趨勢(shì)。第二個(gè)是完美匹配今天高性能的中央計(jì)算的要求,它提供了遠(yuǎn)高于CPU的計(jì)算性能,同時(shí)提供了遠(yuǎn)遠(yuǎn)高于NPU以及這類(lèi)加速器SoC的編程靈活性?!盜magination車(chē)載GPU產(chǎn)品線(xiàn)產(chǎn)品總監(jiān)章政分享到,“而且除了性能之外,最重要的是我們推出了全新的功能安全解決方案:分布式安全機(jī)制——幾乎完全消除了以前的其他功能安全方案實(shí)現(xiàn)機(jī)制帶來(lái)的性能以及片芯面積損失?!?
創(chuàng)新的專(zhuān)利——分布式安全機(jī)制,讓ASIL-B的實(shí)現(xiàn)更為高效
正如章總強(qiáng)調(diào)的,此次IMG DXS GPU的一大創(chuàng)新就是采用了Imagination最新的專(zhuān)利技術(shù)——分布式安全機(jī)制,所以能夠在幾乎不增加核心面積的情況下,實(shí)現(xiàn)更高的安全性和性能效率,助力客戶(hù)構(gòu)建ASIL-B級(jí)別的汽車(chē)級(jí)GPU。
要實(shí)現(xiàn)ASIL-B級(jí)功能安全,傳統(tǒng)的方式有雙核鎖步(Dual-Core Lock Step)和工作負(fù)載重復(fù)(Workload Repetition)兩種。其中雙核鎖步是通過(guò)增加核心面積(面積增加至兩倍),來(lái)實(shí)現(xiàn)更高的安全性。然而,雖然面積顯著增加,性能卻沒(méi)有顯著提升。這意味著為了滿(mǎn)足安全要求,系統(tǒng)的成本會(huì)大幅上升。工作負(fù)載重復(fù)這一方法通過(guò)在相同面積上重復(fù)工作負(fù)載,來(lái)提高安全性,但結(jié)果是性能僅為標(biāo)準(zhǔn)核心的一半。這種方法雖然占用的額外資源較少,但性能損失明顯。
IMG DXS GPU則能夠在標(biāo)準(zhǔn)核心的基礎(chǔ)上,以最小的面積增加的前提下,提供與標(biāo)準(zhǔn)核心相同的性能,同時(shí)實(shí)現(xiàn)ASIL-B的安全標(biāo)準(zhǔn)。這使得它比雙核鎖步和工作負(fù)載重復(fù)更為高效,既保證了安全性,又避免了面積和性能的重大損失。
這種創(chuàng)新的技術(shù)叫做Safety Pairs,這是一種分布式功能安全機(jī)制,是Imagination的最新專(zhuān)利技術(shù),它通過(guò)利用現(xiàn)代處理器中的并行性和自然空閑時(shí)間來(lái)實(shí)現(xiàn)故障檢測(cè),且無(wú)需對(duì)工作負(fù)載或硬件進(jìn)行重復(fù)處理,從而減少了開(kāi)銷(xiāo)。
如下圖展示了處理器在不同時(shí)間段的運(yùn)行狀態(tài),其中每個(gè)條形代表了處理器的任務(wù)執(zhí)行情況和空閑狀態(tài)。黃色部分標(biāo)記為“IDLE”(空閑),表示處理器的自然空閑時(shí)間,而紫色和紅色部分表示不同的任務(wù)執(zhí)行時(shí)間。通過(guò)在這些空閑時(shí)間運(yùn)行測(cè)試向量來(lái)檢測(cè)潛在故障,Safety Pairs能夠在不增加硅片或工作負(fù)載的前提下,實(shí)現(xiàn)故障檢測(cè)功能。
這個(gè)技術(shù)的優(yōu)點(diǎn)在于它避免了傳統(tǒng)方法中需要通過(guò)重復(fù)執(zhí)行工作負(fù)載或增加處理單元來(lái)實(shí)現(xiàn)安全檢測(cè)的做法,從而提高了系統(tǒng)的效率和資源利用率。簡(jiǎn)言之,Safety Pairs使得IMG DXS GPU能夠以更少的硬件和資源開(kāi)銷(xiāo),確保系統(tǒng)的安全性和可靠性,滿(mǎn)足汽車(chē)行業(yè)的功能安全要求(如ASIL-B標(biāo)準(zhǔn))。
“為什么功能安全在車(chē)這一塊很難推廣起來(lái)?主要是因?yàn)槌杀荆驗(yàn)樾酒娣e增加一倍或者是性能降低為二分之一,對(duì)于廠商來(lái)說(shuō)它的成本也就增加了一倍。這個(gè)增加一倍的成本,最后都要轉(zhuǎn)化到消費(fèi)者頭上去,那這個(gè)價(jià)格就要增加一倍。過(guò)去沒(méi)有太多客戶(hù)愿意為這個(gè)東西買(mǎi)單,所以一直推不起來(lái)?!闭抡忉尩?,“Imagination作為一個(gè)傳統(tǒng)的GPU玩家,我們對(duì)GPU非常了解,我們對(duì)GPU怎么運(yùn)行是非常清楚的。所以我們利用了GPU的一些特性來(lái)非常靈活地實(shí)現(xiàn)了功能安全機(jī)制?!?
整體而言,DSM(Distributed Safety Mechanism-分布式安全機(jī)制)是一種分布式架構(gòu),通過(guò)持續(xù)發(fā)送微小的測(cè)試向量來(lái)確保各子組件的正確性與穩(wěn)定性。該機(jī)制不僅適用于車(chē)載電子系統(tǒng),還能夠滿(mǎn)足航空、醫(yī)療、工業(yè)等多個(gè)具備功能安全要求的領(lǐng)域的需求。Imagination將持續(xù)優(yōu)化和發(fā)展這一機(jī)制,提升其效率,并擴(kuò)大其應(yīng)用范圍。目前,DSM已能夠輕松滿(mǎn)足ASIL-B的安全等級(jí)要求。未來(lái)還有望將進(jìn)一步提升其安全等級(jí),并在更低的資源和成本消耗下,確保更高的安全標(biāo)準(zhǔn)的實(shí)現(xiàn)。
雙速率FP16+SPU增加+軟件優(yōu)化,AI能力提升近十倍
AI的能力和圖形處理的能力是相通的,而高階自動(dòng)駕駛的實(shí)現(xiàn)又必須依賴(lài)AI能力,因此DXS GPU在AI能力上的創(chuàng)新和優(yōu)化,也是其重要的一部分。透過(guò)軟件優(yōu)化和架構(gòu)創(chuàng)新,DXS GPU也進(jìn)一步幫助開(kāi)發(fā)者更快速和高效地將AI的能力部署到汽車(chē)中。
盡管圖形處理是GPU的核心強(qiáng)項(xiàng),隨著計(jì)算任務(wù)對(duì)并行處理要求的增加,圖形處理和計(jì)算的需求變得高度一致,許多GPU廠商開(kāi)始將圖形處理硬件用于加速計(jì)算任務(wù)。這一趨勢(shì)也推動(dòng)了AI的發(fā)展,因?yàn)锳I的巨大算力需求最初就是通過(guò)GPU實(shí)現(xiàn)的,而CPU無(wú)法提供足夠的計(jì)算能力來(lái)支持AI的工作。
然而,盡管現(xiàn)代AI算法需要更高的性能,當(dāng)前的半導(dǎo)體技術(shù)仍然面臨帶寬和工藝節(jié)點(diǎn)的瓶頸,尤其是在5納米甚至更小的技術(shù)節(jié)點(diǎn)上,成本會(huì)極具上升。因此,DXS在架構(gòu)上進(jìn)行了創(chuàng)新,通過(guò)支持FP16精度的計(jì)算來(lái)滿(mǎn)足大部分AI工作負(fù)載的需求,減少了對(duì)高帶寬的依賴(lài)。FP16比FP32帶寬需求更低,通過(guò)增加雙速率的FP16單元和SPU,DXS能夠在FP16工作負(fù)載下提供三倍的算力,顯著提升了性能。
此外,為了進(jìn)一步降低帶寬需求,DXS盡可能將所有計(jì)算控制在GPU內(nèi)部,減少數(shù)據(jù)在GPU和其他模塊之間的流動(dòng),從而大幅降低系統(tǒng)的帶寬要求。DXS在1GHz主頻下,能夠在FP16半精度浮點(diǎn)計(jì)算中提供12 TFLOPS的性能,在int8計(jì)算中則可達(dá)到24 TOPS的性能,且在主頻進(jìn)一步提高到1.2GHz甚至1.5GHz時(shí),性能會(huì)進(jìn)一步提升。
另外值得關(guān)注的一點(diǎn)在于,相比于其他專(zhuān)門(mén)用于AI加速的NPU,GPU的最大優(yōu)勢(shì)在于其成熟的生態(tài)系統(tǒng),這主要得益于基于開(kāi)放標(biāo)準(zhǔn)的編程環(huán)境,如OpenCL、Vulkan和oneAPI。強(qiáng)大的生態(tài)系統(tǒng)不僅降低了研發(fā)成本,還使得客戶(hù)能夠方便地將任務(wù)從競(jìng)爭(zhēng)平臺(tái)移植到DXS上,推動(dòng)了產(chǎn)品的市場(chǎng)推廣和盈利能力。經(jīng)過(guò)多年的發(fā)展,Imagination的GPU生態(tài)系統(tǒng)已經(jīng)非常成熟,為客戶(hù)的產(chǎn)品優(yōu)化提供了極大的便利。
“整個(gè)NPU生態(tài)系統(tǒng)是四分五裂的,開(kāi)發(fā)成本非常高。根據(jù)行業(yè)內(nèi)一些反饋——一個(gè) NPU 的硬件工程師大概要搭配 10 到 20 個(gè)軟件工程師去把這個(gè) NPU 的硬件給運(yùn)行起來(lái),這個(gè)軟件的成本是非常昂貴的。而且NPU它是固化的一個(gè)東西(因?yàn)橐非笮?,編程性就非常差),但是我們看一看今?AI 才剛剛開(kāi)始新的算法,每一天都在出現(xiàn)新的架構(gòu)。沒(méi)法去預(yù)測(cè)明天會(huì)有哪個(gè)新的架構(gòu)出現(xiàn),所以今天固化的NPU架構(gòu)也無(wú)法去適配未來(lái)新的算法架構(gòu)。特別是當(dāng)NPU都追求高制程,高制程的制造成本又非常高昂。如果固化架構(gòu)的這一NPU的生命周期很短,那這筆投資基本上就是有去無(wú)回的。”章政特別解釋到,”我們看到的這個(gè)將來(lái)的趨勢(shì)是什么?將來(lái)的趨勢(shì)是在 AI 沒(méi)有完全固化之前,編程性是很重要的。可編程性,一個(gè)開(kāi)發(fā)的生態(tài)系統(tǒng)有眾多的參與者,能更好的適配新的這個(gè)方法是用新的 framework 讓這個(gè)產(chǎn)品的生命周期增長(zhǎng),能有更多的銷(xiāo)量,攤薄你研發(fā)的成本,那你這個(gè)公司的最后這個(gè)產(chǎn)品才有機(jī)會(huì)去盈利?!?
因此,DXS GPU有著天然的開(kāi)發(fā)生態(tài)優(yōu)勢(shì),而Imagination也進(jìn)一步在硬件架構(gòu)優(yōu)化創(chuàng)新的基礎(chǔ)上,提供了最新的計(jì)算庫(kù)(compute library)和工具包(Toolkit),來(lái)幫助開(kāi)發(fā)者加速關(guān)鍵的汽車(chē)應(yīng)用——特別是ADAS(高級(jí)駕駛輔助系統(tǒng))和計(jì)算機(jī)視覺(jué)相關(guān)的任務(wù)。
據(jù)悉,在一些典型的工作負(fù)載中,DXS的AI性能相比上一代產(chǎn)品提升了近十倍。前面提到雖然硬件性能僅提升約50%,但這次顯著的性能增長(zhǎng)主要?dú)w因于軟件的支持與優(yōu)化。特別是在計(jì)算庫(kù)方面,性能提升了2至4倍。優(yōu)化的計(jì)算庫(kù)不僅在帶寬使用上實(shí)現(xiàn)了顯著的節(jié)省,同時(shí)也對(duì)片上內(nèi)存進(jìn)行了有效的管理與優(yōu)化。通過(guò)盡可能將所有計(jì)算保持在片上運(yùn)行,避免了數(shù)據(jù)在不同計(jì)算單元之間的頻繁傳輸,從而降低了帶寬消耗。這一優(yōu)化措施不僅提升了系統(tǒng)效率,也顯著降低了能耗,因?yàn)閿?shù)據(jù)傳輸通常是能耗的主要來(lái)源之一。
未來(lái),隨著計(jì)算庫(kù)的不斷增強(qiáng),DXS GPU的硬件利用率將持續(xù)提升,使得更多的高級(jí)駕駛輔助系統(tǒng)(ADAS)功能能夠在GPU上實(shí)現(xiàn)。這樣DXS GPU就能夠?yàn)?a href="/tags/ADAS" target="_blank">ADAS提供更多更靈活的算法支持,從而幫助客戶(hù)的產(chǎn)品在未來(lái)具備更高的可持續(xù)性。利用強(qiáng)大的可編程性和計(jì)算能力,客戶(hù)在面對(duì)新的自動(dòng)駕駛算法或功能需求時(shí),也能夠通過(guò)開(kāi)放API快速地在DXS平臺(tái)上實(shí)現(xiàn)這些新功能,從而滿(mǎn)足市場(chǎng)多樣化需求。
靈活可拓展方案保證客戶(hù)成本效益,應(yīng)對(duì)未來(lái)增長(zhǎng)需求
最后,DXS GPU**延續(xù)了Imagination在GPU產(chǎn)品上的拓展性?xún)?yōu)勢(shì),這保證了客戶(hù)的長(zhǎng)期靈活性和成本效益,尤其是在應(yīng)對(duì)未來(lái)可能增長(zhǎng)的智能座艙和人機(jī)交互(HMI)需求時(shí)。
“雖然現(xiàn)在的需求可能不需要使用最高級(jí)別的GPU,但DXS GPU架構(gòu)設(shè)計(jì)了多種可擴(kuò)展的方案,以滿(mǎn)足未來(lái)可能出現(xiàn)的更高計(jì)算需求。例如,在未來(lái)5到10年內(nèi),如果智能座艙的屏幕數(shù)量增加,或者對(duì)HMI的要求提升,用戶(hù)可以從不同級(jí)別的DSX GPU中選擇,比如從8核心到256核心,或者選擇更高級(jí)別的MC2、MC4型號(hào)。簡(jiǎn)單來(lái)說(shuō),即便當(dāng)前你選擇的是低規(guī)格的GPU,未來(lái)仍然可以根據(jù)需求逐步升級(jí)和擴(kuò)展,保持靈活性和成本效益?!?a href="/tags/Imagination" target="_blank">Imagination 資深產(chǎn)品總監(jiān)Stephen Spain表示,“簡(jiǎn)單來(lái)說(shuō),即便當(dāng)前你選擇的是低規(guī)格的GPU,未來(lái)仍然可以根據(jù)需求逐步升級(jí)和擴(kuò)展,保持靈活性和成本效益。”