伴隨著深度神經(jīng)網(wǎng)絡(luò)技術(shù)的發(fā)展,高階自動駕駛算法正從傳統(tǒng)2D感知向更先進的3D感知范式加速轉(zhuǎn)變,這在為智能駕駛落地應(yīng)用提供更多可能性的同時,也對實際開發(fā)效率提出了更高的挑戰(zhàn)。在這個“快魚吃慢魚”的時代,“效率”已然成為產(chǎn)業(yè)玩家決勝智能駕駛“世界杯”的關(guān)鍵。搶灘智能駕駛技術(shù)高地,需要比快再快一點。
為了幫助產(chǎn)業(yè)開發(fā)者更高效地完成基于征程®系列芯片的性能驗證與開發(fā)部署,地平線面向智能汽車產(chǎn)業(yè)客戶與生態(tài)伙伴提供了參考算法開發(fā)加速包,避免對于典型任務(wù)的“重復(fù)造輪”,大幅降低算法開發(fā)門檻,加速產(chǎn)品原型的開發(fā)與迭代,實現(xiàn)計算與效率的并進“狂飆”。
軟硬協(xié)同優(yōu)化,發(fā)揮極致計算性能
地平線作為最懂芯片的軟件公司和最懂軟件的芯片公司,始終踐行“軟硬結(jié)合”的技術(shù)理念,依托征程®系列芯片平臺打造的地平線天工開物®芯片工具鏈,能夠讓算法充分受益軟硬結(jié)合所帶來的極致性能表現(xiàn)。
天工開物提供了算法開發(fā)全生命周期內(nèi)所需的完善軟件工具,能夠滿足模型量化、優(yōu)化、編譯、仿真、部署、調(diào)試等各個開發(fā)環(huán)節(jié)的需要。特別是在模型量化方面,提供量化感知訓(xùn)練(QAT)和訓(xùn)練后量化(PTQ)兩類方式,可有效縮減模型大小,加速深度學(xué)習(xí)推理效率。同時,地平線在工具鏈基礎(chǔ)之上,進一步提供了豐富的參考算法,全面滿足開發(fā)者對計算性能與開發(fā)效率的要求與期待。
降低軟件開發(fā)門檻,靈活滿足多樣化開發(fā)需求
目前,地平線芯片工具鏈已積累近200家客戶與生態(tài)伙伴的應(yīng)用實踐經(jīng)驗,研發(fā)水平各異的開發(fā)團隊均能借助這一“得力武器”顯著提升開發(fā)效率。經(jīng)統(tǒng)計,通過天工開物芯片工具鏈在征程與旭日芯片上進行算法部署的用戶,模型首次遷移成功率超過80%,性能和精度水平都能夠充分滿足業(yè)務(wù)預(yù)期。
豐富參考算法,滿足差異化開發(fā)需求
智能駕駛算法工程師在開發(fā)部署中主要涉及兩類典型訴求,一方面是期待快速了解某個典型模型在征程芯片上的性能表現(xiàn),另一方面則希望針對具體場景任務(wù),高效完成在征程芯片上的部署調(diào)優(yōu)。針對前者,地平線提供了豐富基礎(chǔ)算法與相應(yīng)的benchmark;對于后者,則提供一系列經(jīng)過充分調(diào)優(yōu)的場景參考算法。
基礎(chǔ)參考算法
通過對智能駕駛算法演進與漸進式落地的持續(xù)探索,地平線構(gòu)建了包含數(shù)百款算法模型的benchmark驗證庫,用于驗證芯片工具鏈對于各類算法的廣泛適用性,地平線還進一步篩選典型模型作為基礎(chǔ)示例,幫助開發(fā)者快速開展benchmark性能評測,其中既包含產(chǎn)業(yè)普遍關(guān)注的常見模型,也包含了地平線推薦的基礎(chǔ)模型。值得一提的是,為響應(yīng)高階智能駕駛開發(fā)需求,地平線還基于公版Transformer結(jié)構(gòu)開發(fā)了適配于征程5的Swin-Transformer,能夠高效支持SW-MSA和W-MSA結(jié)構(gòu),該模型在征程5芯片上的性能與端側(cè)最強GPU上的部署性能相當(dāng)。
除了基于公版改進的基礎(chǔ)示例模型,地平線還開發(fā)提供了包含MixVarGENet在內(nèi),更為高效的自研模型。這類模型結(jié)構(gòu)能夠充分發(fā)揮征程5的算力優(yōu)勢,顯著提升網(wǎng)絡(luò)性能、減少訪存時間。用戶通過自由選用征程芯片高效支持的基礎(chǔ)模型,在保證運行效率和任務(wù)表現(xiàn)的前提下,輕松實現(xiàn)自有算法的快速遷移與二次開發(fā)。
征程5在一些典型模型下的精度與性能表現(xiàn)
駕駛場景參考算法
智能駕駛嵌入式算法開發(fā)周期長、投入大、門檻高,benchmark能夠幫助開發(fā)者快速了解典型模型在征程芯片上的性能表現(xiàn),而在面向?qū)嶋H業(yè)務(wù)場景的開發(fā)過程中,工程師依然要在場景算法的設(shè)計與調(diào)優(yōu)上花費不少精力。
面對此類挑戰(zhàn),地平線提煉了智能駕駛場景下的各類典型難題,并基于公開數(shù)據(jù)集提供了一系列經(jīng)過充分優(yōu)化的場景參考算法,當(dāng)前已覆蓋目標檢測、光流預(yù)測、語義分割、車道線檢測等常見自動駕駛?cè)蝿?wù),還提供支持攝像頭與激光雷達等多類傳感器的感知模型,面向高階智能駕駛應(yīng)用,地平線還提供支持Transformer、BEV等當(dāng)下主流算法的先進模型示例,助力客戶與生態(tài)伙伴快速布局高階智能駕駛業(yè)務(wù)。
基于征程5的純視覺BEV感知原型
2D場景參考算法
地平線參考算法開放提供面向多種感知任務(wù)的2D場景模型,例如征程3、征程5芯片均可支持基于anchor-free實現(xiàn)的2D檢測模型FCOS,同時開放提供包括U-Net、DeepLab等極具代表性的語義分割模型,以及GANet車道線檢測、PWCNet光流預(yù)測等多類示例模型。
3D感知參考算法
在高階自動駕駛感知算法中,3D感知勢如破竹,成為主流技術(shù)應(yīng)用方案。對此,地平線參考算法集成了基于Transformer的純視覺BEV模型、基于雷達點云的3D檢測模型以及單目3D目標檢測算法。
BEV算法能夠從高處統(tǒng)觀全局提供“上帝視角”,地平線所提供的BEV感知模型集成了目標檢測和語義分割多重任務(wù),可開放支持包括IPM、Transformer、LSS等多種轉(zhuǎn)換方式,并在IPM基礎(chǔ)上提供融合時序特征的bev_ ipm_temporal模型;基于Transformer大模型,更開放提供包括DETR 3D、GKT、PETR在內(nèi)的多類感知示例。
在純視覺模型外,地平線針對基于激光雷達點云的3D檢測,還提供了備受業(yè)界關(guān)注的PointPillars參考算法。通過對voxel-based模型中的復(fù)雜前處理進行針對性編譯優(yōu)化,該模型目前能在保證性能的情況下顯著降低延時,讓開發(fā)體驗更加絲滑。
同時,地平線在FCOS 2D的基礎(chǔ)上進一步提供FCOS 3D目標檢測算法。通過使用征程5支持的高效模型結(jié)構(gòu)efficientnet-b0替換backbone后,目前該示例模型性能可達雙核502FPS,精度表現(xiàn)更具優(yōu)勢。
目前,地平線工具鏈與系列參考算法已上線「 HYPERLINK "https://developer.horizon.ai/" \h 」,用戶可便捷了解相關(guān)技術(shù)文檔資料或獲取軟硬件開發(fā)套件。未來,地平線還將面向關(guān)鍵點檢測、地圖定位、多目標跟蹤、軌跡預(yù)測、深度估計、視覺3D等更多場景算法,不斷推動參考算法的研發(fā)擴展和升級迭代,讓智能駕駛算法的開發(fā)部署不再艱難,讓開發(fā)者收獲遠超預(yù)期的開發(fā)體驗。
堅守Tier2定位,打造更開放的智能計算平臺
在參考算法這一開發(fā)加速包以外,地平線基于軟硬結(jié)合的前瞻技術(shù)理念,以“芯片+軟件開發(fā)平臺”為核心,已搭建起開放、成熟的智能計算開放平臺。地平線通過持續(xù)提供高效能的征程系列芯片和配套完善的開發(fā)工具,全力支持客戶與生態(tài)伙伴產(chǎn)品創(chuàng)新,為產(chǎn)業(yè)差異化需求提供最優(yōu)解,助力中國智能汽車產(chǎn)業(yè)引領(lǐng)全球發(fā)展。