當(dāng)前位置:首頁(yè) > 原創(chuàng) > 劉巖軒
[導(dǎo)讀]強(qiáng)化端側(cè)AI體驗(yàn),DSP需要有更高效的結(jié)構(gòu)。Cadence的DNA 100和HiFi 5分別面向視頻和語(yǔ)音識(shí)別的NN算法加速,通過(guò)稀疏計(jì)算引擎來(lái)實(shí)現(xiàn)高效高性能。

想要實(shí)現(xiàn)更有效率的人工智能體驗(yàn),很多工作都需要在設(shè)備端直接完成。在視覺(jué)識(shí)別和語(yǔ)音助手這兩大熱門應(yīng)用中,常常都會(huì)見(jiàn)到DSP的身影;而Cadece的Tensilica系列DSP產(chǎn)品,一直受到華為等諸多廠商的喜愛(ài)。近日,Cadence在北京召開(kāi)了發(fā)布會(huì),發(fā)布了全新的DNA100和HiFi5的產(chǎn)品。作為Vision系列和HiFi系列的最新產(chǎn)品,有何高明之處?Cadence公司IP事業(yè)部Tensilica資深產(chǎn)品總監(jiān)Lazaar Louis先生和IP事業(yè)部Tensilica技術(shù)營(yíng)銷總監(jiān)Yipeng Liu進(jìn)行了詳細(xì)的講解。

DNA100: 通過(guò)稀疏計(jì)算引擎實(shí)現(xiàn)高效人工智能結(jié)構(gòu)

Cadence最新發(fā)布的DNA 100是其首款神經(jīng)網(wǎng)絡(luò)加速器IP,作為端側(cè)的運(yùn)算單元,功耗仍然是客戶非常敏感的指標(biāo);從0.5到數(shù)百TMAC均可實(shí)現(xiàn)高性能和高能效。換言之,不論是電池驅(qū)動(dòng)的小型IoT設(shè)備,還是譬如手機(jī)等多核處理器中,DNA 100均可發(fā)揮巨大作用。

相較其它采用相似陣列尺寸大小的乘法累加運(yùn)輸商解決方案,DNA 100的性能提升高達(dá)4.7倍,每瓦性能提高2.3倍。據(jù)悉,這種性能提升和功耗的降低得益于其采用了稀疏計(jì)算引擎。“神經(jīng)網(wǎng)絡(luò)的特征在于權(quán)重和激活函數(shù)的固有稀疏度,加載和乘以零會(huì)早晨其它處理器不必要的MAC消耗。DNA 100移除了這兩項(xiàng)任務(wù),利用稀疏度提高能效并降低計(jì)算量。神經(jīng)網(wǎng)絡(luò)再訓(xùn)練有助于提高網(wǎng)絡(luò)的稀疏度,并通過(guò)DNA 100處理器的稀疏計(jì)算引擎實(shí)現(xiàn)最高性能。DNA 100處理器能夠利用更小的陣列實(shí)現(xiàn)最大吞吐量。作為例證,4K MAC配置環(huán)境下,ResNet 50推理性能預(yù)計(jì)能實(shí)現(xiàn)每秒高達(dá)2550幀(fps)和3.4TMAC / W(在16 nm工藝)。”

如何在資源有限的邊緣端實(shí)現(xiàn)高效AI? Cadence發(fā)布DNA 100和HiFi 5兩款全新DSP IP

稀疏計(jì)算引擎專門處理卷積階段以及完全連接的分類層的任務(wù)。 單個(gè)稀疏計(jì)算引擎可以在256,512或1024 MAC中擴(kuò)展,之后IP通過(guò)添加更多引擎進(jìn)行擴(kuò)展,上圖中可見(jiàn)最多可以達(dá)到4個(gè)引擎。 這意味著最大配置的單個(gè)DNA 100硬件塊最多包含4096個(gè)MAC。

帶寬是限制NN硬件效率的一個(gè)關(guān)鍵瓶頸,因此壓縮帶寬是實(shí)現(xiàn)最佳性能必備條件。就原始帶寬而言,DNA 100提供了從1到4 AXI 128或256位接口,這意味著在最寬的配置中,最高可達(dá)1024位總線寬度。

如何在資源有限的邊緣端實(shí)現(xiàn)高效AI? Cadence發(fā)布DNA 100和HiFi 5兩款全新DSP IP

Cadence仍然提供DNA 100和Vision Q6產(chǎn)品的耦合使用方案,可以在執(zhí)行某些特定NN運(yùn)算時(shí)實(shí)現(xiàn)更高效率。這種方案相較之前的P6+C5的方案有了很大提升,客戶也可以進(jìn)行深度的定制。

如何在資源有限的邊緣端實(shí)現(xiàn)高效AI? Cadence發(fā)布DNA 100和HiFi 5兩款全新DSP IP

在軟件方面,Cadence提供完整的軟件堆棧和神經(jīng)網(wǎng)絡(luò)編譯器,以方便客戶充分利用硬件,包括網(wǎng)絡(luò)分析儀和優(yōu)化器以及所需的設(shè)備驅(qū)動(dòng)程序。Cadence最近還宣布將支持Facebook的Glow編譯器——一種跨硬件平臺(tái)的機(jī)器學(xué)習(xí)編譯器。

HiFi5:實(shí)現(xiàn)設(shè)備端語(yǔ)音UI

隨著家庭數(shù)字語(yǔ)音助手的興起,HiFi 4得到了大量的應(yīng)用,而數(shù)字語(yǔ)音助手的下一個(gè)升級(jí)體驗(yàn)是實(shí)現(xiàn)更好的語(yǔ)音UI,這需要更好的原場(chǎng)處理算法和基于NN的語(yǔ)音識(shí)別,HiFi5將幫助客戶實(shí)現(xiàn)這一設(shè)計(jì)。重點(diǎn)仍然是,能在端側(cè)完成的 ,要實(shí)現(xiàn)快速反饋,這樣才能帶來(lái)更好的用戶體驗(yàn)。

高性能的DSP核是語(yǔ)音UI實(shí)現(xiàn)的關(guān)鍵器件,另外,還需要耕地精度的NN內(nèi)存權(quán)重,以減少內(nèi)存大小和帶寬需求;這兩個(gè)指標(biāo)在端側(cè)同樣是非常敏感的資源,如此這般才能構(gòu)建節(jié)能高效的邊緣語(yǔ)音交互設(shè)備。

如何在資源有限的邊緣端實(shí)現(xiàn)高效AI? Cadence發(fā)布DNA 100和HiFi 5兩款全新DSP IP

HiFi 5可根據(jù)其可使用的執(zhí)行單元和內(nèi)存控制器進(jìn)行配置。 為了支持波束成形等任務(wù),DSP管道能夠使用浮點(diǎn)數(shù)。而在DNN的工作任務(wù)中,DSP的管道可以由浮點(diǎn)單元轉(zhuǎn)為專注于低分辨率定點(diǎn)運(yùn)算,降低到多個(gè)8x8并行乘法;或者可以在沒(méi)有用于傳統(tǒng)音頻處理的DNN聚焦模式的情況下部署DSP。同樣的,因?yàn)椴捎昧似鋵S械南∈栌?jì)算引擎,因此可以減少零權(quán)重操作以及壓縮帶寬,從而實(shí)現(xiàn)更高效能。此特性已經(jīng)在DNA 100的介紹中提及,此處不再贅述。

如何在資源有限的邊緣端實(shí)現(xiàn)高效AI? Cadence發(fā)布DNA 100和HiFi 5兩款全新DSP IP

作為HiFi 4的升級(jí)產(chǎn)品,HiFi 5的預(yù)處理和后處理的MAC性能提高2倍;神經(jīng)網(wǎng)絡(luò)處理MAC性能提高4倍;而且提供專門優(yōu)化的函數(shù)庫(kù),可以與主流機(jī)器學(xué)習(xí)框架集成;兼容HiFi產(chǎn)品線300多個(gè)語(yǔ)音增強(qiáng)軟件包。

據(jù)悉,首批客戶之一是Ambiq Micro,想必大家并不陌生,這是一家專門構(gòu)建電池驅(qū)動(dòng)音頻控制器的廠商。

 

未來(lái)端側(cè)的高性能推理的工作將越來(lái)越多,比如汽車的自動(dòng)駕駛、語(yǔ)音UI、物聯(lián)網(wǎng)邊緣的AI處理以及手機(jī)AI強(qiáng)化。如何在有限的資源條件下,實(shí)現(xiàn)實(shí)時(shí)高效的AI處理,這是端側(cè)需要解決的問(wèn)題。而這一問(wèn)題的解決,Cadence的DNA 100和HiFi 5無(wú)疑都是最佳助手。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉