Cadence推出全新Tensilica DNA 100處理器IP,為設(shè)備端AI應(yīng)用提供業(yè)界領(lǐng)先的性能和能效
DNA 100處理器適用于汽車、監(jiān)控、機(jī)器人、無人機(jī)、AR / VR、智能手機(jī)、智能家居和物聯(lián)網(wǎng)產(chǎn)品的神經(jīng)網(wǎng)絡(luò)推理,可輕松從0.5擴(kuò)展至100TMAC
楷登電子(美國(guó) Cadence公司)近日推出Cadence® Tensilica® DNA100處理器IP,首款深度神經(jīng)網(wǎng)絡(luò)加速器(DNA)AI處理器IP,無論小至0.5 還是大到數(shù)百TeraMAC(TMAC),均可實(shí)現(xiàn)高性能和高能效。DNA 100處理器非常適用于自動(dòng)駕駛汽車(AV)、ADAS、監(jiān)視、機(jī)器人、無人機(jī)、增強(qiáng)現(xiàn)實(shí)(AR)/虛擬現(xiàn)實(shí)(VR)、智能手機(jī)、智能家居和物聯(lián)網(wǎng)領(lǐng)域的設(shè)備端神經(jīng)網(wǎng)絡(luò)推理應(yīng)用。較其他采用相似陣列尺寸大小的乘法累加運(yùn)算(MAC)解決方案,DNA 100處理器性能提升達(dá) 4.7倍,每瓦特性能提升高達(dá)2.3倍。
神經(jīng)網(wǎng)絡(luò)的特征在于權(quán)重和激活函數(shù)的固有稀疏度,加載和乘以零會(huì)造成其他處理器不必要的MAC消耗。DNA 100處理器的專屬硬件計(jì)算引擎移除了上述兩項(xiàng)任務(wù),利用稀疏度提高能效并降低計(jì)算量。神經(jīng)網(wǎng)絡(luò)再訓(xùn)練有助于提高網(wǎng)絡(luò)的稀疏度,并通過DNA 100處理器的稀疏計(jì)算引擎實(shí)現(xiàn)最高性能。DNA 100處理器能夠利用更小的陣列實(shí)現(xiàn)最大吞吐量。作為例證,4K MAC配置環(huán)境下,ResNet 50推理性能預(yù)計(jì)能實(shí)現(xiàn)每秒高達(dá)2550幀(fps)和3.4TMAC / W(在16 nm工藝)。
“人工智能處理器的應(yīng)用發(fā)展迅速,但是運(yùn)行最新的神經(jīng)網(wǎng)絡(luò)模型會(huì)使功耗預(yù)算嚴(yán)重縮緊。”Linley Group資深分析師Mike Demler說道。“滿足從小型電池供電的物聯(lián)網(wǎng)傳感器到自動(dòng)駕駛汽車等設(shè)備的人工智能功能需求,需要更高效的架構(gòu)。Cadence全新Tensilica DNA 100處理器采用的創(chuàng)新稀疏計(jì)算引擎解決了這些局限性,在任何功耗預(yù)算下均能提供優(yōu)秀性能。”
DNA 100處理器配備完整的AI軟件平臺(tái),兼容最新版本的Tensilica神經(jīng)網(wǎng)絡(luò)編譯器(Tensilica Neural Network Compiler),支持Caffe、TensorFlow、TensorFlow Lite及包括卷積和循環(huán)網(wǎng)絡(luò)在內(nèi)的廣泛神經(jīng)網(wǎng)絡(luò)等高級(jí)AI框架。因此,DNA 100處理器是視覺、語音、雷達(dá)、激光雷達(dá)和通信應(yīng)用設(shè)備端推理的理想之選。 Tensilica神經(jīng)網(wǎng)絡(luò)編譯器利用全面優(yōu)化的神經(jīng)網(wǎng)絡(luò)庫(kù)函數(shù),將任意神經(jīng)網(wǎng)絡(luò)映射為可執(zhí)行且高度優(yōu)化的高性能代碼。因此,DNA 100處理器為不同網(wǎng)絡(luò)類型提供了強(qiáng)大的軟件生態(tài)系統(tǒng)支持,包括分類、對(duì)象檢測(cè)、分割、重復(fù)和回歸。 DNA 100處理器還支持安卓神經(jīng)網(wǎng)絡(luò)(ANN)API,可用于安卓設(shè)備端的AI推理。
DNA 100處理器可以在所有神經(jīng)網(wǎng)絡(luò)層運(yùn)行,包括卷積、完全連接、LSTM、LRN和池化。單個(gè)DNA 100處理器可以輕松從0.5擴(kuò)展到12有效TMAC;并可以通過堆疊多個(gè)DNA 100處理器,實(shí)現(xiàn)數(shù)百TMAC,適用于最計(jì)算密集型設(shè)備端的神經(jīng)網(wǎng)絡(luò)應(yīng)用。 DNA 100處理器還集成了Tensilica DSP,以適應(yīng)DNA 100處理器內(nèi)部硬件引擎當(dāng)前不支持的新神經(jīng)網(wǎng)絡(luò)層;同時(shí)使用Tensilica指令擴(kuò)展(TIE)指令集實(shí)現(xiàn)Tensilica Xtensa核心的可擴(kuò)展性和可編程性。由于DNA 100處理器擁有獨(dú)立的直接存儲(chǔ)器訪問(DMA),因此無需新增控制器即可運(yùn)行其他控制代碼。
“我們客戶的神經(jīng)網(wǎng)絡(luò)推理需求涉及不同量級(jí)的人工智能處理和多種神經(jīng)網(wǎng)絡(luò)類型。他們需要一種可擴(kuò)展的架構(gòu),無論在低端物聯(lián)網(wǎng)應(yīng)用,還是在汽車應(yīng)用,都具備同樣有效,做到這一點(diǎn)需要數(shù)十甚至數(shù)百TMAC,”Cadence Tensilica IP產(chǎn)品管理和營(yíng)銷高級(jí)總監(jiān)Lazaar Louis表示。 “憑借DNA 100處理器、完整的AI軟件平臺(tái)、以及強(qiáng)大的合作伙伴生態(tài)系統(tǒng),我們的客戶可以設(shè)計(jì)出設(shè)備端AI推理所需的高性能和高能效產(chǎn)品。”
DNA 100處理器將于2018年12月面向部分客戶出售,預(yù)計(jì)于2019年第一季度全面上市。