Cadence全新Tensilica Vision Q6 DSP IP助力提升視覺與AI性能
楷登電子(美國Cadence公司)今日正式推出Cadence® Tensilica® Vision Q6 DSP。該DSP基于速度更快的新處理器架構(gòu),面向嵌入式視覺和AI技術(shù)量身打造。第五代Vision Q6 DSP的視覺和AI性能較上一代Vision P6 DSP提高達(dá)1.5倍,峰值性能下的功耗效率提高1.25倍。Vision Q6 DSP為智能手機(jī)、監(jiān)控?cái)z像頭、汽車、增強(qiáng)現(xiàn)實(shí)(AR)/虛擬現(xiàn)實(shí)(VR)、無人機(jī)和機(jī)器人領(lǐng)域的嵌入式視覺與AI應(yīng)用量身打造。
Vision Q6 DSP采用更深層的13級流水線和面向大容量本地內(nèi)存的系統(tǒng)架構(gòu),16nm工藝下可實(shí)現(xiàn)1.5GHz峰值頻率和1GHz標(biāo)準(zhǔn)頻率,且版圖面積與Vision P6 DSP相當(dāng)。憑借Vision Q6 DSP,設(shè)計(jì)師可以開發(fā)高性能產(chǎn)品,滿足不斷提高的視覺、AI算力及低功耗的需求。
Vision Q6 DSP的新功能和優(yōu)勢
· 專為Optical Flow、Transpose和warpAffine等嵌入式視覺應(yīng)用和內(nèi)核,以及Median和Sobel等過濾器開發(fā)的增強(qiáng)DSP指令集,指令周期較Vision P6 DSP減少20%
· 為了更好地應(yīng)對視覺及AI應(yīng)用對存儲的帶寬的高需求,VQ6 提供了獨(dú)立的數(shù)據(jù)/指令A(yù)XI master/slave 總線接口以及DMA多通道,從而達(dá)到2倍于VP6的總線帶寬同時(shí)也減少了任務(wù)切換的延遲及DMA配置的開銷向后兼容Vision P6 DSP,用戶的軟件投資無需付諸東流,實(shí)現(xiàn)便捷遷移
· 可選向量浮點(diǎn)單元(VFPU)和支持半精度格式(FP16)
“Cadence Vision P5和P6 DSP受到廣泛的業(yè)界關(guān)注,并已經(jīng)設(shè)計(jì)集成在眾多領(lǐng)先供應(yīng)商開發(fā)的多代移動(dòng)應(yīng)用處理器上”,林利集團(tuán)高級分析師 Mike Demler表示。“包括視頻捕捉幀率的實(shí)時(shí)特效等創(chuàng)新用戶體驗(yàn)不斷涌現(xiàn),SoC供應(yīng)商已經(jīng)看到了快速增長的視覺和AI處理需求。Q6在P6的基礎(chǔ)上實(shí)現(xiàn)了顯著的性能躍升,同時(shí)保留了開發(fā)者所需的強(qiáng)大編程能力,以支持迅猛發(fā)展的神經(jīng)網(wǎng)絡(luò)架構(gòu)。對于希望擁有同時(shí)設(shè)計(jì)視覺和AI處理靈活度的SoC供應(yīng)商而言,這是極具吸引力的價(jià)值定位。”
Vision Q6 DSP支持在Caffe、TensorFlow和TensorFlowLite框架上使用Tensilica Xtensa®神經(jīng)網(wǎng)絡(luò)編譯器(XNNC)開發(fā)的AI應(yīng)用。憑借完整的優(yōu)化神經(jīng)網(wǎng)絡(luò)庫功能,XNNC將神經(jīng)網(wǎng)絡(luò)映射為針對Vision Q6 DSP的、可執(zhí)行且經(jīng)過高度優(yōu)化的高性能代碼。Vision Q6 DSP同時(shí)支持安卓神經(jīng)網(wǎng)絡(luò)(ANN)API,實(shí)現(xiàn)安卓設(shè)備的AI本地加速。其軟件環(huán)境也十分強(qiáng)大,為超過1500種基于OpenCV的視覺功能和OpenVX庫功能提供全面優(yōu)化的支持,助力用戶實(shí)現(xiàn)已有視覺應(yīng)用的快速、高層遷移。
“我們在AI和視覺應(yīng)用領(lǐng)域與Cadence緊密合作。寬向量SMID處理、VLIW指令、多種8位與16位MAC、以及“scatter/gather ”內(nèi)斂指令功能等特性讓Vision DSP成為高要求神經(jīng)網(wǎng)絡(luò)與視覺算法開發(fā)的理想平臺,” ArcSoft市場營銷副總裁Frison Xu表示。“許多移動(dòng)設(shè)備、汽車、監(jiān)控?cái)z像頭、AR/VR等終端應(yīng)用的開發(fā)商皆采用了Cadence Vision DSP,十分有利于我們軟件的部署和推廣。”
“作為寶貴的合作伙伴,Cadence為我們的高級3D捕捉和SLAM技術(shù)提供了高性能、低功耗的運(yùn)算環(huán)境,” VanGogh Imaging首席執(zhí)行官Ken Lee表示。“Tensilica Vision DSP的性能屬性、高度可調(diào)的視覺庫和穩(wěn)健的開發(fā)環(huán)境,幫助我們以極低的功耗實(shí)現(xiàn)算法執(zhí)行,并縮短研發(fā)周期。”
Vision P6 DSP取得了巨大成功,它曾被用于包括海思麒麟970在內(nèi)的頂尖移動(dòng)應(yīng)用處理器;而Vision Q6 DSP在此基礎(chǔ)上更進(jìn)一步。Vision P6 DSP和Vision Q6 DSP都是針對性能要求為200 – 400 GMAC/秒的通用型嵌入式視覺和機(jī)載AI應(yīng)用所設(shè)計(jì)的。峰值性能可達(dá)384 GMAC/秒的Vision Q6 DSP是高性能系統(tǒng)與應(yīng)用的不二之選。對于性能要求高于384 GMAC/秒的AI應(yīng)用,用戶還能將Vision Q6 DSP和Vision C5 DSP搭配使用。
“復(fù)雜AI和嵌入式視覺應(yīng)用越來越多被用于本地設(shè)備而非云端,功耗和性能指標(biāo)也更為重要,”Cadence Tensilica IP 產(chǎn)品管理與市場高級總監(jiān)Lazaar Louis表示。“Vision Q6 DSP是面向下一代處理器架構(gòu)的首款DSP,無論是性能還是能效比都優(yōu)于Vision P6 DSP。Cadence致力于向客戶提供高性能、低功耗的DSP解決方案,包括便于實(shí)現(xiàn)、可獲得廣泛支持的、AI和視覺應(yīng)用開發(fā)所需的軟件和工具。”
部分客戶已經(jīng)開始在產(chǎn)品中集成Vision Q6 DSP,現(xiàn)向所有用戶開放。