CEVA-X4大曝光,零距離深度探究人工智能
無論是 《機械公敵》 里的終極大BOSS還是POI的the machine,無論是深藍還是alpha Go,從影視作品到現(xiàn)實產(chǎn)物人工智能都是以極其龐大的“身形”示于世人。CEVA推出的新型CEVA-X4 DSP首度把深層神經(jīng)網(wǎng)絡引入嵌入式系統(tǒng),將人工智能“裝進”了移動設備,讓AI成為每個人都能“玩得起”黑科技。CEVA-X4大曝光,零距離深度探究人工智能。
而要想讓AI真正住進移動設備,我們還要了解當下移動設備還有哪些難題需要現(xiàn)代科技去克服。在基帶方面面所臨著得三大挑戰(zhàn),首先是需要調(diào)制解調(diào)器PHY來實時調(diào)度加速器,處理器和協(xié)處理器之間的工作,要求PHY組件在不增加的情況下能夠?qū)崿F(xiàn)超低延遲的響應;其次是需要提高處理復雜聲音的性能,這要求VoLTE(EVS)的復雜性相較于傳統(tǒng)的編解碼器要增加4-5倍,與AMR相比內(nèi)存要增加10倍;當然,要將大量高精度的工作用于移動設備,超低能耗調(diào)制解調(diào)器的設計始終是個不可回避的難題,這要求調(diào)制解調(diào)器空閑階段需要特殊掉電模式,要在提高工作復雜性的情況下保證電池壽命。
CEVA-X4是全球首款針對LTE-Advanced的Pro和5G調(diào)制解調(diào)器的多RAT PHY控制IP處理器。在PHY控制上結(jié)合了控制平面處理與先進的DSP功能,可擴展的VLIW/ SIMD架構(gòu)可以支持定點運算和浮點運算。
(CEVA-X4基帶設計簡圖)
總結(jié)起來與前代相比,三大支柱擎起了新款CEVA-X4:
強大的DSP處理:每秒160億次運算(GOPS)的計算能力顯著提高了DSP性能,兩倍于前代產(chǎn)品提高2倍超高性能能夠支持LTE工作負荷。新的DSP架構(gòu)充分考慮了控制流程處理和數(shù)字信號處理的需求,可用于高端智能手機、機器通信和無線連接芯片設計。
高效控制能力:4.0CoreMark/ MHz的CUP性能效率,將控制能力提高3倍。128位寬 VLIW/SIMD處理器在4個相同的標量處理單元(SPU)中具有8個MAC,并有10段流水線,且采用16nm工藝以1.5GHz運行。
先進的系統(tǒng)控制:CEVA-X4采用智能調(diào)度系統(tǒng)實現(xiàn)高QoS和低延遲,與前代產(chǎn)品相比,減少了50%的功耗。
(一張圖看懂CEVA-X4卓越性能)
除了基帶設計的難題,讓我們再聊聊人工智能都需要什么?那當然是一個智慧的大腦啊!大腦上什么最重要?當然是神經(jīng)網(wǎng)絡啊!而在這樣一顆具有智慧的人造大腦上制造深層神經(jīng)網(wǎng)絡就要靠這顆神秘XM4的來實現(xiàn)了。
(深層神經(jīng)網(wǎng)絡工作機制)
CEVA在嵌入式平臺上運行AlexNet進行實時演示,這是業(yè)界首款嵌入式CNN演示。深層神經(jīng)網(wǎng)絡AlexNet作為世界上最廣泛的網(wǎng)絡基準,CEVA結(jié)合了CDNN展示了AlexNet可在XM4上運行的可操作性。
(CEVA-XM4與PC端對比圖)
從上圖看出,CEVA-XM4成像和視覺DSP結(jié)合在移動設備上的功耗與PC端的功耗相比并沒有很大的差別。CEVA-XM4可以在一定程度上實現(xiàn)將人工智能搬運到移動設備上的設想。“計算機視覺研究人員采用了NVIDIA的CUDA并行計算平臺上開發(fā)了相同的卷積神經(jīng)網(wǎng)絡(CNN)對象的識別模型”,CEVA市場營銷及企業(yè)發(fā)展副總裁Eran Briman表示:“CEVA-XM4可以比其他任何授權的VPU相比能夠提供更多的整數(shù)運算性能。CEVA VPU憑借其更深的14級流水線的,更寬的4096位VLIW架構(gòu),和64位數(shù)據(jù)類型的支持,這減輕了在CNN的飽和問題。”
(CEVA市場營銷及企業(yè)發(fā)展副總裁Eran Briman)
目前,CEVA已經(jīng)與展訊展開長期合作為LTE系統(tǒng)級芯片瞄準中高端智能手機,CEVA成像和視覺DSP移動設備同樣也受到眾多手機廠商的青睞并與之展開合作。人工智能到底什么時候能夠真正實現(xiàn)我們并不知道,但是我們在探索的路上已經(jīng)做出了充分的準備。