華為將發(fā)布Ascend 910 AI處理器,基于達芬奇架構(gòu)
華為官網(wǎng)貼出預(yù)告,公司將于8月23日在深圳舉辦專場活動,發(fā)布Asend 910 AI處理器和MindSpore開源計算框架。此次活發(fā)布會由華為輪值董事長徐直軍主講,首席戰(zhàn)略架構(gòu)師黨文栓、芯片和硬件戰(zhàn)略Fellow艾偉、云BU EI產(chǎn)品部總經(jīng)理賈永利參與Q&A環(huán)節(jié),級別相當(dāng)高。
結(jié)合公開資料,Ascend 910應(yīng)該就是華為自研的“昇騰910”處理器,在本周一開幕的行業(yè)頂級會議HotChips上,華為曾簡要介紹了Asend 910的部分細節(jié)。
會上PPT顯示,Asend 910基于達芬奇(Da Vinci)核心架構(gòu),采用7nm增強版EUV工藝打造,單Die內(nèi)建32顆達芬奇核心,半精度高達256TFOPs,功耗350W。Ascend 910的運算密度超越了競品NVIDIA Tesla V100和谷歌TPU v3,華為還設(shè)計了擁有2048個節(jié)點的AI運算服務(wù)器,整體性能多達512 Peta Flops(2048 x 256)。
另據(jù)華為官方微信,達芬奇主要由核心的3D Cube、Vector向量計算單元、Scalar標(biāo)量計算單元等組成,3D Cube針對矩陣運算做加速,大幅提升單位功耗下的AI算力,每個AI Core可以在一個時鐘周期內(nèi)實現(xiàn)4096個MAC操作。同時,Buffer L0A、L0B、L0C則用于存儲輸入矩陣和輸出矩陣數(shù)據(jù),負責(zé)向Cube計算單元輸送數(shù)據(jù)和存放計算結(jié)果。