明天華為將發(fā)布達(dá)芬奇系列最強(qiáng)芯片-Asend 910
華為官網(wǎng)貼出預(yù)告,公司將于8月23日在深圳舉辦專場活動,發(fā)布Asend 910 AI處理器和MindSpore開源計(jì)算框架。此次活發(fā)布會由華為輪值董事長徐直軍主講,首席戰(zhàn)略架構(gòu)師黨文栓、芯片和硬件戰(zhàn)略Fellow艾偉、云BU EI產(chǎn)品部總經(jīng)理賈永利參與Q&A環(huán)節(jié),級別相當(dāng)高。
結(jié)合公開資料,Ascend 910應(yīng)該就是華為自研的“昇騰910”處理器,在本周一開幕的行業(yè)頂級會議HotChips上,華為曾簡要介紹了Asend 910的部分細(xì)節(jié)。
會上PPT顯示,Asend 910基于達(dá)芬奇(Da Vinci)核心架構(gòu),采用7nm增強(qiáng)版EUV工藝打造,單Die內(nèi)建32顆達(dá)芬奇核心,半精度高達(dá)256TFOPs,功耗350W。Ascend 910 的運(yùn)算密度超越了競品NVIDIA Tesla V100和谷歌TPU v3,華為還設(shè)計(jì)了擁有2048個(gè)節(jié)點(diǎn)的AI運(yùn)算服務(wù)器,整體性能多達(dá)512 Peta Flops(2048 x 256)。
另據(jù)華為官方微信,達(dá)芬奇主要由核心的3D Cube、Vector向量計(jì)算單元、Scalar標(biāo)量計(jì)算單元等組成,3D Cube針對矩陣運(yùn)算做加速,大幅提升單位功耗下的AI算力,每個(gè)AI Core可以在一個(gè)時(shí)鐘周期內(nèi)實(shí)現(xiàn)4096個(gè)MAC操作。同時(shí),Buffer L0A、L0B、L0C則用于存儲輸入矩陣和輸出矩陣數(shù)據(jù),負(fù)責(zé)向Cube計(jì)算單元輸送數(shù)據(jù)和存放計(jì)算結(jié)果。