達(dá)芬奇架構(gòu)最強(qiáng)芯,華為Ascend 910 AI處理器即將問市
據(jù)華為官網(wǎng)消息,華為將于8月23日在在深圳舉辦Ascend 910 AI處理器和MindSpore開源計(jì)算框架發(fā)布會(huì)。華為表示,將在明日的發(fā)布會(huì)上推出業(yè)界迄今為止性能最快的AI處理器及全場(chǎng)景的AI計(jì)算框架。
華為官方也公布,此次發(fā)布會(huì)將由華為輪值董事長(zhǎng)徐直軍發(fā)布Ascend 910 AI處理器和MindSpore計(jì)算框架。華為輪值董事長(zhǎng)徐直軍、首席戰(zhàn)略架構(gòu)師黨文栓、芯片和硬件戰(zhàn)略Fellow艾偉、云BU EI產(chǎn)品部總經(jīng)理賈永利參與問答環(huán)節(jié)。
早于2018年10月在華為全鏈接大會(huì)上,華為輪值董事長(zhǎng)徐直軍首次闡述了AI戰(zhàn)略,并正式公布了昇騰910和昇騰310兩款A(yù)I芯片。徐直軍表示,昇騰910是當(dāng)時(shí)單芯片計(jì)算密度最大的芯片。
據(jù)快科技報(bào)道,在本周一開幕的行業(yè)頂級(jí)會(huì)議HotChips上,華為曾簡(jiǎn)要介紹了Asend 910的部分細(xì)節(jié)。
會(huì)上PPT顯示,Asend 910基于達(dá)芬奇(Da Vinci)核心架構(gòu),采用7nm增強(qiáng)版EUV工藝打造,單Die內(nèi)建32顆達(dá)芬奇核心,半精度高達(dá)256TFOPs,功耗350W。Ascend 910 的運(yùn)算密度超越了競(jìng)品NVIDIA Tesla V100和谷歌TPU v3,華為還設(shè)計(jì)了擁有2048個(gè)節(jié)點(diǎn)的AI運(yùn)算服務(wù)器,整體性能多達(dá)512 Peta Flops(2048 x 256)。
另據(jù)華為官方微信信息,達(dá)芬奇主要由核心的3D Cube、Vector向量計(jì)算單元、Scalar標(biāo)量計(jì)算單元等組成,3D Cube針對(duì)矩陣運(yùn)算做加速,大幅提升單位功耗下的AI算力,每個(gè)AI Core可以在一個(gè)時(shí)鐘周期內(nèi)實(shí)現(xiàn)4096個(gè)MAC操作。同時(shí),Buffer L0A、L0B、L0C則用于存儲(chǔ)輸入矩陣和輸出矩陣數(shù)據(jù),負(fù)責(zé)向Cube計(jì)算單元輸送數(shù)據(jù)和存放計(jì)算結(jié)果。