據(jù)華為官網(wǎng)消息,華為將于8月23日在在深圳舉辦Ascend 910 AI處理器和MindSpore開源計算框架發(fā)布會。華為表示,將在明日的發(fā)布會上推出業(yè)界迄今為止性能最快的AI處理器及全場景的AI計算框架。
華為官方也公布,此次發(fā)布會將由華為輪值董事長徐直軍發(fā)布Ascend 910 AI處理器和MindSpore計算框架。華為輪值董事長徐直軍、首席戰(zhàn)略架構(gòu)師黨文栓、芯片和硬件戰(zhàn)略Fellow艾偉、云BU EI產(chǎn)品部總經(jīng)理賈永利參與問答環(huán)節(jié)。
早于2018年10月在華為全鏈接大會上,華為輪值董事長徐直軍首次闡述了AI戰(zhàn)略,并正式公布了昇騰910和昇騰310兩款AI芯片。徐直軍表示,昇騰910是當時單芯片計算密度最大的芯片。
據(jù)快科技報道,在本周一開幕的行業(yè)頂級會議HotChips上,華為曾簡要介紹了Asend 910的部分細節(jié)。
會上PPT顯示,Asend 910基于達芬奇(Da Vinci)核心架構(gòu),采用7nm增強版EUV工藝打造,單Die內(nèi)建32顆達芬奇核心,半精度高達256TFOPs,功耗350W。Ascend 910 的運算密度超越了競品NVIDIA Tesla V100和谷歌TPU v3,華為還設計了擁有2048個節(jié)點的AI運算服務器,整體性能多達512 Peta Flops(2048 x 256)。
另據(jù)華為官方微信信息,達芬奇主要由核心的3D Cube、Vector向量計算單元、Scalar標量計算單元等組成,3D Cube針對矩陣運算做加速,大幅提升單位功耗下的AI算力,每個AI Core可以在一個時鐘周期內(nèi)實現(xiàn)4096個MAC操作。同時,Buffer L0A、L0B、L0C則用于存儲輸入矩陣和輸出矩陣數(shù)據(jù),負責向Cube計算單元輸送數(shù)據(jù)和存放計算結(jié)果。