NVIDIA這兩年業(yè)績大漲,股票也做了火箭一般從兩年前的30多美元躥升到了250美元,很重要一個原因是NVIDIA在深度學(xué)習(xí)、AI人工智能等新興領(lǐng)域保持領(lǐng)先,CEO黃仁勛都被一些媒體稱為“AI教父”了。相比之下,AMD這兩年還掙扎在游戲市場上,不過AMD CTO日前接受媒體采訪時表示AMD有著全面的機器學(xué)習(xí)策略,將為數(shù)據(jù)中心、邊緣計算市場提供AI引擎。
EEtimes日前采訪了AMD首席技術(shù)官Mark Papermarster,談到了AMD的AI戰(zhàn)略、7nm Vega、Zen 2處理器以及未來的制程工藝選擇等問題,不過大家放心,Papermarster對于新產(chǎn)品、新技術(shù)及新工藝等問題一點勁爆的料都沒提,嚴(yán)守了公司秘密,比較重要的內(nèi)容就是確認(rèn)了AMD會在AI市場大展宏圖。
Mark Papermarster宣稱AMD公司有著全面的機器學(xué)習(xí)策略,將會為數(shù)據(jù)中心、邊緣計算等提供AI引擎,但是具體的細(xì)節(jié)就沒了,AMD到底會提供什么樣的產(chǎn)品用于AI市場?會為AI、深度學(xué)習(xí)等計算做有什么優(yōu)化?這些問題就沒得說了。
EEtimes提到了AMD早在2016年就推出了面向深度學(xué)習(xí)的GPU加速,這就是Radeon Instinct加速卡,其中Radeon Instinct MI25采用了新一代Vega架構(gòu),擁有64組NCU單元,換算過來就是4096個SP流處理器,配合16GB的HBM2顯存,顯存帶寬高達484 GB/s。半精度浮點性能有了很大進步,達到了24.6TFLOP,而單精度也有12.3TFLOPS。
在這之后,谷歌推出了用于深度學(xué)習(xí)的TensorFlow處理器,在硬件中添加了MAC(乘法累加單元)加速深度學(xué)習(xí)計算。2017年5月份NVIDIA推出了Volta顯卡,這是第一款加入MAC單元的顯卡,被NVIDIA稱為Tensor單元。
英特爾今年早些時候計劃將其收購來的Movidius加速器單元轉(zhuǎn)移到運行Windows ML的PC平臺上,分析師認(rèn)為英特爾最終會把Movidius單元集成到CPU中。
Mark Papermarster沒有確認(rèn)AMD今年底將要發(fā)布的Vega或者明年初發(fā)布的7nm Zen2處理器上是否添加MAC運算單元,不過他表示即將推出的Vega GPU支持16位浮點意外的運算——這點其實也不是新聞了,早在發(fā)布之前,AMD就提到了7nm Vega加入了新的深度學(xué)習(xí)指令,支持了8位運算。
現(xiàn)在各大公司都在研究加速深度學(xué)習(xí)研究的算法,ARM在ML Core中加入了8位運算,NVIDIA已經(jīng)在研究2位操作,英特爾則在計劃單位操作。