富士通首款A(yù)I處理器“DLU” 明年將加入戰(zhàn)局
日本富士通(Fujitsu)也正投入全球人工智能(AI)技術(shù)開發(fā)競賽,目前正在開發(fā)一款名為“Deep Learning Unit”(DLU)的AI專用微處理器,宣稱這款微處理器與競爭對手產(chǎn)品相較,可提供每瓦單位10倍更佳的效能表現(xiàn),首款DLU微處理器預(yù)計(jì)將在富士通2018會(huì)計(jì)年度內(nèi)推出,是否能對市場領(lǐng)先者NVIDIA形成挑戰(zhàn)壓力,值得觀察。
根據(jù)Top 500網(wǎng)站報(bào)導(dǎo),富士通自2015年以來便投入DLU芯片開發(fā)工作,不過此前富士通很少對外透露這款微處理器的設(shè)計(jì)細(xì)節(jié),直到2017年6月舉辦的“ISC 2017”大會(huì)上,富士通AI基盤事業(yè)本部(AI Platform Division)資深主任丸山拓巳(Takumi Maruyama)才對外透露該公司投入AI及高效能運(yùn)算(HPC)領(lǐng)域的發(fā)展成果,首度較深入介紹DLU微處理器運(yùn)作細(xì)節(jié)。目前丸山便正從事于DLU芯片開發(fā)專案。
丸山指出,DLU微處理器與其他多款專為深度學(xué)習(xí)(DL)所打造的處理器相同的是,均高度仰賴于低精密度運(yùn)算在神經(jīng)網(wǎng)絡(luò)處理上優(yōu)化效能及能源效率,值得注意的是,DLU微處理器支援FP32、FP16、INT16以及INT8數(shù)據(jù)類型。在最高等級上,DLU微處理器是由若干“深度學(xué)習(xí)處理單元”(Deep Learning Processing Units;DPU)所組成,透過一個(gè)高效能構(gòu)造進(jìn)行互相連結(jié),或可將這些DPUs視為是深度學(xué)習(xí)的核心。
個(gè)別的主核心管理在DPU上的執(zhí)行,并負(fù)責(zé)在DPU與芯片內(nèi)建存儲器控制器之間協(xié)調(diào)存儲器近用任務(wù)。值得注意的是,每個(gè)DPU均是由16個(gè)深度學(xué)習(xí)處理元素(DPE)所組成,這也是實(shí)際數(shù)值運(yùn)算進(jìn)行之處;每個(gè)DPE則是由8個(gè)SIMD執(zhí)行單位連同一個(gè)非常大型的注冊檔(Register File; RF)所組成,此RF完全受到軟件的控制。
另外,DLU封裝將包含一定數(shù)量的第二代高頻寬存儲器(HBM2),這款存儲器能夠高速提供處理器所需數(shù)據(jù),該DLU封裝也將包含一個(gè)用于透過Tofu互聯(lián)技術(shù)與其他DLU微處理器相連結(jié)的介面,富士通預(yù)計(jì)2018年度將推出DLU微處理器,且將先以協(xié)同處理器形式問世,由一組中央處理器(CPU)來驅(qū)動(dòng)DLU微處理器。
自下一代DLU微處理器技術(shù)開始,富士通計(jì)劃將DLU微處理器以某種形式嵌入一組CPU中,不過富士通仍未透露此下一代技術(shù)何時(shí)將推出。借由上述芯片外(off-chip)網(wǎng)路設(shè)計(jì),富士通設(shè)想未來能夠以DLU微處理器打造非常龐大的系統(tǒng),目標(biāo)創(chuàng)建可擴(kuò)充的平臺供處理最大且最復(fù)雜的深度學(xué)習(xí)問題。
富士通的最終計(jì)劃目標(biāo),是要除了擁有面向一般市場的SPARC處理器產(chǎn)品線外,也要打造一個(gè)DLU微處理器產(chǎn)品線。
富士通了解到AI與機(jī)器學(xué)習(xí)(ML)在不久的將來可望主導(dǎo)全球科技應(yīng)用領(lǐng)域,如果不跟進(jìn)恐面臨在未來遭邊緣化的危機(jī),目前則是由NVIDIA居于這市場的領(lǐng)先地位,但英特爾(Intel)、AMD(AMD)及英國AI芯片硬件設(shè)計(jì)新創(chuàng)企業(yè)Graphcore等廠商,均在發(fā)展自有AI芯片技術(shù)上積極投入,預(yù)計(jì)未來6~12個(gè)月可能將相繼推出新產(chǎn)品線,屆時(shí)也將成為富士通DLU微處理器的新競爭對手。
NVIDIA在這塊領(lǐng)域具備的優(yōu)勢,在于該公司為自有繪圖芯片(GPU)開發(fā)的深度學(xué)習(xí)軟件支援,能夠讓NVIDIA在AI芯片市場上取得較大領(lǐng)先優(yōu)勢,用于處理神經(jīng)網(wǎng)路的軟件架構(gòu)數(shù)量不僅多且仍在增長,但NVIDIA能夠完全提供支持,反觀微軟(Microsoft)、CNTK、Theano、MXNet、Torch、TensorFlow以及Caffe等廠商最多只能支持主要的軟件架構(gòu)部分。
即使如此,對于擁有較龐大資金規(guī)模的廠商如富士通及其他廠商來說,這塊領(lǐng)域雖然已有大量深度學(xué)習(xí)軟件已經(jīng)被寫入,但相對于未來幾年可能發(fā)展的數(shù)量來說仍是九牛一毛,這意謂在這塊領(lǐng)域未來幾年仍有容納其他新進(jìn)競爭廠商的許多空間,這讓富士通等新進(jìn)廠商仍有搶食這塊市場商機(jī)的機(jī)會(huì)。