NVIDIA也看上了RISC-V架構(gòu):融入深度神經(jīng)網(wǎng)絡(luò)加速器
掃描二維碼
隨時(shí)隨地手機(jī)看文章
RISC-V架構(gòu)和指令集憑借其開放特性,正贏得越來越廣泛的關(guān)注,無論是中國還是Intel、三星、高通等巨頭都大力投入,RISC-V也被視為ARM乃至是x86的潛在“備胎”。
其實(shí),NVIDIA對于RISC-V架構(gòu)也非常關(guān)注,早早就加入了RISC-V基金會(huì),并做了不少研究,近日還公開了在深度神經(jīng)網(wǎng)絡(luò)(DNN)中應(yīng)用RISC-V指令集的可能。
NVIDIA表示,DNN需要高性能、高精度,對功耗也比較敏感,打造DNN加速器并不容易,成本也很高,所以計(jì)劃使用低功耗、高帶寬的芯片互連技術(shù),將多個(gè)推理加速芯片組成一個(gè)Mesh網(wǎng)格網(wǎng)絡(luò)。
封裝架構(gòu)、芯片架構(gòu)、PE結(jié)構(gòu)
在一款研究性芯片中,NVIDIA設(shè)計(jì)了16個(gè)用于深度學(xué)習(xí)計(jì)算的處理元件(PE),搭配一個(gè)采用RISC-V指令集的控制器,可提供4.01TOPS(每秒4.01萬億次操作)的算力,支持最多36塊芯片互連,總算力達(dá)到128TOPS。
使用臺(tái)積電16nm工藝時(shí),單個(gè)芯片封裝面積6平方毫米(2.4×2.5毫米),內(nèi)核面積3.1平方毫米,36塊芯片互連就是總封裝面積216平方毫米、總內(nèi)核面積111.6平方毫米,仍然在可控范圍內(nèi),而且算下來能效可達(dá)1.15TOPS每平方毫米。
不過,NVIDIA這項(xiàng)研究只是一種方向性探索,暫時(shí)不會(huì)有對應(yīng)的商用產(chǎn)品,但思路可能會(huì)融入到未來的架構(gòu)和產(chǎn)品設(shè)計(jì)中。