谷歌發(fā)布TPU 3.0 AI處理器:性能提升8倍,水冷散熱
在今天凌晨的Google I/0 2018大會(huì)上,谷歌發(fā)布了Android P新系統(tǒng)以及一大波新應(yīng)用,與硬件相關(guān)的并不多,主要的就是谷歌的新一代TPU處理器——TPU 3.0??紤]到谷歌很多應(yīng)用越來越依賴AI人工智能,TPU 3.0的性能相比目前的TPU 2.0有8倍提升,可達(dá)10億億次,計(jì)算規(guī)??氨萒OP500超算冠軍,所以散熱要求也很高,谷歌直接上了水冷系統(tǒng)。
TPU全名為Tensor Processing Unit(張量處理單元),是谷歌研發(fā)的一種神經(jīng)網(wǎng)絡(luò)訓(xùn)練的處理器,主要用于深度學(xué)習(xí)、AI運(yùn)算,其他公司也有各自研發(fā)的AI處理器,叫法不一而已,比如有的叫做NPU神經(jīng)網(wǎng)絡(luò)處理器等等,主要用途都差不多。
TPU的特點(diǎn)是AI運(yùn)算性能比傳統(tǒng)CPU、GPU以及FPGA處理器都要強(qiáng),同時(shí)功耗要低,能效比很高,去年IO大會(huì)上發(fā)布了TPU 2.0,谷歌就宣稱TPU的能效可達(dá)GPU的30-80倍,后來還招致NVIDIA的不滿。
今年的TPU 3.0在性能上更上一層樓,谷歌CPU皮查伊在發(fā)布會(huì)上表示TPU 3.0的性能達(dá)到了TPU 2.0的8倍多,性能可達(dá)100PFLOPS,也就是10億億次水平。只看運(yùn)算能力的話,10億億次的TPU 3.0堪比TOP500超算冠軍——中國神威·太湖之光,其Linpack浮點(diǎn)性能就是9.3億億次,不過超算跟TPU 3.0沒啥可比性,一個(gè)是專用處理器,一個(gè)更加通用。
TPU 3.0急劇提升的性能對(duì)系統(tǒng)設(shè)計(jì)也提出了更高要求,散熱方式已經(jīng)不可能采用TPU 2.0的風(fēng)冷設(shè)計(jì)了,谷歌設(shè)計(jì)了一套水冷系統(tǒng)來給TPU 3.0降溫。
TPU 3.0除了谷歌自己用之外,未來數(shù)月內(nèi)還會(huì)開放給其他公司及開發(fā)人員,TPU云端平臺(tái)每小時(shí)價(jià)格6.5美元即可租用TPU 3.0來訓(xùn)練自己的神經(jīng)網(wǎng)絡(luò)模型。
本文圖片來自Hardware.info。
TPU 2.0采用風(fēng)冷散熱方式