英偉達(dá)中國(guó)區(qū)CTO 趙立威：GPU運(yùn)算引領(lǐng)人工智能

時(shí)間：2020-06-26 23:09:02

關(guān)鍵字： 2018iot AI GPU nvdia

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀] （本站原創(chuàng)，作者是章鷹，電子發(fā)燒友執(zhí)行副主編）提到英偉達(dá)，大多數(shù)人會(huì)以為，它是一家賣顯卡的硬件公司，是“游戲芯片供應(yīng)商”、“全球最大的圖片芯片制造商”?，F(xiàn)在英偉達(dá)是一家AI公司，深度

（本站原創(chuàng)，作者是章鷹，電子發(fā)燒友執(zhí)行副主編）

提到英偉達(dá)，大多數(shù)人會(huì)以為，它是一家賣顯卡的硬件公司，是“游戲芯片供應(yīng)商”、“全球最大的圖片芯片制造商”?，F(xiàn)在英偉達(dá)是一家AI公司，深度學(xué)習(xí)正在創(chuàng)造收入增長(zhǎng)，據(jù)官方發(fā)布的數(shù)據(jù)，截至2018年7月29日，英偉達(dá)第二季收入達(dá)到31.2億美元，較去年同期增長(zhǎng)40%。公司在AI、游戲、專業(yè)視覺(jué)和自動(dòng)駕駛平臺(tái)均取得增長(zhǎng)。首席執(zhí)行官黃仁勛表示，各行各業(yè)計(jì)算需求與傳統(tǒng)計(jì)算極限之間逐漸擴(kuò)大的差距，推動(dòng)了我們的增長(zhǎng)，我們首創(chuàng)的GPU加速計(jì)算模型，滿足了開(kāi)發(fā)人員的需求，并幫助他們實(shí)現(xiàn)飛躍。

9月21日，在杭州云棲大會(huì)的英偉達(dá)專場(chǎng)會(huì)議上，英偉達(dá)中國(guó)區(qū)CTO趙立威先生，給在場(chǎng)的工程師帶來(lái)了最前沿的《GPU運(yùn)算引領(lǐng)人工智能》的演講。

英偉達(dá)中國(guó)區(qū)CTO趙立威先生

趙立威先生的PPT，展示了1980年到2020年，GPU算力的急速增長(zhǎng)曲線。GPU Computing和人工智能在過(guò)去的幾個(gè)月變化非?？?，以NVIDIA最新的DGX-2人工智能電腦2PFlops的算力能力，已經(jīng)相當(dāng)于2009年全球排名第一的超算中心算力，并且從GPU領(lǐng)域來(lái)看算力能力每年提升1.1倍。筆者了解到，云計(jì)算正進(jìn)入算力時(shí)代。云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)、人工智能等信息技術(shù)的快速發(fā)展與傳統(tǒng)產(chǎn)業(yè)的數(shù)字化轉(zhuǎn)型，推動(dòng)數(shù)據(jù)量呈現(xiàn)幾何級(jí)增長(zhǎng)，帶來(lái)了大量可處理數(shù)據(jù)存量和知識(shí)。

趙立威先生引用2017年圖靈獎(jiǎng)獲得者David A. Patterson在接受采訪時(shí)的話：“傳統(tǒng)的摩爾定律將失效，進(jìn)入后摩爾定律時(shí)代，傳統(tǒng)以CPU為計(jì)算單元的硬件架構(gòu)很難跟上不同類型行業(yè)應(yīng)用場(chǎng)景對(duì)算力的巨大需求。這些場(chǎng)景包括精細(xì)化醫(yī)療、天氣預(yù)報(bào)仿真、新材料研發(fā)，特別是人工智能?！?/p>

趙立威表示，改變英偉達(dá)命運(yùn)的CUDA（用于圖形處理單元GPU上的通用計(jì)算的并行計(jì)算平臺(tái)和編程模型。利用CUDA，開(kāi)發(fā)人員可以通過(guò)利用GPU的功能，大大加快計(jì)算應(yīng)用）已經(jīng)獲得市場(chǎng)高度認(rèn)可。截至到目前，CUDA開(kāi)發(fā)人員增長(zhǎng)10倍，超過(guò)百萬(wàn)，CUDA下載量提高5倍，達(dá)到180萬(wàn)?！I是NVIDIA CUDA GPU的“殺手級(jí)應(yīng)用”，AI取得驚人進(jìn)步。

Tesla V100采用臺(tái)積電12nm工藝制程，815平方毫米面積，共210億個(gè)晶體管，15Tflops的單精度浮點(diǎn)性能，7.5Tflops的雙精度浮點(diǎn)性能，擁有5120個(gè)CUDA，16MB緩存，采用３２GB HBM2顯存，顯存帶寬為900GB/S，高速顯存。這款GPU卡為深度學(xué)習(xí)設(shè)計(jì)。 “不管你是在做深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練，還是在一個(gè)推理過(guò)程，整體的運(yùn)行效率將得到極大的提升?！壁w立威表示。

在深度學(xué)習(xí)的模型不斷演進(jìn)時(shí)，對(duì)算力的需求似乎沒(méi)有止境。趙立威表示，僅在Training面，算力的需求提升了30萬(wàn)倍，是不是夠了呢？NVIDIA推出了史上最強(qiáng)，單一節(jié)點(diǎn)的GPU服務(wù)器，當(dāng)計(jì)算能力足夠強(qiáng)，數(shù)據(jù)訪問(wèn)能力會(huì)否受到阻礙？怎樣做到所有計(jì)算能力得到保證，數(shù)據(jù)訪問(wèn)也不會(huì)延遲？

英偉達(dá)DGX 2在2018年3月發(fā)布，基于Tesla V100的升級(jí)和全新的NVSwitch架構(gòu)，英偉達(dá)將DGX 2的性能較前一代產(chǎn)品有大幅度提升。DGX 2應(yīng)用了最新的NVSwitch架構(gòu)，通過(guò)12個(gè)NVSwitch支持16塊全新的Tesla V100共享同一的內(nèi)存空間，總計(jì)512 GB HBM2存儲(chǔ)，能實(shí)現(xiàn)每秒高達(dá)2千萬(wàn)次的浮點(diǎn)運(yùn)算。此外，基于NVSwitch架構(gòu)的應(yīng)用，16塊GPU可以實(shí)現(xiàn)2.4TB/秒的數(shù)據(jù)傳輸能力。和六個(gè)月前發(fā)布的DGX-1相比，DGX-2的處理能力是前者的10倍。

趙立威表示，全球最大的GPU，DGX 2的售價(jià)，目前官方給出的價(jià)格為39.9萬(wàn)美元，9月份，這款產(chǎn)品就可以于客戶見(jiàn)面。即使算力提高，數(shù)據(jù)訪問(wèn)也不會(huì)受到影響。

GPU運(yùn)算能力還在高速發(fā)展，“我們要達(dá)到同樣的算力，如果使用傳統(tǒng)的雙路CPU服務(wù)器，需要300臺(tái)，預(yù)算需要300萬(wàn)美金，功耗達(dá)到180ｋW，采用DGX－2的超算中心，只需要一臺(tái)，八分之一的預(yù)算，功耗只有10kw?！?/p>

最后，趙立威先生介紹了NVDIA　AI平臺(tái)和主要產(chǎn)品線。它總結(jié)說(shuō)， NVDIA　GPU卡主要面對(duì)專業(yè)圖形計(jì)算、專業(yè)圖形加速，云計(jì)算、自動(dòng)駕駛等領(lǐng)域的生態(tài)合作伙伴，使用GPU去制作去設(shè)計(jì)云上、自動(dòng)駕駛和各行業(yè)細(xì)分場(chǎng)景的產(chǎn)品和服務(wù)。比如作為NVDIA在中國(guó)的重要合作伙伴，阿里巴巴正在將GPU大規(guī)模的應(yīng)用于諸多業(yè)務(wù)的AI推理應(yīng)用中，借助GPU帶來(lái)的強(qiáng)大算力為AI應(yīng)用賦能。