英偉達(dá)中國(guó)區(qū)CTO 趙立威:GPU運(yùn)算引領(lǐng)人工智能
(本站原創(chuàng),作者是章鷹,電子發(fā)燒友執(zhí)行副主編)
提到英偉達(dá),大多數(shù)人會(huì)以為,它是一家賣顯卡的硬件公司,是“游戲芯片供應(yīng)商”、“全球最大的圖片芯片制造商”?,F(xiàn)在英偉達(dá)是一家AI公司,深度學(xué)習(xí)正在創(chuàng)造收入增長(zhǎng),據(jù)官方發(fā)布的數(shù)據(jù),截至2018年7月29日,英偉達(dá)第二季收入達(dá)到31.2億美元,較去年同期增長(zhǎng)40%。公司在AI、游戲、專業(yè)視覺(jué)和自動(dòng)駕駛平臺(tái)均取得增長(zhǎng)。首席執(zhí)行官黃仁勛表示,各行各業(yè)計(jì)算需求與傳統(tǒng)計(jì)算極限之間逐漸擴(kuò)大的差距,推動(dòng)了我們的增長(zhǎng),我們首創(chuàng)的GPU加速計(jì)算模型,滿足了開(kāi)發(fā)人員的需求,并幫助他們實(shí)現(xiàn)飛躍。
9月21日,在杭州云棲大會(huì)的英偉達(dá)專場(chǎng)會(huì)議上,英偉達(dá)中國(guó)區(qū)CTO趙立威先生,給在場(chǎng)的工程師帶來(lái)了最前沿的《GPU運(yùn)算引領(lǐng)人工智能》的演講。
英偉達(dá)中國(guó)區(qū)CTO趙立威先生
趙立威先生的PPT,展示了1980年到2020年,GPU算力的急速增長(zhǎng)曲線。GPU Computing和人工智能在過(guò)去的幾個(gè)月變化非???,以NVIDIA最新的DGX-2人工智能電腦2PFlops的算力能力,已經(jīng)相當(dāng)于2009年全球排名第一的超算中心算力,并且從GPU領(lǐng)域來(lái)看算力能力每年提升1.1倍。筆者了解到,云計(jì)算正進(jìn)入算力時(shí)代。云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)、人工智能等信息技術(shù)的快速發(fā)展與傳統(tǒng)產(chǎn)業(yè)的數(shù)字化轉(zhuǎn)型,推動(dòng)數(shù)據(jù)量呈現(xiàn)幾何級(jí)增長(zhǎng),帶來(lái)了大量可處理數(shù)據(jù)存量和知識(shí)。
趙立威先生引用2017年圖靈獎(jiǎng)獲得者David A. Patterson在接受采訪時(shí)的話:“傳統(tǒng)的摩爾定律將失效,進(jìn)入后摩爾定律時(shí)代,傳統(tǒng)以CPU為計(jì)算單元的硬件架構(gòu)很難跟上不同類型行業(yè)應(yīng)用場(chǎng)景對(duì)算力的巨大需求。這些場(chǎng)景包括精細(xì)化醫(yī)療、天氣預(yù)報(bào)仿真、新材料研發(fā),特別是人工智能?!?/p>
趙立威表示,改變英偉達(dá)命運(yùn)的CUDA(用于圖形處理單元GPU上的通用計(jì)算的并行計(jì)算平臺(tái)和編程模型。利用CUDA,開(kāi)發(fā)人員可以通過(guò)利用GPU的功能,大大加快計(jì)算應(yīng)用)已經(jīng)獲得市場(chǎng)高度認(rèn)可。截至到目前,CUDA開(kāi)發(fā)人員增長(zhǎng)10倍,超過(guò)百萬(wàn),CUDA下載量提高5倍,達(dá)到180萬(wàn)?!I是NVIDIA CUDA GPU的“殺手級(jí)應(yīng)用”,AI取得驚人進(jìn)步。
Tesla V100采用臺(tái)積電12nm工藝制程,815平方毫米面積,共210億個(gè)晶體管,15Tflops的單精度浮點(diǎn)性能,7.5Tflops的雙精度浮點(diǎn)性能,擁有5120個(gè)CUDA,16MB緩存,采用32GB HBM2顯存,顯存帶寬為900GB/S,高速顯存。這款GPU卡為深度學(xué)習(xí)設(shè)計(jì)。 “不管你是在做深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,還是在一個(gè)推理過(guò)程,整體的運(yùn)行效率將得到極大的提升?!壁w立威表示。
在深度學(xué)習(xí)的模型不斷演進(jìn)時(shí),對(duì)算力的需求似乎沒(méi)有止境。趙立威表示,僅在Training面,算力的需求提升了30萬(wàn)倍,是不是夠了呢?NVIDIA推出了史上最強(qiáng),單一節(jié)點(diǎn)的GPU服務(wù)器,當(dāng)計(jì)算能力足夠強(qiáng),數(shù)據(jù)訪問(wèn)能力會(huì)否受到阻礙?怎樣做到所有計(jì)算能力得到保證,數(shù)據(jù)訪問(wèn)也不會(huì)延遲?
英偉達(dá)DGX 2在2018年3月發(fā)布,基于Tesla V100的升級(jí)和全新的NVSwitch架構(gòu),英偉達(dá)將DGX 2的性能較前一代產(chǎn)品有大幅度提升。DGX 2應(yīng)用了最新的NVSwitch架構(gòu),通過(guò)12個(gè)NVSwitch支持16塊全新的Tesla V100共享同一的內(nèi)存空間,總計(jì)512 GB HBM2存儲(chǔ),能實(shí)現(xiàn)每秒高達(dá)2千萬(wàn)次的浮點(diǎn)運(yùn)算。此外,基于NVSwitch架構(gòu)的應(yīng)用,16塊GPU可以實(shí)現(xiàn)2.4TB/秒的數(shù)據(jù)傳輸能力。和六個(gè)月前發(fā)布的DGX-1相比,DGX-2的處理能力是前者的10倍。
趙立威表示,全球最大的GPU,DGX 2的售價(jià),目前官方給出的價(jià)格為39.9萬(wàn)美元,9月份,這款產(chǎn)品就可以于客戶見(jiàn)面。即使算力提高,數(shù)據(jù)訪問(wèn)也不會(huì)受到影響。
GPU運(yùn)算能力還在高速發(fā)展,“我們要達(dá)到同樣的算力,如果使用傳統(tǒng)的雙路CPU服務(wù)器,需要300臺(tái),預(yù)算需要300萬(wàn)美金,功耗達(dá)到180kW,采用DGX-2的超算中心,只需要一臺(tái),八分之一的預(yù)算,功耗只有10kw?!?/p>
最后,趙立威先生介紹了NVDIA AI平臺(tái)和主要產(chǎn)品線。它總結(jié)說(shuō), NVDIA GPU卡主要面對(duì)專業(yè)圖形計(jì)算、專業(yè)圖形加速,云計(jì)算、自動(dòng)駕駛等領(lǐng)域的生態(tài)合作伙伴,使用GPU去制作去設(shè)計(jì)云上、自動(dòng)駕駛和各行業(yè)細(xì)分場(chǎng)景的產(chǎn)品和服務(wù)。比如作為NVDIA在中國(guó)的重要合作伙伴,阿里巴巴正在將GPU大規(guī)模的應(yīng)用于諸多業(yè)務(wù)的AI推理應(yīng)用中,借助GPU帶來(lái)的強(qiáng)大算力為AI應(yīng)用賦能。