面對市場疲軟和出口管制兩大風(fēng)險,英偉達憑借什么重回巔峰?
AI芯片行業(yè)是全球科技行業(yè)最惹人注目的賽道,在這條賽道上,英偉達公司已經(jīng)耕耘10多年,最近,這家以GPU加速計算為核心競爭力的公司遭遇了兩件煩心事:一是,英偉達三季度財報公布后,加密貨幣業(yè)務(wù)市場需求下降導(dǎo)致GPU庫存問題,影響未來業(yè)績展望,二是美國商務(wù)部工業(yè)安全局針對關(guān)鍵新興和基礎(chǔ)技術(shù)和相關(guān)產(chǎn)品地出口管制框架地提案征求開始,涉及AI技術(shù)、AI芯片、微處理器和量子技術(shù)等14個領(lǐng)域,英偉達股價受到?jīng)_擊,跌幅達到了高峰期的50%。
圖1:NVDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛
11月21日,在蘇州金雞湖國際會議中心,英偉達GTC大會現(xiàn)場,5000多人的大會現(xiàn)場人頭攢動,英偉達CEO黃仁勛顯然沒有受到外部市場干擾,他帶來激情四溢的演講,他強調(diào)指出三大趨勢:第一、摩爾定律已經(jīng)失效,影響全球的計算行業(yè),各行各業(yè)的計算需求與傳統(tǒng)計算極限之間逐漸擴大的差距,英偉達徹底改變計算方式,首創(chuàng)GPU加速計算模型,滿足開發(fā)人員的需求,并幫助他們實現(xiàn)飛躍;第二、AI將改變HPC和超大規(guī)模計算,科學(xué)家正在融合物理模擬和AI預(yù)測方法來創(chuàng)建數(shù)量級更大的模型。HPC正在成為AI計算機,并且為科學(xué)家、數(shù)據(jù)科學(xué)家和AI開發(fā)者所用。第三、AI讓世界變得更加自動化,AI將賦能所有移動的機器,數(shù)十億汽車,數(shù)百萬輛汽車,接駁車,建筑機械以及數(shù)十億工業(yè)和服務(wù)機器人都將具備自主能力。
黃仁勛表示,英偉達正在重塑計算機圖形和未來計算,以及人工智能如何通過自主機器,實現(xiàn)工廠和物流現(xiàn)場自動化,電子發(fā)燒友記者注意道,在云端訓(xùn)練和未來高性能計算重塑,英偉達做了完整的布局。
云端訓(xùn)練推出重量級產(chǎn)品:T4和HGX-2 GPU加速平臺
云計算正在進入算力時代,云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)、人工智能等信息技術(shù)的快速發(fā)展和傳統(tǒng)產(chǎn)業(yè)的數(shù)字化轉(zhuǎn)型,推動數(shù)據(jù)呈現(xiàn)幾何級增長,帶來了大量可處理的數(shù)據(jù)存量和知識。
據(jù)IDC數(shù)據(jù),2020年全球公有云在算力投資比例將超過10%,成為資本開支重點。全球服務(wù)器市場總體呈現(xiàn)高景氣,量價齊升,下游的公有云廠商加速算力投資趨勢明顯。傳統(tǒng)大型算力需求主要通過超算中心的方式來實現(xiàn),主要依托國家和大型機構(gòu)投資,最近三年各大型公有云廠商包括Amazon、阿里巴巴均推出HPC超算業(yè)務(wù),其戰(zhàn)略布局云計算算力業(yè)務(wù)的方向明確。
據(jù)測算,公有云算力投資比例從2014年的0.01%增長至2020年的11.75%,除了提供傳統(tǒng)的存儲服務(wù)外,主要的云廠商逐漸配置其計算能力,增加算力投資,同時私有云和傳統(tǒng)IT領(lǐng)域的算力配置也將逐步成為標(biāo)配。
針對云計算中心對于算力的不同層次需求,NVDIA采取了雙重戰(zhàn)略:第一,向上擴展,與百度、騰訊和阿里巴巴合作,NVDIA推出了V100 HGX-2,一個具備強大算力的高性能系統(tǒng),既可做科學(xué)計算,也可做人工智能計算,能夠處理海量的數(shù)據(jù),解決為數(shù)不多的大問題;第二,橫向擴展,NVIDIA推出T4 GPU產(chǎn)品,這是一臺小型計算系統(tǒng)、超大能量,功耗低,可以進行大規(guī)模的數(shù)據(jù)中心的部署。
圖2:HGX-2橫空出世
黃仁勛幽默地說,HGX-2板子有點重,HGX-2大概300鎊-400鎊,連接8個 V100 GPU,通過NVLink連接,總共1 PFLOPS。每個 GPU 以 300 GB / s的速度與其他 GPU 通信,并且以每秒8 TB的速度訪問所有 256 GB 的顯存,其他計算機節(jié)點沒有能力提供這么強大的能力。400臺服務(wù)器被他手上HGX-2系統(tǒng)主板代替了。
比起它強大的功能,HGX-2重量已經(jīng)不是焦點。NVIDIA 的 HGX-2 在單節(jié)點中能夠提供 2 千萬億次的計算性能,與僅使用 CPU 的服務(wù)器相比,它將 AI 機器學(xué)習(xí)工作負(fù)載的運行速度提升近 550 倍,將 AI 深度學(xué)習(xí)工作負(fù)載的運行速度提升近 300 倍,將高性能計算工作負(fù)載的運行速度提升近 160 倍。
華為、騰訊、百度和浪潮等國內(nèi)主流云計算和服務(wù)器廠商均采用這個平臺,華為智能計算業(yè)務(wù)部總裁邱隆表示,NVIDIA GPU計算平臺在AI、HPC等數(shù)據(jù)科學(xué)計算領(lǐng)域擁有領(lǐng)先優(yōu)勢,作為NVIDIA HGX-2 的合作伙伴,華為將基于HGX-2架構(gòu)為用戶提供強大的計算性能,以滿足各類AI和高性能計算應(yīng)用。
接著,在GTC大會上,黃仁勛重磅發(fā)布了T4處理器。T4 基于全新 NVIDIA TuringTM 架構(gòu),采用多精度 Turing Tensor Core和全新 RT Core,與加速的容器化軟件堆棧相結(jié)合,提供規(guī)??涨暗男阅?。70 瓦特 T4 GPU 大致相當(dāng)于一條巧克力糖的大小,可靈活適應(yīng)于標(biāo)準(zhǔn)服務(wù)器或任何開放計算項目的超大規(guī)模服務(wù)器設(shè)計。
T4 的多精度功能可支持 4 種不同精度等級的各類 AI 工作負(fù)載,助力實現(xiàn)突破性的 AI 性能,F(xiàn)P32精度能夠提供 8.1 TFLOPS,F(xiàn)P16 精度能夠提供 65 TFLOPS,INT8 精度能夠提供 130 TOPS,INT4精度能夠提供 260 TOPS。針對 AI 推理工作負(fù)載,配備 2 個 T4 GPU 的單個服務(wù)器最多可取代 54 臺 CPU 服務(wù)器。針對 AI 訓(xùn)練,配備 2 個 T4 的單個服務(wù)器可取代 9 臺雙套接字 CPU 服務(wù)器。T4 GPU僅僅是開始,容器化的TRT推理服務(wù)器今天開源,可以在Kubernetes運行。
NVDIA全球副總裁、中國區(qū)總經(jīng)理張建中對電子發(fā)燒友記者表示,今年T4推出,在推理方面也非常出色,眾多互聯(lián)網(wǎng)公司,包括頭條、美團、小米等,以及電信、金融等領(lǐng)域廠商都開始在數(shù)據(jù)中心采用NVDIA的產(chǎn)品。我們對未來三年國內(nèi)的數(shù)據(jù)中心業(yè)務(wù)發(fā)展都是非常樂觀的。
發(fā)布RAPIDS機器學(xué)習(xí)加速堆棧
黃仁勛在GTC大會上指出,機器學(xué)習(xí)比深度學(xué)習(xí)市場更為廣闊。據(jù)分析師估計,面向數(shù)據(jù)科學(xué)和機器學(xué)習(xí)的服務(wù)器市場每年價值約為 200 億美元,加上科學(xué)分析和深度學(xué)習(xí)市場,高性能計算市場總價值大約為 360 億美元。
RAPSID發(fā)布于2018年10月10日的GTC Europe大會上,是一款針對數(shù)據(jù)科學(xué)和機器學(xué)習(xí)的GPU加速平臺,它為數(shù)據(jù)科學(xué)家提供標(biāo)準(zhǔn)化的流水線式工具,數(shù)據(jù)處理速度較僅用CPU提升50倍。
機器學(xué)習(xí)典型地應(yīng)用場景,比如在電商系統(tǒng),亞馬遜借助機器學(xué)習(xí)來改善用戶對其業(yè)務(wù)的使用體驗,包括產(chǎn)品推薦,替代性產(chǎn)品預(yù)測,欺詐檢測,元數(shù)據(jù)驗證與知識獲取。又比如醫(yī)療等行業(yè)中有大量結(jié)構(gòu)化數(shù)據(jù),平安國保險業(yè)巨頭平安集團,其擁有近1.8億個人用戶,為深入洞察欺詐檢測等問題或預(yù)測人群疾病,平安科技數(shù)據(jù)科學(xué)家團隊除了自身獨特地機器學(xué)習(xí)算法,也用到scikit-learn常用機器學(xué)習(xí)庫,最近,平安科技使用了RAPSID,這個新開源地GPU加速平臺,使用RAPSID和GPU加速PCA和DBSAN之后,工作執(zhí)行流程加快了80倍,數(shù)據(jù)訓(xùn)練和加載時間從幾天縮短到幾個小時,這些都加速了公司做主動預(yù)測并完善預(yù)防計劃。
黃仁勛表示,RAPIDS目前已經(jīng)被非常廣泛的采用,比如華大基因、中國移動、平安科技等中國公司都宣布引入它進行機器學(xué)習(xí)加速。
最后,黃仁勛介紹說,NVIDIA AGX系列,還有面向自主機器、機器人的XAVIER處理器現(xiàn)已全面投產(chǎn)。眾多車企都在圍繞自動駕駛進行開發(fā),放眼2020或是2021年的市場競爭格局,整個行業(yè)正在快速變化當(dāng)中,人工智能從根本上推動了這個改變。大家可以看到NVDIA把人工智能融入到計算機圖形到高性能計算,到自主機器和自動駕駛。