英偉達(dá)DPU,在數(shù)據(jù)中心領(lǐng)域?qū)τ⑻貭柕奶魬?zhàn)
最近幾年,“顛覆”、“極致”、“革命性”等概念很容易的出現(xiàn)在科技廠商的發(fā)布會(huì)新聞中。而iPhone12的發(fā)布現(xiàn)場(chǎng),蒂姆庫(kù)克就用上了“新紀(jì)元”的字眼,標(biāo)志著iPhone正式地步入了5G時(shí)代新紀(jì)元。
但國(guó)內(nèi)消費(fèi)者對(duì)5G已經(jīng)是見(jiàn)怪不怪了,蘋(píng)果自嗨的劃時(shí)代產(chǎn)品因?yàn)闆](méi)有達(dá)到市場(chǎng)的預(yù)期,當(dāng)日股價(jià)就跌去3800億個(gè)小目標(biāo),后面就要靠銷量來(lái)證明蘋(píng)果自己有沒(méi)有跨入“新紀(jì)元”了。
相比較于關(guān)注度高的消費(fèi)電子領(lǐng)域,本文要把重點(diǎn)放在大多數(shù)人不太熟悉的數(shù)據(jù)中心產(chǎn)業(yè),及其更上游的數(shù)據(jù)中心計(jì)算芯片上面。因?yàn)槲覀兛吹诫S著云計(jì)算的大規(guī)模普及和AI計(jì)算的指數(shù)級(jí)增長(zhǎng),數(shù)據(jù)中心被提到前所未有的重要位置。
最近在參加一個(gè)有關(guān)數(shù)字通信產(chǎn)業(yè)的論壇上,聽(tīng)到一位中國(guó)信通院的專家的觀點(diǎn)是:數(shù)據(jù)中心,將成為和5G技術(shù)并肩,下一個(gè)數(shù)字技術(shù)的制高點(diǎn)。類似的觀點(diǎn),我們也在英偉達(dá)線上2020年GPU技術(shù)大會(huì),從黃仁勛那里聽(tīng)到:數(shù)據(jù)中心已成為全新的計(jì)算單元。
黃仁勛之所以有這樣的底氣,就在于這次發(fā)布會(huì)上推出了一款全新處理器DPU,以及圍繞該處理器的軟件生態(tài)架構(gòu)DOCA。據(jù)英偉達(dá)的介紹,DPU可以和CPU、GPU相結(jié)合,構(gòu)成完全可編程的單一AI計(jì)算單元,實(shí)現(xiàn)前所未有的安全性和算力支持。
那么,DPU能否真正承擔(dān)起與CPU、GPU一樣的計(jì)算重要性,實(shí)現(xiàn)數(shù)據(jù)中心的一次巨大革新?其創(chuàng)新點(diǎn)到底在哪里?這些仍然是我們要去回顧和考察的問(wèn)題。
一、英偉達(dá)DPU的過(guò)“芯”之處
從英偉達(dá)在GTC的介紹上來(lái)說(shuō),DPU(Data Processing Unit)處理器,其實(shí)是一種SoC芯片,其中集成了ARM處理器核、VLIW矢量計(jì)算引擎和智能網(wǎng)卡的功能,主要應(yīng)用在分布式存儲(chǔ)、網(wǎng)絡(luò)計(jì)算和網(wǎng)絡(luò)安全領(lǐng)域。
DPU的主要作用就在于替代了數(shù)據(jù)中心原本用來(lái)處理分布式存儲(chǔ)和網(wǎng)絡(luò)通信的CPU處理器資源。在DPU之前,智能網(wǎng)卡(SmartNIC)正在網(wǎng)絡(luò)安全和網(wǎng)絡(luò)互連協(xié)議方面逐漸取代CPU。而現(xiàn)在DPU的出現(xiàn),相當(dāng)于是智能網(wǎng)卡的升級(jí)替代版本,一方面增強(qiáng)了智能網(wǎng)卡對(duì)網(wǎng)絡(luò)安全和網(wǎng)絡(luò)協(xié)議的處理能力,一方面又整合和加強(qiáng)了分布式存儲(chǔ)的處理能力,從而在這兩個(gè)領(lǐng)域更好地替代CPU,從而釋放CPU的算力給到其他更多應(yīng)用。
英偉達(dá)在DPU上的技術(shù)突破,來(lái)自于去年收購(gòu)以色列芯片制造公司Mellanox之后,在這家公司的硬件基礎(chǔ)上開(kāi)發(fā)出BlueFeild系列的兩款DPU——英偉達(dá)BlueField-2 DPU與BlueField-2X DPU。
據(jù)介紹,BlueField-2 DPU具有英偉達(dá)Mellanox Connext-6 SmartNIC的所有特點(diǎn),與8個(gè)64位的A72ARM處理器內(nèi)核一起,實(shí)現(xiàn)可完全編程,并能提供每秒200千兆比特的數(shù)據(jù)傳輸速率,從而加速關(guān)鍵數(shù)據(jù)中心的安全、網(wǎng)絡(luò)和存儲(chǔ)任務(wù)。
最核心的一點(diǎn)是單個(gè)BlueField-2 DPU可以提供相當(dāng)于消耗125個(gè)CPU內(nèi)核所提供的數(shù)據(jù)中心服務(wù),從而有效釋放CPU內(nèi)核的算力資源。
而B(niǎo)lueField-2X DPU則擁有包括BlueField-2 DPU的所有關(guān)鍵特性,其特性能夠通過(guò)英偉達(dá)安培GPU的AI功能得以增強(qiáng)。而在英偉達(dá)的路線圖里,未來(lái)的Bluefield-4 將會(huì)引入CUDA 和 NVIDIA AI,極大加快網(wǎng)絡(luò)中計(jì)算機(jī)視覺(jué)應(yīng)用處理的速度。
另外一個(gè)值得注意的是英偉達(dá)提出配合DPU處理器的軟件開(kāi)發(fā)工具包——DOCA(Data-Center-Infrastructure-On-A-Chip Architecture)。英偉達(dá)的專家將DOCA類比為數(shù)據(jù)中心服務(wù)器領(lǐng)域的CUDA,其意圖在于幫助開(kāi)發(fā)人員在DPU加速的數(shù)據(jù)中心基礎(chǔ)設(shè)施上構(gòu)建相應(yīng)的應(yīng)用程序,從而豐富DPU的應(yīng)用開(kāi)發(fā)生態(tài)。
從以上介紹我們看出英偉達(dá)的兩個(gè)野心,一個(gè)是DPU試圖再一次復(fù)制“GPU替代顯示加速卡成為通用顯示芯片的路徑”,再一個(gè)是DOCA試圖再一次復(fù)制“CUDA在GPU通用化過(guò)程中所起到的開(kāi)創(chuàng)生態(tài)之功”。
如果和不久前英偉達(dá)收購(gòu)ARM的消息結(jié)合起來(lái),我們看到英偉達(dá)的一個(gè)重要考量,就是以ARM架構(gòu)的CPU為核心,從服務(wù)器的應(yīng)用加速擴(kuò)展到服務(wù)器的全部應(yīng)用場(chǎng)景,從而實(shí)現(xiàn)在數(shù)據(jù)中心服務(wù)器領(lǐng)域的更大突破,目標(biāo)自然是劍指英特爾CPU為代表的X86服務(wù)器生態(tài)。
而在考察DPU挑戰(zhàn)CPU霸主地位的可能性之前,我們可以簡(jiǎn)單來(lái)了解下英偉達(dá)在數(shù)據(jù)中心的布局。
二、英偉達(dá)的數(shù)據(jù)中心“野心”
在經(jīng)歷過(guò)游戲顯卡業(yè)務(wù)的增速放緩,以及加密貨幣退潮后帶來(lái)的顯著業(yè)績(jī)下滑的影響之后,幾經(jīng)波折的英偉達(dá)終于堅(jiān)定地將未來(lái)押注在了AI計(jì)算和數(shù)據(jù)中心的產(chǎn)業(yè)布局上面。
2017年,英偉達(dá)的數(shù)據(jù)中心業(yè)務(wù)季度營(yíng)收首次超過(guò)了5億美元,同比增長(zhǎng)了109%,這使得黃仁勛在一次大會(huì)上大力肯定了數(shù)據(jù)中心業(yè)務(wù)的價(jià)值。
英偉達(dá)早在2008年,最初就是通過(guò)最早的Tesla GPU加速器和初級(jí)的CUDA編程環(huán)境來(lái)為數(shù)據(jù)中心進(jìn)行GPU計(jì)算,試圖將更多的并行計(jì)算從CPU卸載到GPU上。這成為英偉達(dá)GPU之后進(jìn)化之路的一條長(zhǎng)期策略。
此后隨著AI計(jì)算需求在數(shù)據(jù)中心當(dāng)中的爆發(fā)式增長(zhǎng),AI硬件正成為越來(lái)越多數(shù)據(jù)中心擴(kuò)容建設(shè)的關(guān)鍵所在。當(dāng)超強(qiáng)AI算力成為數(shù)據(jù)中心的剛需,英偉達(dá)GPU憑借強(qiáng)大的并行計(jì)算和浮點(diǎn)能力,突破了深度學(xué)習(xí)的算力瓶頸,成為AI硬件的首選。這一契機(jī)才使得英偉達(dá)能夠在數(shù)據(jù)中心的硬件版圖上站穩(wěn)腳跟,當(dāng)然,英偉達(dá)的野心遠(yuǎn)不止于此。
英偉達(dá)最主要的布局就在于2019年3月,花費(fèi)69億美元收購(gòu)了以色列芯片公司Mellanox,而這家公司所擅長(zhǎng)的正是為服務(wù)器、存儲(chǔ)和超融合基礎(chǔ)設(shè)施提供包括以太網(wǎng)交換機(jī)、芯片和InfiniBand智能互連解決方案在內(nèi)的大量的數(shù)據(jù)中心產(chǎn)品。而英偉達(dá)的GPU與Mellanox的互連技術(shù)結(jié)合,可以使得數(shù)據(jù)中心工作負(fù)載將在整個(gè)計(jì)算、網(wǎng)絡(luò)和存儲(chǔ)堆棧中得以優(yōu)化,并能實(shí)現(xiàn)更高的性能、更高的利用率和更低的運(yùn)營(yíng)成本。
當(dāng)時(shí),黃仁勛把Mellanox的技術(shù)看作是公司的“X因素”,也就是把數(shù)據(jù)中心改造成一個(gè)可以解決高性能計(jì)算要求的大型處理器架構(gòu)。而如今我們看到DPU的出現(xiàn),已經(jīng)是具有這一架構(gòu)雛形的一種嘗試了。
今年,英偉達(dá)花費(fèi)400億美金的天價(jià)從軟銀手中收購(gòu)半導(dǎo)體設(shè)計(jì)公司ARM,其意圖之一就是要把ARM架構(gòu)的CPU設(shè)計(jì)應(yīng)用到英偉達(dá)所要搭建的未來(lái)計(jì)算模式中,主要布局的領(lǐng)域就有超算、自動(dòng)駕駛和邊緣計(jì)算模式。其中,基于英偉達(dá)GPU的AI運(yùn)算平臺(tái)與ARM的生態(tài)系統(tǒng)結(jié)合,將不僅能夠強(qiáng)化英偉達(dá)高性能運(yùn)算(HPC)技術(shù)能力,又可以帶動(dòng)英偉達(dá)數(shù)據(jù)中心業(yè)務(wù)營(yíng)收持續(xù)創(chuàng)高。
可以說(shuō),英偉達(dá)在數(shù)據(jù)中心領(lǐng)域的成功與否,都與能否實(shí)現(xiàn)數(shù)據(jù)中心的規(guī)?;\(yùn)算有關(guān),從發(fā)展自研的DGX系列服務(wù)器到整合Mellanox的技術(shù),再到借助ARM生態(tài)發(fā)展全新的數(shù)據(jù)中心計(jì)算架構(gòu),都是為轉(zhuǎn)型數(shù)據(jù)中心業(yè)務(wù)所作的準(zhǔn)備。
當(dāng)然,想要實(shí)現(xiàn)這一目標(biāo),還要看下英特爾是否答應(yīng)了。
三、英偉達(dá)挑戰(zhàn)英特爾,距離還有多遠(yuǎn)
目前來(lái)說(shuō),數(shù)據(jù)中心當(dāng)中,95%左右的GPU仍然還是連接到x86 的CPU之上,英偉達(dá)如果單純只是做GPU的增量,仍然無(wú)法撼動(dòng)英特爾在數(shù)據(jù)中心服務(wù)器的霸主地位?,F(xiàn)在,英偉達(dá)顯然已經(jīng)不滿足于抓住增量市場(chǎng),而是更希望能切入數(shù)據(jù)中心的存量市場(chǎng),即設(shè)法用自己的芯片產(chǎn)品去取代英特爾(以及AMD)主導(dǎo)的X86 CPU。
自從英偉達(dá)開(kāi)始收購(gòu)ARM,外界能夠看到英偉達(dá)已經(jīng)多次顯示出其試圖利用ARM處理器進(jìn)一步占領(lǐng)數(shù)據(jù)中心服務(wù)器市場(chǎng)的決心,而集成了ARM核心的DPU將成為其打入數(shù)據(jù)中心存量市場(chǎng)取代X86 CPU的第一個(gè)切入點(diǎn)。
英偉達(dá)推出DPU來(lái)切入這個(gè)市場(chǎng),而非直接用ARM核心CPU來(lái)與X86 CPU直接競(jìng)爭(zhēng),其實(shí)是一種比較討巧的做法,相當(dāng)于用集成了網(wǎng)絡(luò)、存儲(chǔ)、安全等任務(wù)的下一代CPU產(chǎn)品來(lái)達(dá)到逐漸替換CPU的目的,即使其中所內(nèi)涵的ARM CPU性能無(wú)法對(duì)標(biāo)同一代的X86 CPU,但是整體機(jī)由于在DPU SoC上集成了專用的處理加速模塊,因此總體性能一定是超過(guò)X86 CPU的。這種有點(diǎn)“田忌賽馬”味道的策略,很可能成為英偉達(dá)開(kāi)始替代低端X86 CPU的開(kāi)始。
但是英偉達(dá)想要在中高端處理器市場(chǎng)來(lái)挑戰(zhàn)英特爾,還要面臨一系列的困難。
首先,正是英偉達(dá)的GPU與X86 CPU已經(jīng)形成一種非常穩(wěn)定的強(qiáng)互補(bǔ)關(guān)系。英偉達(dá)想要采用基于ARM架構(gòu)的處理器做高端服務(wù)器,還需要ARM處理器性能出現(xiàn)大幅的提升,而現(xiàn)在,這一進(jìn)程并不明朗。
再一個(gè)是英特爾早已為應(yīng)對(duì)英偉達(dá)的種種挑戰(zhàn)進(jìn)行了相應(yīng)的回應(yīng)和布局。早在2017年,英特爾就宣布要開(kāi)發(fā)全棧的GPU產(chǎn)品組合,而預(yù)計(jì)明年英特爾的首批GPU將在使用GPU的各個(gè)市場(chǎng)上發(fā)布。
為阻擊英偉達(dá)在AI計(jì)算和自動(dòng)駕駛領(lǐng)域的擴(kuò)張,英特爾也先后收購(gòu)了收購(gòu)了Nervana和Movidius作為邊緣AI計(jì)算的布局,收購(gòu)了Mobileye作為自動(dòng)駕駛的布局。并且,英特爾還在2018年宣布,將開(kāi)發(fā)一個(gè)用于異構(gòu)計(jì)算的全棧開(kāi)放軟件生態(tài)系統(tǒng)OpenAPI計(jì)劃,來(lái)應(yīng)對(duì)CUDA生態(tài)的擴(kuò)張。也就是說(shuō),英特爾不僅在英偉達(dá)的后院搞事情,同時(shí)也在建立自身的X86服務(wù)器的生態(tài)系統(tǒng)。
數(shù)據(jù)中心業(yè)務(wù)對(duì)于英特爾來(lái)說(shuō),也正在成為其最核心的業(yè)務(wù)組成。2019年Q4英特爾的數(shù)據(jù)中心業(yè)務(wù)超越PC業(yè)務(wù),成為其收入的主要來(lái)源;而在今年,英特爾對(duì)其技術(shù)組織和執(zhí)行團(tuán)隊(duì)的重組,也被外界視為全面轉(zhuǎn)型數(shù)據(jù)中心業(yè)務(wù)的開(kāi)始。
可以想見(jiàn)在未來(lái)的數(shù)據(jù)中心處理器業(yè)務(wù)上,英偉達(dá)將迎來(lái)英特爾最為強(qiáng)勁的保衛(wèi)戰(zhàn)和反擊戰(zhàn),而廣大的服務(wù)器集成商或?qū)⒊蔀檫@場(chǎng)角力賽的受益方。
螳螂捕蟬,黃雀在后,英偉達(dá)還要面對(duì)ADM這一新對(duì)手的追趕。不久前ADM曝出要花費(fèi)300億美金收購(gòu)賽靈思,就被看作是叫板英特爾,阻擊英偉達(dá)的雙戰(zhàn)略。
除此之外,英偉達(dá)還要在數(shù)據(jù)中心處理器業(yè)務(wù)中面臨來(lái)自客戶自研芯片的挑戰(zhàn)。云服務(wù)商本身也不愿意完全將自身的計(jì)算核心完全交給英偉達(dá),無(wú)論是AWS、還是谷歌、阿里巴巴、華為,都已經(jīng)在布局自己的云端處理器。
不管怎么說(shuō),數(shù)據(jù)中心已經(jīng)成為英特爾、英偉達(dá)、AMD這些老牌芯片巨頭未來(lái)爭(zhēng)奪的主戰(zhàn)場(chǎng),而英偉達(dá)如何能夠在X86的如日中天和云計(jì)算客戶的自研路線中,找到一個(gè)切入到中高端服務(wù)器處理器的關(guān)鍵點(diǎn),剛剛發(fā)布的DPU也只能算作一個(gè)初步的嘗試。
未來(lái)數(shù)據(jù)中心的博弈,將圍繞AI、超算等所有領(lǐng)域全面展開(kāi),英偉達(dá)數(shù)據(jù)中心在強(qiáng)敵夾擊中必定任重而道遠(yuǎn)。