征戰(zhàn)AI市場 英偉達(dá)有幾分勝算?
日前,圖形芯片廠商英偉達(dá)發(fā)布了季度營收創(chuàng)6年最大增幅的財(cái)報(bào),并拉動(dòng)其股價(jià)盤后飆升14%而引發(fā)業(yè)內(nèi)的關(guān)注。加之此前,其CEO黃仁勛宣稱英偉達(dá)已經(jīng)是一家AI(人工智能)芯片公司,頗有趕AI風(fēng)口的意味。業(yè)內(nèi)紛紛看好其在芯片,尤其是AI芯片的市場表現(xiàn)。但事實(shí)真的如此嗎?
我們先看看這個(gè)季度英偉達(dá)的財(cái)報(bào)表現(xiàn)??偁I收20億美元,同比增長53.6%。其中圖形芯片部門的營收在其總營收中占比85%,同比增長52.9%,為17億美元;數(shù)據(jù)中心業(yè)務(wù)同比增長兩倍,為2.4億美元;汽車業(yè)務(wù)同比增長60.8%,為1.27億美元。
從營收的構(gòu)成上不難看出,支撐英偉達(dá)的核心業(yè)務(wù)依舊是傳統(tǒng)PC市場的圖形芯片(獨(dú)立顯卡),而涉及到AI相關(guān)領(lǐng)域或者是與AI密切相關(guān)(例如數(shù)據(jù)中心)業(yè)務(wù)的營收僅占到其總營收的1/10左右。所以僅從營收看,英偉達(dá)遠(yuǎn)稱不上是一家AI芯片公司。而事實(shí)是,目前AI是產(chǎn)業(yè)競相追逐的熱點(diǎn),曾經(jīng)包括現(xiàn)在依然是傳統(tǒng)PC產(chǎn)業(yè)獨(dú)立顯卡(顯示芯片)的英偉達(dá)搖身一變成為AI公司自然會(huì)吸引不少的眼球。從這個(gè)意義看,我們不排除英偉達(dá)有借助AI風(fēng)口炒作和夸大自己芯片作用的成分。
當(dāng)然,我們?cè)诖瞬⒎欠裾J(rèn)AI芯片(支持AI應(yīng)用和功能)將是未來芯片產(chǎn)業(yè)的發(fā)展趨勢。尤其是谷歌人工智能軟件AlphaGo利用深度學(xué)習(xí)技術(shù)擊敗全球頂尖圍棋選手李世石,預(yù)示著人工智能將是科技行業(yè)和大佬們競爭的下一個(gè)熱點(diǎn)。而大數(shù)據(jù)和物聯(lián)網(wǎng)的發(fā)展促使IBM、谷歌、Facebook、微軟等在內(nèi)的科技巨頭和許多大型的提供云服務(wù)的云計(jì)算公司競相開發(fā)人工智能技術(shù),以期利用未來物聯(lián)網(wǎng)設(shè)備收集的海量數(shù)據(jù)(分析)為市場和用戶提供更好的服務(wù)。
需要說明的是,盡管各家廠商叫法不同,例如IBM稱之為認(rèn)知計(jì)算,F(xiàn)acebook和谷歌稱之為機(jī)器學(xué)習(xí)或人工智能,但作為支撐這些技術(shù)和應(yīng)用的數(shù)據(jù)中心基礎(chǔ)硬件之一的芯片依然扮演者重要的角色。
基于此種趨勢,據(jù)相關(guān)統(tǒng)計(jì),目前運(yùn)行在包括IBM、谷歌、Facebook、亞馬遜、微軟等大佬們和云計(jì)算公司的數(shù)據(jù)中心(服務(wù)器)至少有10%左右的工作負(fù)載與AI應(yīng)用有關(guān)(或自己開發(fā)相關(guān)的AI應(yīng)用或支持和運(yùn)行客戶的AI開發(fā)及應(yīng)用等),且隨著市場和用戶對(duì)于AI的需求,這種趨勢未來還會(huì)擴(kuò)大。
而這種趨勢對(duì)于數(shù)據(jù)中心的基礎(chǔ)芯片計(jì)算能力和功耗提出了新的挑戰(zhàn),英偉達(dá)此前一直專攻的GPU(圖形芯片)具備有天然的優(yōu)勢。例如AI所需的大規(guī)模并行運(yùn)算能力;同等面積下,GPU上擁有更多的運(yùn)算單元(整數(shù)、浮點(diǎn)的乘加單元,特殊運(yùn)算單元等);GPU擁有更大帶寬的 Memory,因此在大吞吐量的應(yīng)用中也會(huì)有很好的性能;GPU對(duì)能源的需求遠(yuǎn)遠(yuǎn)低于CPU等。
盡管如此,這并不代表上述大佬們的數(shù)據(jù)中心(服務(wù)器)對(duì)CPU沒有需求。相反,CPU依然是計(jì)算任務(wù)不可或缺的一部分,在深度學(xué)習(xí)算法處理任務(wù)中還需要高性能的CPU來執(zhí)行指令并且和GPU進(jìn)行數(shù)據(jù)傳輸,同時(shí)發(fā)揮CPU的通用性和GPU的復(fù)雜任務(wù)處理能力,才能達(dá)到最好的效果,這也是為何目前大多數(shù)企業(yè)采用的依然是“CPU+GPU”的組合,或者稱為異構(gòu)計(jì)算。
在這種異構(gòu)模式下,應(yīng)用程序的串行部分在CPU上運(yùn)行,而GPU作為協(xié)處理器,主要負(fù)責(zé)需要大量計(jì)算的部分。從這個(gè)角度看,缺乏CPU應(yīng)該是英偉達(dá)在現(xiàn)在和未來自詡為AI公司始終存在的短板。
既然提到CPU,自然就會(huì)聯(lián)想到此領(lǐng)域的老大英特爾,它既是英偉達(dá)成為AI芯片公司在CPU上無法跨域的屏障,即便是在其擅長的能夠滿足上述大佬AI需求的GPU上也是最大的挑戰(zhàn)者。
這種挑戰(zhàn)首先體現(xiàn)在英特爾對(duì)于CPU計(jì)算能力的創(chuàng)新挖潛上。例如其日前發(fā)布的用于數(shù)據(jù)中心服務(wù)器的Xeon Phi芯片。據(jù)英特爾的相關(guān)報(bào)告顯示,Xeon Phi處理器的訓(xùn)練速度比英偉達(dá)的GPU快了2.3倍、Xeon Phi芯片在多個(gè)節(jié)點(diǎn)的擴(kuò)展路為38%,且最多可達(dá)128個(gè)節(jié)點(diǎn),這是目前市面上的GPU無法辦到的。同時(shí),由128Xeon Phi處理器組成的系統(tǒng)要比單個(gè)Xeon Phi處理器快50倍,意旨Xeon Phi處理器的擴(kuò)展性優(yōu)勢明顯,而這對(duì)于滿足AI的應(yīng)用至關(guān)重要。
不過,針對(duì)英特爾的說法,英偉達(dá)提出了強(qiáng)烈的反駁,并指出英特爾使用的是18個(gè)月前的數(shù)據(jù),比較的是四個(gè)Maxwell GPU和四個(gè)Xeon Phi處理器。如果使用更新的Caffe AlexNet數(shù)據(jù),就會(huì)發(fā)現(xiàn)四個(gè)Maxwell GPU比四個(gè)Xeon Phi處理器的速度快30%。我們這里姑且不論誰的說法更接近客觀,但從雙方對(duì)于報(bào)告的口水戰(zhàn)看,至少說明天然不占優(yōu)勢的CPU還是大有潛力可挖,至少從CPU本身,英特爾就可以縮小與英偉達(dá)的差距,或者說給英偉達(dá)帶來壓力。
另外,從單純滿足AI應(yīng)用本身的計(jì)算能力和實(shí)現(xiàn)方法上看,GPU是否是最好或者說是惟一在業(yè)內(nèi)依然存在爭議。有研究人員測試,相比GPU,F(xiàn)PGA的架構(gòu)更靈活,單位能耗下性能更強(qiáng)。深度學(xué)習(xí)算法在FPGA上能夠更快、更有效地運(yùn)行,而且功耗也能做到更低。
這似乎很好地解釋了為何英特爾此前以167億美元收購FPGA制造商Altera的原因。而提及并購,還有一樁被業(yè)內(nèi)認(rèn)為英特爾可以借此提升自身在AI芯片競爭力,甚至有可能超越英偉達(dá)的就是對(duì)于專攻AI芯片的Nervana Systems公司的并購。據(jù)稱,Nervana Systems研究的深度學(xué)習(xí)芯片具有性價(jià)比高于GPU,處理速度是 GPU 的10倍等特點(diǎn)。
為了說明Nervana Systems公司的實(shí)力或者說對(duì)于英偉達(dá)的威脅,我們不妨介紹一段Nervana Systems被并購的插曲。據(jù)稱,英特爾在接觸Nervana談?wù)摮鍪凼乱藭r(shí),Nervana認(rèn)為英偉達(dá)是合理的選擇之一,因?yàn)镹ervana的深度學(xué)習(xí)軟件Neon也可以運(yùn)行在英偉達(dá)芯片上,可以幫助英偉達(dá)補(bǔ)齊短板。然而,英偉達(dá)對(duì)Nervana并不感冒,認(rèn)為自己基于GPU的深度學(xué)習(xí)技術(shù)要好于Nervana,但當(dāng)Nervana與英特爾達(dá)成交易之后,英偉達(dá)似乎改變了想法,并試圖重啟收購談判,無奈的是機(jī)會(huì)已經(jīng)錯(cuò)過。
對(duì)此,有分析認(rèn)為,讓英特爾得到Nervana是英偉達(dá)最大的失誤,因?yàn)橥ㄟ^這次收購,英特爾將得到一個(gè)用于深度學(xué)習(xí)的具體產(chǎn)品和IP,它們可被單獨(dú)使用外,也能與英特爾未來的技術(shù)融合,生產(chǎn)出更具競爭力、創(chuàng)造性的芯片產(chǎn)品。
而提到整合,則是英特爾最為擅長的,針對(duì)并購來的Nervana Systems,其可以把相關(guān)產(chǎn)品整合到芯片或者多芯片封裝中。例如把 Nervana Engine IP 加到一個(gè)至強(qiáng)CPU 中,可以提供一個(gè)低成本的方法來實(shí)現(xiàn)AI所需要的性能的加速,將 Nervana IP 產(chǎn)品化,進(jìn)而提升自己CPU的計(jì)算能力,滿足AI開發(fā)和應(yīng)用對(duì)于數(shù)據(jù)中心芯片的更高需求。