AI芯片公司Habana Labs發(fā)布AI訓(xùn)練芯片處理效能
以色列初創(chuàng)AI芯片公司Habana Labs發(fā)布AI訓(xùn)練芯片
1 以色列AI芯片公司Habana Labs上周宣布,推出人工智能處理器Gaudi,專供機(jī)器學(xué)習(xí)訓(xùn)練(inference)任務(wù)。公司首席執(zhí)行官David Dahan 稱Gaudi帶來了業(yè)界最高的性能,基于Gaudi訓(xùn)練系統(tǒng),可實(shí)現(xiàn)比擁有相同數(shù)量的GPU系統(tǒng)高近四倍的處理能力。 此前在2018年,
以色列AI芯片公司Habana Labs上周宣布,推出人工智能處理器Gaudi,專供機(jī)器學(xué)習(xí)訓(xùn)練(inference)任務(wù)。公司首席執(zhí)行官David Dahan 稱Gaudi“帶來了業(yè)界最高的性能”,基于Gaudi訓(xùn)練系統(tǒng),可實(shí)現(xiàn)比擁有相同數(shù)量的GPU系統(tǒng)高近四倍的處理能力。
此前在2018年,Habana Labs推出Goya推理處理器。至此Habana Labs在AI處理芯片的訓(xùn)練、推理兩端初步形成完整產(chǎn)品線。在訓(xùn)練端,Gaudi將對(duì)英偉達(dá)旗下GPU產(chǎn)品形成威脅。
Habana Labs創(chuàng)立于2016年,總部位于以色列特拉維夫,全球擁有約150名員工。官方介紹稱該公司專精于使用人工智能提升芯片處理效能,同時(shí)降低芯片成本與電力消耗。2018年11月,在英特爾旗下創(chuàng)投基金英特爾資本(Intel Capital)的領(lǐng)投下,該公司完成7500萬美元的B輪募資,迄今募資約1.2億美元。
AI計(jì)算大致分為兩個(gè)層面,首先是對(duì)模型進(jìn)行訓(xùn)練(training),整個(gè)過程可能耗時(shí)數(shù)天;之后是訓(xùn)練出的模型響應(yīng)實(shí)際請(qǐng)求,做出推理(inference)。目前,英偉達(dá)旗下的GPU(圖形處理器)占據(jù)訓(xùn)練市場(chǎng),多數(shù)推理任務(wù)則仍由傳統(tǒng)的英特爾CPU承擔(dān)。
“人工智能處理器的性能包括兩點(diǎn),計(jì)算性能和延遲?!?Habana Labs首席商務(wù)官艾坦麥地那 (Eitan Medina)認(rèn)為,,原用于通用計(jì)算的GPU和CPU,適用于人工智能計(jì)算處理時(shí),在架構(gòu)上存在“先天不足”。從性能端來看,針對(duì)AI計(jì)算的專用芯片存在優(yōu)勢(shì)。
艾坦麥地那表示,AI模型訓(xùn)練所需的計(jì)算能力每年呈指數(shù)增長(zhǎng)。因此,提高生產(chǎn)率和可擴(kuò)展性,解決數(shù)據(jù)中心和云計(jì)算對(duì)算力的迫切需求成為至關(guān)重要的任務(wù)。“為什么客戶要選擇Gaudi?第一,Gaudi給客戶提供了更強(qiáng)的處理能力,以及更好的性能功耗,第二,就是我們通過內(nèi)置RDMA以太網(wǎng)處理單元,給客戶提供了一種以前無法實(shí)現(xiàn)的可拓展能力?!?/p>
在AI訓(xùn)練中,可擴(kuò)展能力主要與網(wǎng)絡(luò)相關(guān)。在拓展性方面,Habana Labs稱,由于Gaudi處理器集成RoCE v2(RDMA over Converged Ethernet)網(wǎng)絡(luò)規(guī)范,并可搭載最多20個(gè)以太網(wǎng)接口,架構(gòu)上可幾乎實(shí)現(xiàn)無限擴(kuò)展?!芭cHabana的標(biāo)準(zhǔn)設(shè)計(jì)相比,基于GPU的系統(tǒng)依賴于專有的系統(tǒng)接口,對(duì)系統(tǒng)設(shè)計(jì)人員來說,這從本質(zhì)上限制了可擴(kuò)展性和選擇性?!?艾坦麥地那說。
Gaudi也將支持主流深度學(xué)習(xí)框架,包括谷歌開發(fā)的TensorFlow、Facebook開發(fā)的PyTorch和MXNet等。軟件端,通過Habana Labs自有的SynapseAI軟件棧對(duì)訓(xùn)練模型輸入進(jìn)行分析和優(yōu)化,其工具鏈保持開放,供客戶添加專有內(nèi)核。同時(shí),Habana Labs也添加了Linux驅(qū)動(dòng)支持。
在過去,數(shù)據(jù)中心里的計(jì)算芯片幾乎都由英特爾、英偉達(dá)等芯片大廠供應(yīng)。11年前英偉達(dá)推出了CUDA,作為用GPU做并行計(jì)算的框架體系。2012年之后的人工智能浪潮,把英偉達(dá)推到了一個(gè)獨(dú)特地位。鑒于GPU芯片在AI計(jì)算市場(chǎng)如此成功,全球不斷有公司試圖進(jìn)入,打破英偉達(dá)市場(chǎng)地位。
隨著谷歌在2016年專門為機(jī)器學(xué)習(xí)打造了TPU(張量處理器),并在自家云平臺(tái)上展現(xiàn)出獨(dú)特優(yōu)勢(shì)后,AI定制芯片層出不窮。亞馬遜AWS于2018年11月發(fā)布了公司定制設(shè)計(jì)的AI芯片AWS Inferentia,用于AI推理。華為、阿里、百度等中國(guó)科技巨頭也公布了各自AI芯片計(jì)劃。
對(duì)于市場(chǎng)競(jìng)爭(zhēng),艾坦麥地那向媒體表示,AI的應(yīng)用才剛剛開始,市場(chǎng)前景巨大,目前主旋律不是競(jìng)爭(zhēng),而是共同把蛋糕做大。
艾坦麥地那認(rèn)為,面向?qū)Ω咝阅蹵I芯片擁有剛需的數(shù)據(jù)中心領(lǐng)域,Habana Labs已經(jīng)將其產(chǎn)品組合從AI推理處理器擴(kuò)展到AI訓(xùn)練處理器,以高性能、低功耗、可擴(kuò)展、可編程等特性,提供又一種新的云端AI芯片選擇。他預(yù)計(jì),在未來的人工智能計(jì)算應(yīng)用上,Habana Labs旗下產(chǎn)品可從CPU和GPU中獲得一定市常