Graphcore發(fā)布第二代IPU及IPU-M2000 重新定義AI計(jì)算的未來
Graphcore 于近日正式發(fā)布第二代IPU以及用于大規(guī)模系統(tǒng)級(jí)產(chǎn)品IPU-Machine: M2000(IPU-M2000),新一代產(chǎn)品具有更強(qiáng)的處理能力、更多的內(nèi)存和內(nèi)置的可擴(kuò)展性,可處理極其龐大的機(jī)器智能工作負(fù)載。
IPU-M2000是一款即插即用的機(jī)器智能刀片式計(jì)算單元,由Graphcore全新的7納米 Colossus? 第二代 GC200 IPU提供動(dòng)力,并由Poplar?軟件棧提供全面支持。其設(shè)計(jì)便于部署,并支持可擴(kuò)展至大規(guī)模的系統(tǒng)。這款纖薄的1U刀片機(jī)可提供1個(gè)PetaFlop的機(jī)器智能計(jì)算,并集成了針對AI擴(kuò)展優(yōu)化的網(wǎng)絡(luò)技術(shù)。
Graphcore第二代Colossus? IPU處理器:GC200
IPU-M2000可構(gòu)建成IPU-POD64這一Graphcore全新模塊化機(jī)架規(guī)模解決方案,可用于極大型機(jī)器智能橫向擴(kuò)展,提供前所未有的AI計(jì)算可能性,以及完全的靈活性和易于部署的特性。它可以從一個(gè)機(jī)架式本地系統(tǒng)擴(kuò)展到高度互連的超高性能AI計(jì)算設(shè)施中的1000多個(gè)IPU-POD64系統(tǒng)。
“隨著IPU-M2000和IPU-POD64的推出,Graphcore進(jìn)一步擴(kuò)大了我們在機(jī)器智能領(lǐng)域的產(chǎn)品競爭優(yōu)勢?!? Graphcore首席執(zhí)行官Nigel Toon 指出:“Graphcore通過技術(shù)創(chuàng)新實(shí)現(xiàn)更強(qiáng)有力的產(chǎn)品線,這些創(chuàng)新能夠提供客戶所期望的行業(yè)領(lǐng)先性能。對于尋求將機(jī)器智能計(jì)算添加到數(shù)據(jù)中心的客戶而言,Graphcore最新推出的IPU-M2000憑借其強(qiáng)大的算力、易于擴(kuò)展的靈活性和突出的易用性,將具有極強(qiáng)的可行性和價(jià)值提升潛力。”
Graphcore IPU-M2000
Mk1 IPU產(chǎn)品的用戶可以確信,他們現(xiàn)有的模型和系統(tǒng)可以在這些新的Mk2 IPU系統(tǒng)上無縫運(yùn)行。雖然第一代Graphcore IPU產(chǎn)品已經(jīng)處于領(lǐng)先地位,但與之相比,第二代產(chǎn)品的性能還將提高8倍。
IPU-M2000的設(shè)計(jì)使客戶可以在IPU-POD?配置中構(gòu)建多達(dá)64,000個(gè)IPU的數(shù)據(jù)中心規(guī)模系統(tǒng),提供16ExaFlops的機(jī)器智能計(jì)算能力。新的IPU-M2000甚至能夠處理最艱巨的機(jī)器智能訓(xùn)練或大規(guī)模部署工作負(fù)載。
Graphcore全新的IPU-Fabric?技術(shù)使大規(guī)模連接IPU-M2000和IPU-POD成為可能,該技術(shù)是專為機(jī)器智能通信而從頭設(shè)計(jì)的,并提供了專用的低時(shí)延結(jié)構(gòu),可在整個(gè)數(shù)據(jù)中心內(nèi)連接IPU。
Graphcore的Virtual-IPU軟件與工作量管理和編排軟件集成在一起,可以輕松地為許多不同的用戶提供訓(xùn)練和推理服務(wù),并允許根據(jù)工作情況調(diào)整和重新配置可用的資源。
無論您是要使用單個(gè)IPU還是要使用數(shù)千個(gè)IPU來完成機(jī)器智能工作負(fù)載,Graphcore的Poplar SDK都可以使這一過程變得簡單。您可以使用首選的AI框架(例如TensorFlow或PyTorch)。而且,從這一高級(jí)描述中,Poplar將構(gòu)建完整的計(jì)算圖,以捕獲計(jì)算、數(shù)據(jù)和通信。然后,它會(huì)充分利用可用的IPU硬件,編譯此計(jì)算圖,并構(gòu)建用于管理計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)通信的運(yùn)行時(shí)程序。
Mk1 IPU產(chǎn)品與Mk2 IPU產(chǎn)品性能對比
Graphcore的最新產(chǎn)品線是通過三大顛覆性技術(shù)創(chuàng)新實(shí)現(xiàn)的,這些創(chuàng)新可提供客戶期望的行業(yè)領(lǐng)先性能:
● 計(jì)算:每個(gè)IPU-M2000的核心都是Graphcore新的Graphcore Colossus?Mk2 GC200 IPU。該芯片采用臺(tái)積電最新的7納米工藝技術(shù)開發(fā),每個(gè)芯片在一個(gè)823平方毫米的裸片上包含超過594億個(gè)晶體管,使其成為有史以來最復(fù)雜的處理器。
● 數(shù)據(jù):每個(gè)IPU都有大量的In-Processor Memory?。Graphcore新型Mk2 GC200在處理器內(nèi)部具有史無前例的900MB超高速SRAM,在每個(gè)處理器內(nèi)核旁邊都設(shè)有大量RAM,以實(shí)現(xiàn)每位最低能量的訪問。Graphcore的Poplar軟件還允許IPU通過Graphcore獨(dú)特的Exchange-Memory?通信訪問Streaming Memory?。這甚至可以支持具有數(shù)千億個(gè)參數(shù)的最大模型。每個(gè)IPU-M2000都可以支持密度高達(dá)450GB的Exchange-Memory?,以及前所未有的180TB/秒的帶寬。
● 通信:IPU-M2000具有內(nèi)置的專用AI聯(lián)網(wǎng)IPU-Fabric?。Graphcore創(chuàng)建了一個(gè)新的Graphcore GC4000 IPU-Gateway芯片,該芯片可提供令人難以置信的低時(shí)延和高帶寬,每個(gè)IPU-M2000均可提供2.8Tbps。在從數(shù)十個(gè)IPU擴(kuò)展到數(shù)以萬計(jì)個(gè)IPU的過程中,IPU-Fabric技術(shù)使通信時(shí)延幾乎保持恒定。
Graphcore IPU-Fabric?技術(shù)
“將強(qiáng)勁算力與網(wǎng)絡(luò)能力相結(jié)合,我們能夠處理全球最先進(jìn)、最復(fù)雜的算法模型?!盙raphcore高級(jí)副總裁兼中國區(qū)總經(jīng)理盧濤 表示:“這樣的算法模型,對中國本地的AI算法落地場景,如云計(jì)算、互聯(lián)網(wǎng)和通信等場景都會(huì)產(chǎn)生推動(dòng)作用,并將為AI產(chǎn)業(yè)者提供巨大的價(jià)值?!?
在中國市場,Graphcore與領(lǐng)先的本地商業(yè)用戶展開緊密的早期合作,基于IPU的開發(fā)者云已于7月初正式上線,其IPU-POD產(chǎn)品技術(shù),已在IPU開發(fā)者云上供用戶訪問。因此,中國很可能成為Graphcore最新推出的第二代處理器技術(shù)最先實(shí)現(xiàn)商業(yè)化落地的區(qū)域之一。
以上努力,僅僅是Graphcore在中國市場進(jìn)行的相當(dāng)規(guī)模的投資中的一部分。Graphcore還在本地構(gòu)建了強(qiáng)有力的工程化團(tuán)隊(duì),希望與本地的AI產(chǎn)業(yè)者和AI創(chuàng)新者進(jìn)行緊密合作,以先進(jìn)科技助推中國AI創(chuàng)新。