當(dāng)前位置:首頁 > 通信技術(shù) > 通信先鋒
[導(dǎo)讀]總部位于英國的AI芯片公司Graphcore發(fā)布了新一代IPU產(chǎn)品Bow,這是其第三代IPU系統(tǒng),發(fā)布即面向客戶發(fā)貨。

總部位于英國的AI芯片公司Graphcore發(fā)布了新一代IPU產(chǎn)品Bow,這是其第三代IPU系統(tǒng),發(fā)布即面向客戶發(fā)貨。

與上一代IPU相比,Bow IPU性能提升40% ,能耗比提升了16%,電源效率也提升16%。

值得注意的是,這一次Bow IPU的性能提升并非主要依賴采用更先進的制程,Bow IPU采用了和上一代IPU相同的臺積電 7nm,通過采用和臺積電共同開發(fā)的先進硅晶圓堆疊技術(shù)(3D Wafer-on-Wafer)達到性能和能耗比的提升。

Bow作為世界首款3D WoW處理器,證明了芯片性能提升的范式從先進制程向先進封裝轉(zhuǎn)移的可行性。

新一代 IPU 性能提升40%,價格保持不變

2016年,Graphcore成立并開創(chuàng)了全新類型處理器架構(gòu)IPU,因其在架構(gòu)上的創(chuàng)新曾被英國半導(dǎo)體之父Hermann Hauser稱之為是計算機歷史上的第三次革命。

經(jīng)歷6年時間的發(fā)展,Graphcore的IPU逐漸在在金融、醫(yī)療、電信、機器人、云和互聯(lián)網(wǎng)等領(lǐng)域取得成效。本周四,Graphcore又推出了第三代產(chǎn)品Bow IPU。

據(jù)Graphcore介紹,第三代IPU相對于上一代M2000,性能提高40%,每瓦性能提升16%,即能耗比實現(xiàn)16%的提升。

不過,AI芯片的真實性能還需要放在不同的應(yīng)用領(lǐng)域中討論。為此,Graphcore也給出了在不同垂直領(lǐng)域中Bow的性能表現(xiàn)。

在圖像方面,無論是典型的CNN網(wǎng)絡(luò),還是近期比較熱門的Vision Transformer網(wǎng)絡(luò),以及深層次的文本到圖片的網(wǎng)絡(luò),與上一代產(chǎn)品相比,Bow IPU都有30%到40%的性能提升,在EfficientNet-B4這一項中,接近理論上限值。

BERT訓(xùn)練模型是自然語言方面的經(jīng)典模型,基于BERT,OpenAI提出了GPT-1、GPT-2、GPT-3等縱向擴展或橫向擴展,通過更深的網(wǎng)絡(luò)層次和更寬的網(wǎng)絡(luò)寬度讓模型的性能和精度進一步提高。

“我們可以看到,這些模型在我們最新的硬件形態(tài)上都有很大的性能提升?!盙raphcore中國工程副總裁、AI算法科學(xué)家金琛介紹道。

不僅如此,轉(zhuǎn)換到實際模型中的吞吐量,與IPU POD64相比,在計算機視覺的ResNet50 和 EifficientNet-B4 訓(xùn)練模型中,Bow Pod64的吞吐量能夠達到34%和39%的性能提升。

自然語言方面, BERT-Large Ph1 預(yù)訓(xùn)練模型和語音識別Conformer Large 訓(xùn)練模型,后者都有36%的吞吐量提升。

作為英偉達的競爭對手,Graphcore自然不忘將 Bow Pod16 與DGX-A100進行對比,實驗數(shù)據(jù)表明,EfficientNet-B4的backbone的訓(xùn)練在DGX-A100上需要花費70個小時的訓(xùn)練時間,而在Bow Pod16上,只需要14小時左右。

接近理論極限的性能提升,Graphcore Bow IPU是如何實現(xiàn)的?

5nm不再是首選,采用先進封裝性價比更高

從芯片的規(guī)格上看,Bow IPU是世界上第一款基于臺積電的 3D Wafer-On-Wafer的處理器,單個封裝中擁有超過600億個晶體管,具有350 TeraFLOPS的人工智能計算的性能,是上一代MK2 IPU的1.4倍。

片內(nèi)存儲較上一代來看沒有變化,依然保持0.9GB的容量,不過吞吐量從47.5TB提高到了65TB。

“變化主要體現(xiàn)在,它是一個3D封裝的處理器,晶體管的規(guī)模有所增加,算力和吞吐量均得到提升?!? Graphcore大中華區(qū)總裁兼全球首席營收官盧濤說道。而在大家都關(guān)注的工藝制程上,Bow IPU 延續(xù)了上一代臺積電 7nm 工藝制程,沒有變化。

理論上,一顆芯片的性能提升很大程度上取決于工藝制程上的進步,但隨著工藝制程越來越逼近物理極限,摩爾定律逐漸失效,業(yè)界不得不尋找新的技術(shù)方向來延續(xù)摩爾定律。其中,3D封裝就是被業(yè)界廣泛看好的技術(shù)方向。

中國工程院院士、浙江大學(xué)微納電子學(xué)院院長吳漢明就曾在一次演講中提到,如果將芯片制造和芯片封裝相結(jié)合,也可以做到65nm工藝制程實現(xiàn)40nm工藝制程的性能功耗要求。

Bow IPU正好驗證了吳院士的觀點。

盧濤表示,Bow IPU產(chǎn)品性能的提升主要來源于3D WoW和新增的Die。

至于為何選擇改變封裝方式而不是更先進的工藝,盧濤則表示MK2 IPU有594億個晶體管,大概823平方毫米,已經(jīng)是7nm單個Die能夠生產(chǎn)的最精密的芯片。

“我們評估從7nm、5nm,到3nm等不同工藝節(jié)點的收益時發(fā)現(xiàn),從7nm到5nm的生產(chǎn)工藝提升所帶來的收益不像以前從28nm到14nm一樣,能夠帶來百分之幾十的收益,而是降到了20%。這時候我們可以通過別的手段和方法獲得同樣的收益?!?

通過3D堆疊的方式,Bow IPU的兩個Die增加了晶體管的數(shù)量,其中一個Die(Colossus Die)和上一代一樣,另一個Die主要用于提高跨Colossus Die的電源功率傳輸,優(yōu)化Colossus Die的操作節(jié)點,從而轉(zhuǎn)化為有效的時鐘加速。

在同臺積電的合作方面,盧濤告訴雷峰網(wǎng),Graphcore在一年之前就同臺積電合作了一顆測試芯片,與臺積電的關(guān)系非常緊密,加上AI處理器本身規(guī)模較大,需要一些新技術(shù)支持落地,而從臺積電的角度而言,新的技術(shù)也需要有需求的產(chǎn)品共同推進。

值得一提的是,雖然封裝方式有所變化,但Bow IPU開箱即用,與前一代產(chǎn)品百分之百軟件兼容,不用修改任何代碼,老用戶無需做任何軟件適配工作就能獲得性能提升,價格保持不變。

目前,美國國家實驗室Pacific Northwest已經(jīng)基于Bow IPU嘗試做一些基于Transformer的模型以及圖神經(jīng)網(wǎng)絡(luò),面向計算化學(xué)和網(wǎng)絡(luò)安全方面的應(yīng)用,且給出了比較正面的反饋。

延續(xù)3D封裝,開發(fā)超越人腦的超級智能機器

Bow IPU使用3D封裝只是起點,面向未來,Graphcore正在開發(fā)一款可以用來超越人腦處理的超級智能機器。

Graphcore將這款正在研發(fā)的產(chǎn)品命名為Good Computer,一方面希望計算機能夠為這個世界帶來正面的影響,另一方面致敬著名計算機科學(xué)家Good。

基于3D WoW,預(yù)計未來Good Computer將包含8192個IPU,提供超過10 Exa-Flops的AI算力,實現(xiàn)4 PB的存儲,可以助力超過500萬億參數(shù)規(guī)模的人工智能模型的開發(fā)。

取決于不同的配置,Good Computer價格將在100萬美元到1.5億美元之間。

盧濤表示,開發(fā)Good Computer還是會沿用IPU的體系結(jié)構(gòu),IPU的存儲是在處理器里面,雖然不叫類腦、內(nèi)存計算或存算一體,但從某種程度上而言,IPU的運作機理接近大腦計算的工作原理,只是把計算和存儲相結(jié)合。

另外,Graphcore也將從軟件方面更有效支持稀疏化以達到類腦的計算量。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉