當(dāng)前位置:首頁(yè) > 中國(guó)芯 > 動(dòng)態(tài)報(bào)道
[導(dǎo)讀]AI的紛爭(zhēng)越來(lái)越激烈,老黃跟蘇媽都相繼推出了自家的AI加速器。不過(guò)大家似乎忘記了還有一個(gè)芯片巨頭——Intel。

AI的紛爭(zhēng)越來(lái)越激烈,老黃跟蘇媽都相繼推出了自家的AI加速器。不過(guò)大家似乎忘記了還有一個(gè)芯片巨頭——Intel。

在美國(guó)亞利桑那州Intel Vision 2024會(huì)議上,Intel發(fā)布性能最強(qiáng)的新一代Gaudi3 AI 加速芯片。當(dāng)然,也包括全新的下一代英特爾至強(qiáng)6處理器等產(chǎn)品。


性能超越H100!老黃的勁敵來(lái)了 一文了解Intel最新Gaudi 3 AI加速芯片

不過(guò),我們今天的重點(diǎn)還是看看這個(gè)號(hào)稱“超越H100”的Gaudi3 AI 加速芯片。

Intel的Gaudi AI加速芯片已經(jīng)推出了三代了,現(xiàn)有的Gaudi2芯片已經(jīng)是兩年前的產(chǎn)物,在2023年7月才正式引入國(guó)內(nèi),不錯(cuò)的性能與性價(jià)比一度成為不少大廠的優(yōu)選。


性能超越H100!老黃的勁敵來(lái)了 一文了解Intel最新Gaudi 3 AI加速芯片

從下圖可以看到,Gaudi2 AI芯片為臺(tái)積電7nm工藝制造,集成24個(gè)可編程的Tenor張量核心(TPC)、48MB SRAM緩存、21個(gè)10萬(wàn)兆內(nèi)部互連以太網(wǎng)接口(ROCEv2 RDMA)、96GB HBM2E高帶寬內(nèi)存(總帶寬2.4TB/s)、多媒體引擎等,支持PCIe 4.0 x16,最高功耗800W。


性能超越H100!老黃的勁敵來(lái)了 一文了解Intel最新Gaudi 3 AI加速芯片

而全新一代的Gaudi3 AI芯片顯然更勝一籌,專為高性能、高效率的生成式 AI 計(jì)算而生。其采用臺(tái)積電5nm工藝打造,每個(gè)加速器都具有獨(dú)特的異構(gòu)計(jì)算引擎,由64個(gè)AI定制和可編程TPC和8個(gè)MME組成,支持128GB HBMe2內(nèi)存以及配備96MB SRAM緩存。

相比上代產(chǎn)品,Intel的 Gaudi 3帶來(lái)了4倍的BF16 AI計(jì)算能力提升,1.5 倍的內(nèi)存帶寬以及 2 倍的網(wǎng)絡(luò)帶寬提升。


性能超越H100!老黃的勁敵來(lái)了 一文了解Intel最新Gaudi 3 AI加速芯片

同時(shí),每個(gè)Gaudi 3當(dāng)中都集成24個(gè)200 Gb以太網(wǎng)端口,提供靈活且開(kāi)放標(biāo)準(zhǔn)的網(wǎng)絡(luò)。而Gaudi 3 的PCIe 功率為600w,帶寬為每秒 3.7TB。


性能超越H100!老黃的勁敵來(lái)了 一文了解Intel最新Gaudi 3 AI加速芯片

當(dāng)然,AI芯片最重要的還是性能表現(xiàn),在AI模型算力中,相比NVIDIA的H100 GPU,Gaudi3 AI芯片的模型訓(xùn)練速度、推理速度都更出色,分別提升了40%和50%,平均性能提升達(dá)到了50%,能效更是提高了40%,更重要的是,Gaudi3 AI芯片的成本比H100更低,妥妥的性能更強(qiáng),價(jià)格更低。


性能超越H100!老黃的勁敵來(lái)了 一文了解Intel最新Gaudi 3 AI加速芯片


性能超越H100!老黃的勁敵來(lái)了 一文了解Intel最新Gaudi 3 AI加速芯片

即使是面對(duì)NVIDIA的H200 GPU,Gaudi 3也毫不遜色。在LLAMA-7B以及LLAMA-70B的部分場(chǎng)景與H200基本是伯仲之間,差距基本在10%以內(nèi)。如果是在Faicon 180B的大模型里,Gaudi 3的推理吞吐量和能效則非常出色,最高甚至可以領(lǐng)先H200 30%以上。


性能超越H100!老黃的勁敵來(lái)了 一文了解Intel最新Gaudi 3 AI加速芯片


性能超越H100!老黃的勁敵來(lái)了 一文了解Intel最新Gaudi 3 AI加速芯片

性能表現(xiàn)想必已經(jīng)足夠驚艷你了,Intel還為Gaudi 3提供多種靈活的形態(tài),包括OAM兼容夾層卡、通用基板、PCIe擴(kuò)展卡。其中OAM的型號(hào)是HL-325L,其實(shí)就是單顆Gaudi 3的性能表現(xiàn),TDP設(shè)定為900W,一般用于風(fēng)冷型服務(wù)器。


性能超越H100!老黃的勁敵來(lái)了 一文了解Intel最新Gaudi 3 AI加速芯片

更高端的HLB-325則包含八顆 Gaudi 3芯片,提供 14.6 PFLOPS FP8 性能,1TB帶寬速率達(dá) 29.6TB/s的HBM2e 內(nèi)存,64個(gè)線性計(jì)算引擎,192條200GbE 網(wǎng)絡(luò)總線,9.6TB/s吞吐能力。


性能超越H100!老黃的勁敵來(lái)了 一文了解Intel最新Gaudi 3 AI加速芯片

當(dāng)然,還有更加精致小巧的版本,適合普通用戶選用。PCIe 版本型號(hào)為 HL-338,提供單卡 1835 TFLOPS FP8 峰值性能,128GB HBM2e 內(nèi)存,8個(gè)線性計(jì)算引擎,24條200GbE網(wǎng)絡(luò)總線,600W TDP,整張卡僅有兩槽寬。


性能超越H100!老黃的勁敵來(lái)了 一文了解Intel最新Gaudi 3 AI加速芯片

硬件夠硬,軟件也要夠軟。軟件生態(tài)方面,Intel也在發(fā)力,Gaudi 3將針對(duì)生成式AI提供端到端全棧AI軟件解決方案,包括嵌入式軟件、軟件套件、AI軟件、AI應(yīng)用等。


性能超越H100!老黃的勁敵來(lái)了 一文了解Intel最新Gaudi 3 AI加速芯片

Gaudi 3 AI加速芯片兼具高性能、經(jīng)濟(jì)實(shí)用、節(jié)能、可快速部署等優(yōu)點(diǎn),能夠充分滿足復(fù)雜性、成本效益、碎片化、數(shù)據(jù)可靠性、合規(guī)性等AI應(yīng)用需求。


性能超越H100!老黃的勁敵來(lái)了 一文了解Intel最新Gaudi 3 AI加速芯片

Intel在Vision 2024上也同步介紹了這款芯片的生產(chǎn)節(jié)點(diǎn),計(jì)劃在今年第三季度向客戶發(fā)貨Gaudi 3 AI芯片,包括聯(lián)想、惠普、Dell和Supermicro等OEM廠商都會(huì)使用這款新品構(gòu)建系統(tǒng)。


性能超越H100!老黃的勁敵來(lái)了 一文了解Intel最新Gaudi 3 AI加速芯片

隨著Gaudi 3的正式發(fā)布,當(dāng)前AI芯片市場(chǎng)呈現(xiàn)出NVIDIA B200、AMD MI300系列和Intel Gaudi 3三足鼎立的格局。

Intel希望能夠利用長(zhǎng)期的 AI 技術(shù)積累,通過(guò)開(kāi)放生態(tài)系統(tǒng)的力量以及出色的Gaudi 3硬件基礎(chǔ),乘上AI的熱潮。

此次的Gaudi 3 AI加速芯片雖然有著出色的性能與極具競(jìng)爭(zhēng)力的定價(jià),不過(guò)AI領(lǐng)域繞不開(kāi)的還有生態(tài),這方面NVIDIA依舊是遙遙領(lǐng)先與紅藍(lán)兩家,現(xiàn)在AMD與Intel在硬件層面已經(jīng)追上來(lái)了,在軟件層面我們也期待它們能夠持續(xù)進(jìn)步,讓AI新技術(shù)普及、普惠到各行各業(yè)。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉