當(dāng)前位置:首頁 > 廠商動(dòng)態(tài) > 廠商文章
[導(dǎo)讀]世界頂級(jí)服務(wù)器制造商和云服務(wù)提供商即將推出 HGX H200 系統(tǒng)與云實(shí)例

丹佛 - SC23 - 太平洋時(shí)間 2023 年 11 月 13 日 - NVIDIA 于今日宣布推出 NVIDIA HGX? H200,為 Hopper 這一全球領(lǐng)先的 AI 計(jì)算平臺(tái)再添新動(dòng)力。NVIDIA HGX H200 平臺(tái)基于 NVIDIA Hopper? 架構(gòu),搭載 NVIDIA H200 Tensor Core GPU 和領(lǐng)先的顯存配置,可處理生成式 AI 與高性能計(jì)算工作負(fù)載的海量數(shù)據(jù)。

NVIDIA H200 是首款采用 HBM3e 的 GPU,其運(yùn)行更快、更大的顯存容量將進(jìn)一步加速生成式 AI 與大語言模型,同時(shí)推進(jìn)用于 HPC 工作負(fù)載的科學(xué)計(jì)算。憑借 HBM3e,NVIDIA H200 能夠提供傳輸速度達(dá) 4.8 TB/秒的 141GB 顯存。與上一代架構(gòu)的 NVIDIA A100 相比,其容量幾乎翻了一倍,帶寬也增加了 2.4 倍。

全球領(lǐng)先的服務(wù)器制造商和云服務(wù)提供商預(yù)計(jì)于 2024 年第二季度開始提供搭載 H200 的系統(tǒng)。

NVIDIA 超大規(guī)模和高性能計(jì)算副總裁 Ian Buck 表示:“想要通過生成式 AI 和 HPC 應(yīng)用創(chuàng)造智能,就必須使用大型、快速的 GPU 顯存來高速、高效地處理海量數(shù)據(jù)。借助 NVIDIA H200,業(yè)界領(lǐng)先的端到端 AI 超級(jí)計(jì)算平臺(tái)的速度將會(huì)變得更快,一些世界上最重要的挑戰(zhàn),都可以被解決?!?

持續(xù)的創(chuàng)新帶來持續(xù)的性能飛躍

與前代架構(gòu)相比,NVIDIA Hopper 架構(gòu)實(shí)現(xiàn)了前所未有的性能躍升,而 H100 持續(xù)的軟件升級(jí),包括最近發(fā)布的 NVIDIA TensorRT?-LLM 等強(qiáng)大的開源庫,都在不斷提升其性能標(biāo)準(zhǔn)。

H200 的推出將帶來進(jìn)一步的性能飛躍,比如在一個(gè) 700 億參數(shù)的 LLM —— Llama 2 上的推理速度比 H100 提高了近一倍。隨著未來軟件的持續(xù)升級(jí),H200 有望實(shí)現(xiàn)更大的性能優(yōu)勢與提升。

NVIDIA H200 的規(guī)格

NVIDIA H200 將提供四路和八路 NVIDIA HGX H200 服務(wù)器主板可選,其與HGX H100 系統(tǒng)的硬件和軟件都兼容。同時(shí)還可用于今年 8 月發(fā)布的采用 HBM3e 的 NVIDIA GH200 Grace Hopper? 超級(jí)芯片。這些配置使 H200 可以部署在各類數(shù)據(jù)中心,包括本地、云、混合云和邊緣。

在 NVIDIA NVLink? 和 NVSwitch? 高速互連技術(shù)的加持下,HGX H200 可為各種應(yīng)用工作負(fù)載提供最高的性能,包括針對(duì) 1750 億參數(shù)以上超大模型的 LLM 訓(xùn)練和推理。

八路 HGX H200 可提供超過 32 PetaFLOPS的 FP8 深度學(xué)習(xí)計(jì)算能力和 1.1TB 的聚合高帶寬內(nèi)存容量,能夠?yàn)樯墒?AI 和 HPC 應(yīng)用帶來強(qiáng)勁性能。

當(dāng)H200 與采用超高速 NVLink-C2C 互連技術(shù)的 NVIDIA Grace? CPU 搭配使用時(shí),就組成了帶有 HBM3e 的 GH200 Grace Hopper 超級(jí)芯片——專為大型 HPC 和 AI 應(yīng)用而設(shè)計(jì)的計(jì)算模塊。

使用 NVIDIA 全棧式軟件加速 AI

NVIDIA 加速計(jì)算平臺(tái)具備強(qiáng)大軟件工具支持,能夠助力開發(fā)者和企業(yè)構(gòu)建并加速從 AI 到 HPC 的生產(chǎn)就緒型應(yīng)用,包括適用于語音、推薦系統(tǒng)和超大規(guī)模推理等工作負(fù)載的 NVIDIA AI Enterprise軟件套件。

供應(yīng)情況

NVIDIA H200 將于 2024 年第二季度開始通過全球系統(tǒng)制造商和云服務(wù)提供商提供。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動(dòng)力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉