NVIDIA GB200 CPU+GPU超級芯片功耗2700W!液冷狂歡開始
7月31日消息,集邦咨詢發(fā)布報(bào)告稱,隨著AI服務(wù)器算力、功耗同步與日俱增,尤其是NVIDIA將在年底推出的下一代Blackwell平臺功耗急劇增加,液冷散熱方案將逐漸普及,今年底的滲透率可達(dá)10%。
根據(jù)調(diào)查,NVIDIA Blackwell要到2025年才會正式大規(guī)模放量,取代現(xiàn)在的Hopper平臺,成為高端主力,占整體高端產(chǎn)品的近83%。
Blackwell B200單顆芯片的功耗就高達(dá)1000W,一顆Grace CPU和兩顆Blackwell GPU組成的超級芯片GB200更是恐怖的2700W。
回顧歷史,Hopper家族的H100、H200 GPU功耗都是700W,H20只需要400W,Grace+Hopper超級芯片則是1000W。
NVIDIA HGX服務(wù)器每臺預(yù)裝8顆GPU,NVL36、NVL72服務(wù)器每臺36顆、72顆GPU,整體功耗將分別達(dá)到70千瓦、140千瓦。
據(jù)悉,NVL36服務(wù)器2024年底先上市,初期以風(fēng)冷、液冷并行方案為主;NVL72 2025年跟進(jìn),直接優(yōu)先上液冷,整體設(shè)計(jì)和散熱都復(fù)雜得多。
NVIDIA預(yù)計(jì),GB200折算NVL36的出貨量在2025年預(yù)計(jì)可達(dá)6萬臺,Blackwell GPU的總出貨量有望達(dá)到210-220萬顆。
服務(wù)器液冷主要分為水冷板(Cold Plate)、冷卻分配系統(tǒng)(Coolant Distribution Unit, CDU)、分歧管(Manifold)、快接頭(Quick Disconnect, QD)、風(fēng)扇背門(Rear Door Heat Exchanger, RDHx)等五大零部件。
其中,CDU是最關(guān)鍵的部分,負(fù)責(zé)在整個(gè)系統(tǒng)內(nèi)調(diào)節(jié)冷夜的流量,確保溫度可控。
針對NVIDIA AI服務(wù)器方案,維諦技術(shù)(Vertiv)是主力的CDU供應(yīng)商,奇鋐、雙鴻、臺達(dá)電、CoolIT等也在測試驗(yàn)證。