大數(shù)據(jù)中心電源和能量使用的情況討論,第四部分
我與 Vicor 的產(chǎn)品營(yíng)銷(xiāo)和技術(shù)資源公司副總裁 Robert Gendron 就他們的數(shù)據(jù)中心戰(zhàn)略進(jìn)行了交談。我首先詢(xún)問(wèn)了在他們的架構(gòu)中使用 GaN 的情況;Vicor 已與其他 FET 一起評(píng)估了該技術(shù)。
NBM 和 DCM
他們的非隔離總線(xiàn)模塊 (NBM) 是一種雙向固定架構(gòu),將以 97.9% 的峰值效率將 48V 轉(zhuǎn)換為 12V,很快 Vicor 將推出效率達(dá)到 98.5% 的下一代版本。鑒于 NBM 的高密度(在 22.8×17.3×7.4 mm 封裝中提供 800W 連續(xù)輸出功率),他們有幾種設(shè)計(jì),其中 NBM 放置在 12V 多相穩(wěn)壓器 (VR) 前面的主板上。
他們的 DC-DC 轉(zhuǎn)換器模塊 (DCM) 是一種 48V 至 12V 的非隔離轉(zhuǎn)換器,支持仍依賴(lài)傳統(tǒng) 12V 配電的數(shù)據(jù)中心中的 48V 高性能 GPU,
Vicor 還構(gòu)建了完整的設(shè)備組合,以支持 380V、交流和傳統(tǒng) 12 種負(fù)載,從而形成一個(gè) 48V 集線(xiàn)器?!凹€(xiàn)器”可在機(jī)架內(nèi)實(shí)現(xiàn) 48V 或安全超低電壓(SELV) 配電,從而最大限度地減少損耗。從 48V 開(kāi)始,他們可以通過(guò)分比式電源解決方案直接連接到 CPU,包括橫向和垂直電源傳輸方案。他們還可以通過(guò) NBM 和 DCM 產(chǎn)品支持 12V 的傳統(tǒng)多相穩(wěn)壓器,提供 48V 至 12V 的轉(zhuǎn)換。
設(shè)計(jì)人員只需很少的設(shè)計(jì)修改即可輕松地將 12V 主板修改為 48V 機(jī)架使用。雖然它們最初是為高性能計(jì)算 (HPC) 使用而設(shè)計(jì)的。
垂直供電
隨著 GPU 的電流為 500A 并在未來(lái)達(dá)到 1,000A,再加上人工智能(在此處了解更多關(guān)于強(qiáng)大的人工智能)和深度學(xué)習(xí)進(jìn)入數(shù)據(jù)中心處理,我們需要?jiǎng)?chuàng)新的設(shè)計(jì)架構(gòu)思維來(lái)正確地服務(wù)于這些應(yīng)用程序。
處理器設(shè)計(jì)人員正在其架構(gòu)中構(gòu)建如此多的多核,以減少當(dāng)今 5G、智能家居、智能工廠等應(yīng)用的延遲。現(xiàn)在有 500W 處理器。目標(biāo)是將所有東西都放入同一個(gè)芯片中以減少延遲,出于同樣的原因,他們還希望光耦合器與處理器相鄰。
Vicor 意識(shí)到董事會(huì)的損失是巨大的。他們認(rèn)為這超過(guò)了電源解決方案中額外 1% 的效率提升。他們觀察 400 μO(píng)hm 走線(xiàn)的功率損耗,在 200A 時(shí),電路板本身有 10% 的損耗。即使效率為 99%,在 200A 電流下,電路板跡線(xiàn) I 2 R 損耗也會(huì)損失大量功率。
Vicor 的電流乘法器解決方案是設(shè)計(jì)人員為數(shù)據(jù)中心處理器供電的電源架構(gòu)解決方案的另一個(gè)絕佳選擇。
上電封裝技術(shù)可實(shí)現(xiàn)電流倍增,從而實(shí)現(xiàn)更高的效率、密度和帶寬。在封裝內(nèi)提供電流倍增可以將互連損耗降低多達(dá) 90%,同時(shí)允許回收通常用于高電流傳輸?shù)奶幚砥鞣庋b引腳以擴(kuò)展 I/O 功能。
處理器附近有“禁區(qū)”區(qū)域,因?yàn)樵肼暤瓤赡苁翘幚砥骶鹊膯?wèn)題,從而導(dǎo)致錯(cuò)誤。垂直電源模塊 (VPM) 具有非常低的噪聲拓?fù)?。英特爾大約在三年前進(jìn)行了一項(xiàng)研究,其中顏色代表紅外圖像中的噪聲,該圖像顯示處理器附近的噪聲水平可接受。
Vicor 說(shuō),在多相設(shè)計(jì)中發(fā)現(xiàn)的問(wèn)題之一是電感器/磁體非常嘈雜。Vicor 在其輸出級(jí)不使用電感器,因此噪聲水平很低,這使它們能夠直接接近處理器和 I/O 線(xiàn)路。他們?cè)谶@些架構(gòu)或測(cè)試中從未遇到過(guò)噪音問(wèn)題。
另一個(gè)問(wèn)題是大多數(shù) AI 處理器和其他超高速 GPU 處理器需要訪(fǎng)問(wèn)處理器芯片周?chē)乃兴膫€(gè)側(cè)面。數(shù)據(jù)中心和其他電子架構(gòu)一直希望電源幾乎不可見(jiàn)。因此,這些限制給這類(lèi)架構(gòu)中的電源設(shè)計(jì)人員帶來(lái)了挑戰(zhàn)。
齒輪電流倍增器架構(gòu)
Vicor 最大的努力是垂直供電 (VPD)。他們繪制了客戶(hù)對(duì) CPU、GPU 和 ASIC 峰值電流交付要求的圖表。從 2010 年開(kāi)始,峰值電流發(fā)生了明顯的變化,急劇增加。這是由于 AI 處理能力的擴(kuò)展以及 14、12、10 和現(xiàn)在的 7nm 的較低處理器制造節(jié)點(diǎn)。
電路板上提供的更多功率意味著更關(guān)注轉(zhuǎn)換器的效率以及功率分配或傳輸中的損耗。隨著功率的增加,一個(gè)問(wèn)題是轉(zhuǎn)換器的尺寸通常會(huì)增加,這意味著它們不能放置在處理器附近。這種放置問(wèn)題會(huì)在電路板上產(chǎn)生額外的損耗。
Nvidia SXM3是利用其分解電源解決方案的 AI 處理器的一個(gè)很好的例子。這種類(lèi)型的解決方案可以提供超過(guò) 1,000A 的峰值電流。鑒于這些設(shè)備的尺寸和低高度,它們可以比傳統(tǒng)類(lèi)型的 VR 更靠近處理器。
這些 I 2 R 損失會(huì)導(dǎo)致效率低下并產(chǎn)生熱量。他們繪制了 400μO(píng)hm 電路板損耗的損耗圖。您可以看到,僅在 200A 電流時(shí),電路板的效率就會(huì)降低 10%。
當(dāng)設(shè)備在橫向配置中使用時(shí),他們的分比式電源解決方案通常會(huì)減少 90% 的電路板損耗,就像在 Nvidia 解決方案中一樣。然而,隨著電流的進(jìn)一步增加,除了減小 VR 的尺寸之外,還需要進(jìn)一步減少傳輸損耗。VR 的尺寸是一個(gè)非常重要的考慮因素,因?yàn)殡S著處理器消耗更多電流并提高其計(jì)算能力,需要增加 I/O 和更快的 I/O。橫向放置在處理器(任何人的 VR)的 VR 可以阻止進(jìn)出處理器的有價(jià)值的網(wǎng)關(guān)。
這就是導(dǎo)致 Vicor 加入 VPD 的原因。它幾乎消除了所有的電力傳輸損失,并且可以在所有四個(gè)側(cè)面上不受阻礙地訪(fǎng)問(wèn)處理器。他們能夠在 VPD VR 中采用他們現(xiàn)在使用了 10 年的相同分解電源架構(gòu)。他們目前的乘法器設(shè)備已經(jīng)從 VTM 發(fā)展到 MCM,現(xiàn)在 GCM 直接放置在處理器下方。他們的 GCM 設(shè)備不僅提供電流傳輸,還包含直接位于處理器下方的關(guān)鍵旁路電容。
Vicor 最近還宣布與京瓷合作,重點(diǎn)介紹他們?nèi)绾翁峁?VR 解決方案,而京瓷如何為客戶(hù)提供處理器基板(或封裝)設(shè)計(jì)。這種合作使設(shè)計(jì)人員能夠快速利用他們的 VPD VR 解決方案。