英偉達擔心單一GPU架構(gòu)會逐漸失去計算優(yōu)勢：今年將加大GPU供應(yīng)

時間：2022-01-10 10:04:35

關(guān)鍵字：英偉達 CFO GPU

手機看文章

掃描二維碼
隨時隨地手機看文章

[導讀]英偉達的GPU現(xiàn)在可以買到的價格依然和官方定價相去甚遠。CES 2022上，NVIDIA發(fā)布了新卡，包括30系列中最便宜(1899元)的RTX 3050、RTX 3080 12GB、RTX 3070 Ti 16GB等以及筆記本高端GPU(RTX 3080 Ti/3070 Ti)，那么大伙能否原價買到呢?

英偉達的GPU現(xiàn)在可以買到的價格依然和官方定價相去甚遠。CES 2022上，NVIDIA發(fā)布了新卡，包括30系列中最便宜(1899元)的RTX 3050、RTX 3080 12GB、RTX 3070 Ti 16GB等以及筆記本高端GPU(RTX 3080 Ti/3070 Ti)，那么大伙能否原價買到呢?

雖然NVIDIA沒有正面回應(yīng)，但公司CFO Colette Kress在本周小摩舉辦的科技峰會上表示，他相信在2022自然年，NVIDIA會有非常好的供貨局面，足以應(yīng)對市場需求?？赡馨凳鞠掳肽暌l(fā)新卡，比如RTX 40系列，Kress指出，事實上我們已經(jīng)和伙伴一道，就下半年的產(chǎn)能緊密協(xié)作了。此前有消息稱，進入1月份之后，RTX 30系列的供貨情況將會大為改善，預(yù)計比12月份增加大約15%。對于NVIDIA來說，除了桌面顯卡，還要兼顧筆記本市場，希望Kress此番表態(tài)說話算數(shù)吧。

1 月 7 日消息，今日英偉達正式推出第 4 代 Max-Q 技術(shù)，讓輕薄游戲本和設(shè)計本擁有更出色性能，提供更長的續(xù)航時間。

官方表示，游戲玩家和創(chuàng)作者對筆記本電腦的性能期望與日俱增，對時尚外觀和長效續(xù)航的追求也不會松懈。為此，英偉達繼續(xù)發(fā)展 Max-Q 技術(shù)，注重能效，優(yōu)化 CPU 和 GPU 性能釋放。

第 4 代 Max-Q 第一項技術(shù)名為 CPU Optimizer 智能協(xié)作。該功能可以讓 GPU 進一步優(yōu)化 CPU 性能、溫度和功率，使 CPU 能效得以提升，在需要時可以將功率轉(zhuǎn)移給 GPU，以實現(xiàn)更佳游戲性能。

第二項技術(shù)是 Rapid Core Scaling 智能核心優(yōu)化，可以使 GPU 能實時感知應(yīng)用的當前需求，并僅使用所需數(shù)量的核心。這樣可以使得活躍核心能夠以更高頻率運行，可以使創(chuàng)意工作應(yīng)用性能最高提升達 3 倍。

第三項技術(shù)是 Battery Boost 2.0 續(xù)航增強。這一技術(shù)針對電池使用場景設(shè)計，利用 AI 人工智能技術(shù)，在 GPU 和 CPU 功耗、電池電量、畫質(zhì)和幀率之間找到絕佳平衡。Battery Boost 2.0 技術(shù)可以提升電池模式下的游戲體驗，并使得筆記本續(xù)航時間延長多達 70%。

Nvidia正在為macOS推出GeForce Now 2.0.36版本，它帶來了對RTX 3080層的1600p游戲性的支持。更高分辨率的游戲玩法可在所有M1 Macbook上使用，包括Macbook Pro和Macbook Air。

這次更新還為蘋果最新的M1 Max Macbook帶來了優(yōu)化，修復了在正確的長寬比下的流媒體。

該更新還包括在蘋果MacBook Pro M1 Max上以正確的長寬比進行流媒體的修復，以及在游戲內(nèi)覆蓋物上查看時對倒計時的改進。

GeForce NOW RTX 3080成員現(xiàn)在可以在他們的M1 Macbook Air或Macbook Pro上以原生分辨率播放，達到光榮的1600p。流媒體的會話時間甚至更長--最長可達8小時。有了RTX 3080和Priority會員的RTX ON，可以體驗像《賽博朋克2077》和《控制》這樣的實時光線追蹤游戲，而無需升級到PC。

近期，英偉達研究人員發(fā)表了一篇文章，詳細介紹了英偉達正在探索如何為未來產(chǎn)品部署多芯片設(shè)計方案。隨著異架構(gòu)計算的興起，英偉達正在尋找一種方法，增加其半導體設(shè)計的靈活性，以根據(jù)工作負載的不同，靈活匹配各種模塊，這也是MCM多芯片封裝的用武之地。

英偉達對多芯片設(shè)計的研究最早是在2017年被曝光，當時英偉達展示了通過四個小芯片構(gòu)建的設(shè)計方案，不但提升了性能，還有助于提高產(chǎn)量(較小的芯片良品率會提高)，而且還允許將更多的計算資源集合在一起。多芯片設(shè)計還有助于提高供電效率，以及有更好的散熱效果。

英偉達目前在MCM多芯片封裝GPU上的做法稱為“Composable On Package GPU”，或COPA。文章里闡述了英偉達如何處理HPC和AI工作負載之間的差異，隨著兩者計算需求的變化，對計算的要求也漸行漸遠。英偉達擔心，過于單一的GPU架構(gòu)，會逐漸失去HPC和AI工作負載中的計算優(yōu)勢，而兩者的市場規(guī)模卻在日益增長。

為了更好地應(yīng)對未來的計算需求，英偉達一直在模擬不同的多芯片設(shè)計和配置，確認不同工作負載所需要的硬件模塊情況。根據(jù)英偉達提供的數(shù)據(jù)，在HPC工作負載上，減少25%的顯存帶寬實際上只降低了4%的性能，如果再減少25%，性能損失則再增加10%。因此，減少50%的顯存帶寬并移除相關(guān)硬件模塊后，可以替換成更合適的硬件模塊，為對應(yīng)的工作負載提供相應(yīng)的性能，從而提高效率。由于并不是所有硬件模塊都是對等的，個別功能是不可或缺的，COPA是英偉達嘗試模擬多芯片設(shè)計的影響，以及與性能之間的關(guān)系。

英偉達目前優(yōu)先考慮的是HPC和AI市場，除了高利潤的因素以外，不少企業(yè)通過定制解決方案的做法逐漸蠶食著英偉達的市場空間。當然，這種根據(jù)工作負載做針對性配置的做法也可以應(yīng)用與英偉達其他GPU產(chǎn)品線，包括消費市場的GeForce顯卡。不過與專業(yè)市場不同，游戲中的渲染工作方式有著本質(zhì)上的區(qū)別，如果采用多芯片設(shè)計，則需要進一步提高小芯片之間的互聯(lián)速度。