英偉達(dá)擔(dān)心單一GPU架構(gòu)會逐漸失去計算優(yōu)勢:今年將加大GPU供應(yīng)
英偉達(dá)的GPU現(xiàn)在可以買到的價格依然和官方定價相去甚遠(yuǎn)。CES 2022上,NVIDIA發(fā)布了新卡,包括30系列中最便宜(1899元)的RTX 3050、RTX 3080 12GB、RTX 3070 Ti 16GB等以及筆記本高端GPU(RTX 3080 Ti/3070 Ti),那么大伙能否原價買到呢?
雖然NVIDIA沒有正面回應(yīng),但公司CFO Colette Kress在本周小摩舉辦的科技峰會上表示,他相信在2022自然年,NVIDIA會有非常好的供貨局面,足以應(yīng)對市場需求。可能暗示下半年要發(fā)新卡,比如RTX 40系列,Kress指出,事實(shí)上我們已經(jīng)和伙伴一道,就下半年的產(chǎn)能緊密協(xié)作了。此前有消息稱,進(jìn)入1月份之后,RTX 30系列的供貨情況將會大為改善,預(yù)計比12月份增加大約15%。對于NVIDIA來說,除了桌面顯卡,還要兼顧筆記本市場,希望Kress此番表態(tài)說話算數(shù)吧。
1 月 7 日消息,今日英偉達(dá)正式推出第 4 代 Max-Q 技術(shù),讓輕薄游戲本和設(shè)計本擁有更出色性能,提供更長的續(xù)航時間。
官方表示,游戲玩家和創(chuàng)作者對筆記本電腦的性能期望與日俱增,對時尚外觀和長效續(xù)航的追求也不會松懈。為此,英偉達(dá)繼續(xù)發(fā)展 Max-Q 技術(shù),注重能效,優(yōu)化 CPU 和 GPU 性能釋放。
第 4 代 Max-Q 第一項(xiàng)技術(shù)名為 CPU Optimizer 智能協(xié)作。該功能可以讓 GPU 進(jìn)一步優(yōu)化 CPU 性能、溫度和功率,使 CPU 能效得以提升,在需要時可以將功率轉(zhuǎn)移給 GPU,以實(shí)現(xiàn)更佳游戲性能。
第二項(xiàng)技術(shù)是 Rapid Core Scaling 智能核心優(yōu)化,可以使 GPU 能實(shí)時感知應(yīng)用的當(dāng)前需求,并僅使用所需數(shù)量的核心。這樣可以使得活躍核心能夠以更高頻率運(yùn)行,可以使創(chuàng)意工作應(yīng)用性能最高提升達(dá) 3 倍。
第三項(xiàng)技術(shù)是 Battery Boost 2.0 續(xù)航增強(qiáng)。這一技術(shù)針對電池使用場景設(shè)計,利用 AI 人工智能技術(shù),在 GPU 和 CPU 功耗、電池電量、畫質(zhì)和幀率之間找到絕佳平衡。Battery Boost 2.0 技術(shù)可以提升電池模式下的游戲體驗(yàn),并使得筆記本續(xù)航時間延長多達(dá) 70%。
Nvidia正在為macOS推出GeForce Now 2.0.36版本,它帶來了對RTX 3080層的1600p游戲性的支持。更高分辨率的游戲玩法可在所有M1 Macbook上使用,包括Macbook Pro和Macbook Air。
這次更新還為蘋果最新的M1 Max Macbook帶來了優(yōu)化,修復(fù)了在正確的長寬比下的流媒體。
該更新還包括在蘋果MacBook Pro M1 Max上以正確的長寬比進(jìn)行流媒體的修復(fù),以及在游戲內(nèi)覆蓋物上查看時對倒計時的改進(jìn)。
GeForce NOW RTX 3080成員現(xiàn)在可以在他們的M1 Macbook Air或Macbook Pro上以原生分辨率播放,達(dá)到光榮的1600p。流媒體的會話時間甚至更長--最長可達(dá)8小時。有了RTX 3080和Priority會員的RTX ON,可以體驗(yàn)像《賽博朋克2077》和《控制》這樣的實(shí)時光線追蹤游戲,而無需升級到PC。
近期,英偉達(dá)研究人員發(fā)表了一篇文章,詳細(xì)介紹了英偉達(dá)正在探索如何為未來產(chǎn)品部署多芯片設(shè)計方案。隨著異架構(gòu)計算的興起,英偉達(dá)正在尋找一種方法,增加其半導(dǎo)體設(shè)計的靈活性,以根據(jù)工作負(fù)載的不同,靈活匹配各種模塊,這也是MCM多芯片封裝的用武之地。
英偉達(dá)對多芯片設(shè)計的研究最早是在2017年被曝光,當(dāng)時英偉達(dá)展示了通過四個小芯片構(gòu)建的設(shè)計方案,不但提升了性能,還有助于提高產(chǎn)量(較小的芯片良品率會提高),而且還允許將更多的計算資源集合在一起。多芯片設(shè)計還有助于提高供電效率,以及有更好的散熱效果。
英偉達(dá)目前在MCM多芯片封裝GPU上的做法稱為“Composable On Package GPU”,或COPA。文章里闡述了英偉達(dá)如何處理HPC和AI工作負(fù)載之間的差異,隨著兩者計算需求的變化,對計算的要求也漸行漸遠(yuǎn)。英偉達(dá)擔(dān)心,過于單一的GPU架構(gòu),會逐漸失去HPC和AI工作負(fù)載中的計算優(yōu)勢,而兩者的市場規(guī)模卻在日益增長。
為了更好地應(yīng)對未來的計算需求,英偉達(dá)一直在模擬不同的多芯片設(shè)計和配置,確認(rèn)不同工作負(fù)載所需要的硬件模塊情況。根據(jù)英偉達(dá)提供的數(shù)據(jù),在HPC工作負(fù)載上,減少25%的顯存帶寬實(shí)際上只降低了4%的性能,如果再減少25%,性能損失則再增加10%。因此,減少50%的顯存帶寬并移除相關(guān)硬件模塊后,可以替換成更合適的硬件模塊,為對應(yīng)的工作負(fù)載提供相應(yīng)的性能,從而提高效率。由于并不是所有硬件模塊都是對等的,個別功能是不可或缺的,COPA是英偉達(dá)嘗試模擬多芯片設(shè)計的影響,以及與性能之間的關(guān)系。
英偉達(dá)目前優(yōu)先考慮的是HPC和AI市場,除了高利潤的因素以外,不少企業(yè)通過定制解決方案的做法逐漸蠶食著英偉達(dá)的市場空間。當(dāng)然,這種根據(jù)工作負(fù)載做針對性配置的做法也可以應(yīng)用與英偉達(dá)其他GPU產(chǎn)品線,包括消費(fèi)市場的GeForce顯卡。不過與專業(yè)市場不同,游戲中的渲染工作方式有著本質(zhì)上的區(qū)別,如果采用多芯片設(shè)計,則需要進(jìn)一步提高小芯片之間的互聯(lián)速度。