作為GTC 2012大會的一部分,最后的一天還有個采訪活動,接受采訪的是GK110的兩位設(shè)計師,Jonah albums是GPU工程部門的高級副總裁,Danskin則是負責GPU架構(gòu)的副總裁。
以下就是Heise網(wǎng)站帶來的報道,問答形式,內(nèi)容很勁爆,提問的一方?jīng)]什么客套,植入主題,回答的一方“太極推手”防守嚴密,從中能得到多少收獲就看自己的理解了。
Q:GK110性能比GK104強多少?
Albums:我們已經(jīng)公布了GK110的規(guī)格,但是最終的頻率之類的還沒有定,這是項目開發(fā)中很自然的事,問題是功能單元的數(shù)量還是顯存位寬會影響產(chǎn)品的性能?基于這些因素,你們可以期待性能提升50%,而SGEMM之類對計算性能敏感的應(yīng)用中,性能幾乎與功能單元的數(shù)目成正比。(GK110有15組SMX單元,這么說性能比8組SMX的GK104可以高出近一倍了?)
Q:也是就說,GK110的性能優(yōu)勢在50-70%左右?
Albums:這是一般的情況,如果是在充分利用了Hyper-Q、Dynamic Parallelism以及雙精度運算的HPC應(yīng)用中,這個(性能提升)比列還會更高。
Q:Kepler開發(fā)了多長時間了?
Albums:這個取決于你問的是誰了。我是在G80架構(gòu)完成之后開始Kepler項目的,大約是7年前了,直到三年前NVIDIA才開始有大批人手加入這個團隊的。
Q:為什么GK110架構(gòu)要等到年底才能發(fā)布,比GK104晚了這么久?
Danskin:這個問題很難回答。GK104功能更少,而且主要針對顯卡而非計算應(yīng)用,它必須要及時發(fā)布。另一方面,GK110則是一款大核心架構(gòu),TSMC在流片和制造過程中要扮演更大的角色。(TSMC又中槍了,不過這么復雜的芯片確實是個問題)
Albums:GK110這樣龐大的芯片不可能在新架構(gòu)的同時再使用新工藝,還需要等28nm工藝更加成熟。
Q:研發(fā)GK110架構(gòu)最大的挑戰(zhàn)是什么?
Albums:很明顯,就是新開發(fā)的Hyper-Q和Dynamic Parallelism技術(shù)。
Danskin:由于GPU需要自動刷新線程,Dynamic Parallelism技術(shù)實際上非常復雜,Hyper-Q對有些人很有意義,更容易實現(xiàn)而且會帶來更好的性能。Dynamic Parallelism可以簡化寫代碼的過程,這在以往是不可能的,對我們而言它是最重要的功能。
Q:NVIDIA增強了GK110的雙精度浮點性能,它是靠幾個單精度核心聯(lián)合工作實現(xiàn)的嗎?
Danskin:GK110有獨立的雙精度運算單元。(昨天PCGH的解析中已經(jīng)明確了這一點。)
Q:這是GK110為什么占用這么多核心的原因?
Ablbums:實際上(雙精度單元)占用的并不多。主要還是SMX單元增多帶來的,另一個占面積較大的功能是ECC校驗單元。
Q:GK110的雙精度性能是單精度的1/3,為什么不是1/2?
Danskin:由于架構(gòu)不同,1/2的比列很難實現(xiàn)。
Albums:簡單來說那樣做需要更多的資源,我們要重新考慮寄存器之類的設(shè)計。
Danskin:還有就是每瓦性能比的問題,我們認為目前的(1/3)比列是合適的。
Q:GK110為什么使用384bit位寬而非512bit?
Danskin:使用512bit位寬也會導致功耗及其他代價升高,GK110使用384bit位寬則可以在性能和代價中保持平衡。
Q:目前的GK110只使用了13-14組SMX單元,未來是否會有開啟完整15組SMX單元的產(chǎn)品?
Albums:某種意義上說,很有可能。
Q:GK110的硬件編碼單元與GK104有什么提升嗎?
Ablums:GK110的硬件編碼單元跟GK104是一樣的。
Q:你們認為未來的GPU開發(fā)最困難的挑戰(zhàn)是什么?
Danskin:最大的挑戰(zhàn)是功耗?;仡櫼幌逻^往的歷程,我們以及AMD都是一樣的:更高的性能,更高的功耗?,F(xiàn)在一切都改變了,功耗是明顯的分界線。另外,如以往走過的相似,先進的制造技術(shù)有利于改善(功耗)問題。
Albums:主要挑戰(zhàn)還是每瓦性能比,圖形芯片設(shè)計中這倒是個次要因素。
更多信息請關(guān)注:21ic網(wǎng)友雜談頻道