作為今年AMD必然要重點推廣的產(chǎn)品,Kaveri APU承擔著銷售以外的很多責任。可能對于大部分人來說,這款APU沒有和FM2+接口的主板一起推出,是一件頗為搞笑的事情,但是如果從前前后后Kaveri在架構規(guī)格上的變動來看,AMD顯然也是在做著思想上的掙扎。
對于AMD而言,Kaveri作為異構架構的重要產(chǎn)品,在技術領域以及市場領域上到底該如何定位,才是真正頭疼的事情。
下面我們從Kaveri一些重要的技術特點來分析,其中或許能讓我們更清晰地認識到這款APU。
1、真正的“異構”先鋒
AMD談異構計算已經(jīng)有不少年頭了,從APU開始,AMD顯然就極力想把CPU和GPU更好地融合在一起。如果說以前的APU僅僅是一種鋪墊,或者因為技術和市場而不得不妥協(xié)的話,那么新一代APU——Kaveri,無疑將是AMD在異構之路上走出的重要一步。
這里再多談Kaveri的規(guī)格意義不大,頻率、緩存永遠只是技術架構之后的產(chǎn)物。我們更多要想的是Kaveri這款APU對于AMD甚至是整個業(yè)界的意義,從這一點來看,或者HAS架構永遠要比單獨去談Kaveri的CPU或者GPU有多強的意義要大得多。
關于HSA架構,這是AMD從Fusion融合架構上提升而來的一個說法,全稱為Heterogeneous System Architecture,即異構系統(tǒng)架構。這個架構實際上著重的就是GPU和CPU的異構計算。AMD認為傳統(tǒng)的CPU發(fā)展已經(jīng)到了瓶頸,無法在并行運算上再有突破,而CPU+GPU運算就能很好地解決這個難題,GPU作為一個多重單位運算體系,在并行計算上有得天獨厚的優(yōu)勢,通過CPU與GPU的結合讓串行工作與并行工作協(xié)調(diào)處理,將大幅度提高計算機的計算能力。
▲HAS異構架構將處理器和GPU完美地聯(lián)動在一起
在HSA產(chǎn)品計劃中,第一款使用HSA架構的APU就是Kaveri,它使用Steamroller的CPU加上GCN核心的GPU。這里我們無需去擔心這款APU在CPU和GPU的性能上有多強,如果單獨分裂來看,Intel和獨顯都不屑一顧。但如果是從一個整合的架構而言,Kaveri的確是開創(chuàng)了異構計算產(chǎn)品的一個先河,是AMD在技術領域以及產(chǎn)品領域的一個重要里程碑。
2、革命性的hUMA技術
UMA技術我們并不陌生,內(nèi)存統(tǒng)一尋址這玩意已經(jīng)在很多設備以及硬件上使用,包括之前的多核心處理器、APU、集顯系統(tǒng)甚至是游戲主機,比如Xbox 360。而在HAS架構中,最關鍵的則是hUMA,一種將CPU和GPU更加緊密結合起來的革命性技術。
在過去,即便GPU和CPU已整合到同一個芯片上(GPGPU技術),芯片在運算時要定位存儲的位置仍然得經(jīng)過繁雜的步驟,這是因為CPU和GPU的數(shù)據(jù)儲存區(qū)相互獨立仍然,當CPU程序需要在GPU上進行部分運算時,CPU必須將存儲區(qū)上的所有的資料復制到GPU的存儲上,而當GPU上的運算完成時,這些資料還要再復制回到CPU存儲。這些步驟都會不斷耗費時間以及降低程序處理的效率。
而在hUMA技術里,CPU和GPU能共享同一個內(nèi)存存儲空間,并且CPU能夠直接存取GPU的存儲位址,不必像過去得花工夫再將GPU的運算資料復寫到CPU上。這使得CPU和GPU之間互相交換資料的步驟顯得簡單直接,最大的好處就是工作效率提升,相應速度加快,同時還能解決硬件強行分配資源所造成的浪費。通過hUMA,無論是CPU還是GPU,所有的計算核心都將共享一個單一的內(nèi)存地址空間,并且CPU或GPU中任意一個處理單元做出的更新,對其他所有處理單元均可見。可以說hUMA技術完全解決系統(tǒng)中不同種類計算核心在讀取和訪問內(nèi)存之間的障礙,徹底將CPU和GPU綁在了一起。
▲hUMA的工作模式
事實上,如果可能的話,Kaveri會因為hUMA技術在性能上獲得極大的提升,之所以說是“可能”,那是因為HSA架構同樣需要軟件支持,這意味著在現(xiàn)階段,Kaveri的性能在現(xiàn)有民用系統(tǒng)和軟件中不可能出現(xiàn)質(zhì)的飛躍,到最后它的表現(xiàn)還是只取決于處理器和圖形核心的單獨性能,哪怕是采用壓路機,我們也不必對它的性能有著不切實際的期盼。
但必須要指出的是,如果在未來,民用的系統(tǒng)和軟件能夠對HSA架構進行支持,那么AMD的異構產(chǎn)品將會迸發(fā)出極大的威力。其實這并不算困難,HAS架構本身對開發(fā)人員是非常友好的,而且已經(jīng)支持C++和JAVA兩種語言,同時它已經(jīng)成為了一種開放標準。可以想見,如果當HSA系統(tǒng)成為一種民用主流環(huán)境的話,那么Intel和NVIDIA在效率上就會落后AMD一步。而且就現(xiàn)階段而言,即使PC桌面系統(tǒng)還沒有對HSA做好準備,但像服務器領域、嵌入式設備甚至是手持設備和游戲機,都可以單獨為HSA架構進行優(yōu)化和開發(fā),這都是AMD立足于未來的關鍵。從這點而言,Kaveri有多么重要不言而喻。
3、消失的GDDR5
既然Kaveri APU如此重要,那么緣何在FM2+系列主板問世之際,Kaveri卻沒有動靜呢?AMD沒有具體的說明,但這并不妨礙我們的推測。事實上,APU現(xiàn)在也是AMD在PC家用領域的一個重要收入來源,而作為第四代APU,Kaveri即使本身擁有革命性的HAS架構,但卻不能不考慮市場的反應。
事實上,最早期的規(guī)劃中,Kaveri APU除了支持DDR3,同時還支持GDDR5,可以想見在GDDR5的高帶寬下,Kaveri的異構計算性能會提升多大,其GPU的性能顯然也會比現(xiàn)在強。但必須要看到的是,GDDR5成本居高不下,即使是DDR3目前價格也在上漲中,本來就作為打市場價格不會太高的Kaveri如果要強行硬上GDDR5,那么整個系統(tǒng)的成本顯然會提升不少。所以目前Kaveri APU已經(jīng)去掉對GDDR5的支持,傳聞中的板載顯存也不復存在。AMD最近才公布了Kaveri的詳細數(shù)據(jù),由此也可以看出在之前AMD顯然是有一段搖擺掙扎的過程。
其實如果我們縱覽整個AMD涉足的領域,我們可以看到在游戲機方面,PS4和Xbox One都采用的是AMD的APU架構,當然,兩臺次世代主機由于CPU的原因,并不支持HSA架構。不過,其中PS4正是使用的GDDR5,由于兩臺主機的架構都是由AMD定制,所以不難看出從技術和架構方面,APU使用GDDR5是沒有問題的。我們只能推測AMD在Kaveri APU上,還是有因為市場原因作出的技術妥協(xié)。
▲PS4的APU架構即采用了GDDR5
那么沒有GDDR5是不是就會對Kaveri APU造成重大的性能損失呢?理論上GDDR5的帶寬的確遠高于DDR3,但是考慮到Kaveri在GPU部分的規(guī)模并不算大,DDR3的帶寬勉強也能喂飽Kaveri,就如同Xbox One使用DDR3依然有不錯的圖形表現(xiàn)能力一樣。上GDDR5,圖形和整體性能更強是必然的,但是GDDR5的高帶寬對于普通用戶的日常應用而言,意義并不算大,甚至用不了這么高的內(nèi)存帶寬。在HAS架構尚未普及,應用不多的前提下,AMD這種略顯保守的做法也沒有太大問題。
考慮到Kaveri在GPU部分擁有512個流處理器以及支持Mantle,我們可以期待Kaveri在圖形性能方面會靠近Radeon HD7750,如果能達到這個目的,那么APU在GPU性能方面依然可以超越所有現(xiàn)有融合類的處理器,同時可以將獨顯市場的性能指標提升一大塊,從這個意義而言,采用GDDR5還是DDR3,其區(qū)別就沒有我們想象那么大了。
寫在最后:充滿矛盾的一代APU
就如同我們認為AMD在Kaveri技術立場的搖擺一樣,Kaveri本身是一款充滿了矛盾的產(chǎn)品。從技術而言,先進的異構架構使得它注定將成為名留青史的一款硬件產(chǎn)品,但是在當前的市場環(huán)境和應用環(huán)境下,卻也讓Kaveri注定無法在桌面領域發(fā)揮出自己的最大性能。對于大多數(shù)PC用戶而言,他們看到的Kaveri是新一代APU,但在應用上變化不會太大,除了更強的性能外。而當異構架構深入業(yè)界和PC時,Kaveri肯定已經(jīng)作為匆匆過客而逝去……我們可以期待,在20nm甚至16nm制程下,AMD更大規(guī)模的APU能在GDDR5的配合下,CPU和GPU兩端都發(fā)揮出彪悍的性能。至于現(xiàn)在,如果過Kaveri能夠在游戲、日常應用上比上一代APU有更好的表現(xiàn),能將APU產(chǎn)品的市場規(guī)模進一步擴大,那么它就是成功的,而這一切和異構架構的關聯(lián)不會太大!