微處理器廠商AMD宣布Fusion處理器將徹底融合CPU與GPU。Fusion是AMD的旗艦處理器,整合了x86處理器和圖形處理器。AMD公司院士Phil Rogers在華盛頓貝爾維尤舉行的Fusion開發(fā)者大會的一個主題演講中宣布了此消息。AMD高級副總裁、產品部門總經理Rick Bergman宣布正式發(fā)布A系列APU芯片“Llano”。
(你或許知道雙核、四核甚至多核CPU,那你是否了解APU?APU的英文全稱為“Accelerated Processing Unit”,意思是加速處理器。這是AMD給Fusion APU取的一個新名字,代表著它將CPU和GPU合二為一,可同時執(zhí)行串行計算和并行計算,為大量應用提供加速。)
Fusion的早期樣片基于AMD內部開發(fā)的x86處理器和GPU。但AMD顯然向著更抽象的層面前進,相信自己可以讓多加硬件和軟件廠商加入進來,開啟異構計算(heterogeneous computing)。AMD將Fusion品牌變成開放的Fusion系統(tǒng)架構,通過一套規(guī)范讓芯片制造商整合多種CPU和GPU,并提供一套高效的編程模型。
這項進展可能意味著ARM內核也能成為Fusion架構的一部分,不過Rogers在介紹開放平臺計劃時沒有明確提到ARM。
Rogers演講的重點是AMD希望創(chuàng)造一套讓不同的CPU、GPU組合像統(tǒng)一的處理引擎一樣工作的架構,在提供更高性能的同時消耗更少的電力。
Rogers也談到了單核到多核再到異構多核計算的歷史趨勢,他將Fusion系統(tǒng)架構描繪成一個“開放平臺”,并補充說虛擬ISA規(guī)范(FSAIL)、內存模型和分配機制也會隨之發(fā)布。
Rogers說:“Fusion系統(tǒng)架構的ISA是CPU、GPU中立的。這很重要,因為我們正在所有領域邀請合作伙伴加入:其它硬件廠商實現FSA、加入平臺;操作系統(tǒng)公司全面支持所有功能、提供完整的性能和服務質量;工具和中間件公司提供工具基礎來開發(fā)、優(yōu)化用于這個平臺的程序。”
Rogers還補充說未來將會成立一個FSA評估委員會指導架構的進化,讓所有參與者都能在決定發(fā)展方向上具有發(fā)言權。
統(tǒng)一的內存和編程模型
Rogers說目前的異構多核架構被編程模式和通信開銷所束縛,“好消息是Fusion系統(tǒng)架構打破這種了這些束縛。我們正在向架構時代前進。我們將GPU變成一個同等的處理器而不僅僅是一個器件”。
Rogers描繪了一個路線圖,其中有對C++功能的支持、統(tǒng)一地址空間、支持嵌套的數據并行模型、在CPU和GPU之間實現低延時任務分配的用戶模式調度機制以及搶占和上下文切換。
這個過程中也會實現自動低平衡。此外,具體的FSA增強會得到OpenCL、DirectCompute等新編程語言和接口的支持。接下來還要為CPU、GPU的組合提供增加雙向電源管理。不過Rogers強調,最關鍵的是創(chuàng)建統(tǒng)一的內存地址空間,讓CPU和GPU完全共享內存以實現無縫的運作。
在這次技術性演講中沒有說明的是AMD作為Fusion系統(tǒng)架構實現者與貢獻者之一,如何從Fusion的發(fā)展中獲利。
AMD Llano APU技術解析
今年初,AMD率先發(fā)布了低電壓版APU——E系列(研發(fā)代號:Zacate)和C系列(研發(fā)代號:Ontario)。雖然這兩款處理器發(fā)布之后的市場反響都比較不錯,但是僅憑低電壓APU肯定是不能在市場中獲得更多的主動權。因此,AMD在半年之后推出了代號為Llano的A系列APU,很顯然AMD這次的矛頭直指英特爾的SandyBridge處理器。
眾所周知,“融合”概念最早是由AMD提出,而英特爾卻搶先于AMD推出了融合圖形芯片的處理器。雖然英特爾率先推出了整合顯卡的Core i5/i3處理器,不過,正如最初的Pentium D雙核處理器一樣,英特爾這種“CPU+GPU”的設計具有兩個獨立的芯片,僅僅是兩個功能模塊的簡單疊加,屬于一種過渡方案,并非原生的單芯片解決方案。在臥薪嘗膽了兩年之后,AMD終于厚積薄發(fā),推出了Llano的A系列APU。AMD的APU則是采用更先進的原生方案——將CPU和GPU內核完全融為一體的單芯片方案,這樣讓內核之間的數據交換效率更高。
此次AMD一共發(fā)布了七款APU,包括A4、A6和A8,從型號上來看,它們和英特爾的i3、i5和i7在數字上有著驚人的對稱,不知道這是巧合還是AMD故意所為。和英特爾的SandyBridge處理器一樣,此次發(fā)布的所有AMD Llano A系列APU均配置了AMD HD6400以上系列顯示核芯,并且根據級別的不同,顯卡性能也有所區(qū)別。另外,最高級別的A8采用的是AMD Radeon HD 6620G,單從型號上來看,這款顯卡的性能應該不低。
AMD LlanoAPU全系產品
Fusion APU主要由x86架構的CPU核心(最先上市的Ontario和Zacate APU處理器將基于“Bobcat”架構)、DirectX 11 SIMD引擎陣列、UVD高清視頻引擎、數據總線和DDR3內存控制器等幾個模塊封裝在一個核心內構成。CPU和GPU各司其職,各自分別擁有獨立緩存。 CPU和GPU通過切換開關互相連接,而整個APU內部的各個組件之間通過HyperTransport總線連接成一個整體。CPU和GPU可以直接訪問 存儲器,CPU和內存之間,以及GPU和內存之間均使用交叉開關進行連接,并且CPU和GPU可通過共享內存進行數據交換。APU這一設計的最大優(yōu)勢是可 以消除現有AMD平臺上各部分之間的互連瓶頸。在目前的AMD整合平臺上,原本位于北橋芯片的總線控制器和內存控制器都已經集成到CPU內部,但是內存控 制器與內存之間的帶寬僅有17GB/s左右,北橋與集成顯卡之間的帶寬更是僅僅只有7GB/s左右,這已成為瓶頸所在。更為嚴重的是,集成顯卡與內存通信 時還需要繞道北橋部分,增加了通信延時。AMD APU在將所有這些功能模塊全部整合到一塊晶片后,將可以提升各組件之間的帶寬。APU內部的GPU圖形陣列、UVD解碼引擎與北橋模塊及內存控制器之間 的通道高達27GB/s,內存控制器和內存之間的帶寬也同樣達到了27GB/s。另外,GPU與內存之間也可以直接通信,帶寬增加了三倍,大大提高了GPU的執(zhí)行效率。
更強的整數運算性能
盡管Fusion APU是一個全新的CPU和GPU的融合方案,GPU部分將采用與目前AMD Radeon HD 6300M/6250M相同級別的圖形核心,除了支持DirectX 11外,還能通過OpenCL支持GPU加速運算。Fusion APU內核架構最大的亮點是引入了全新的“Bobcat”架構。
Bobcat是AMD全新架構的新一代處理器核心,與Bulldozer一樣,Bobcat也將整數運算執(zhí)行單元和浮點單元分別獨立開來,只不過 Bobcat內核的整數運算“簇”比Bulldozer更少。
注:整數運算“簇”
Bulldozer的內核引入了靈活的模塊化設計:在現有的設計中,每個物理核心對應單一獨占的整數運算單元和128bit浮點運算單元。而在 Bulldozer架構中,每個物理核心具有兩個整數運算單元和一個共享的256bit的浮點運算單元。同時,這個256bit的浮點運算單元可以根據需 要拆分為2個128bit的浮點運算單元,供兩個整數運算單元搭配使用;或是以1個256bit浮點運算單元的模式供某個整數單元獨占。這樣一個單獨的單 元被AMD稱為“核心模塊”,這也就是Bulldozer所謂“1.5核”說法的由來。而當多個Bulldozer處理器并聯時(這在服務器領域幾乎是必 然的),兩個“核心模塊”組成的“簇”便成為了AMD集群多線程技術中的基本單位。而Bobcat處理核心中的“核心模塊”則只包含了一個整數單元和一個 浮點,并不支持集群多線程技術,故每兩個核心模塊才只擁有一個“簇”單元。簡單來說,“簇”在這里被定義為整數計算能力,每兩個整數單元等同于一個 “簇”。
AMD為什么要在核心設計中單獨增加整數單元的數目?這與AMD的異構計算策略不無關系。簡單來說,現有的GPU具有遠遠強于CPU的浮點計算能 力。在AMD提出的GPU與CPU協(xié)同計算的平臺戰(zhàn)略下,與其事倍功半地提升CPU的浮點計算能力,不如將浮點計算交與GPU完成。在這種情況下,整數計 算能力將成為制約整個平臺性能的瓶頸,那么,有意識地提升APU的整數計算能力無疑就是一種必然的選擇。
上圖左為Bobcat的一個“簇”,它的整數單元(INT)只相當于Bulldozer(上圖右)的半個“簇”。
Fusion APU能否在移動市場掀起波瀾
Bergman表示:“AMD A系列APU對于AMD而言具有拐點意義,它可能是自微處理器面世以來業(yè)界最大的架構變革。此產品的推出將使筆記本和個人電腦擁有前所未有的圖形和視頻性能,將為用戶帶來全新計算體驗。從今天開始,我們將為廣大的主流用戶帶來獨顯性能。”
Fusion APU是一款真正將CPU和GPU融合在一起的產品,它的誕生將統(tǒng)治軟件業(yè)界的x86 CPU與針對現代負載進行優(yōu)化的GPU緊密融合在一起,并將兩者各自的優(yōu)勢發(fā)揚光大。尤其對于移動平臺來說,APU的利好是顯而易見的,高集成化可大幅度降低筆記本內部設計的難度,并可有效提升其散熱效率,降低整機的功耗,提升續(xù)航時間。所以APU的出現將會帶出一種全新的筆記本內部架構,影響深遠,符合更低能耗、更低成本的效果,符合節(jié)約、低碳、環(huán)保的時代主題。尤其在AMD將其定義為“APU價值和精華”的超輕薄筆記本電腦市場上,APU的問世絕對是AMD的一枚重磅炸彈。最低低于1W的功耗設計,以及不到現今產品一半的核心面積實現90%的性能水平。
麥格理證券研究公司(Macquarie Equities Research)分析師Shawn Webster表示,通過新近發(fā)布的Llano和Bulldozer處理器,AMD將在桌面PC處理器市場贏得份額,除非英特爾采取降價措施。
AMD是否有機會在超輕薄市場逐步建立起自己的非對稱優(yōu)勢,并最終在其他市場上對英特爾形成挑戰(zhàn)?業(yè)界將拭目以待。
------來源:EET
附原文: AMD makes Fusion CPU, GPU agnostic Peter Clarke Microprocessor vendor Advanced Micro Devices Inc. has declared that Fusion, its flagship processor project whereby it has combined x86 and graphics processors, will be CPU and GPU agnostic. The announcement was made as part of a keynote at the Fusion Developers Summit, being held in Bellevue, Washington, by Phil Rogers, AMD Corporate Fellow. The early examples of Fusion have been based on x86 processor and GPU cores developed internally by AMD. However, AMD is clearly heading for a higher level of abstraction and believes it can do better by letting multiple hardware and software companies join with it as it tries to enable heterogeneous computing. It is effectively turning the Fusion marketing brand into the open Fusion System Architecture with a specification that enables chipmakers to combine multiple CPUs and GPUs and preserve an efficient programming model. The development is likely to allow ARM cores to be used as part of the Fusion architecture although Rogers did not mention ARM explicitly as he laid out the open-platform plan for Fusion. The main thrust of Roger‘s keynote was that AMD wants to create an architecture whereby different combinations of CPU and GPU processor cores operate as a unified processing engine that delivers both higher performance and lower power consumption compared with today’s variants. Having discussed the historical trends from single- to multicore and on to heterogeneous multicore computing it was about half-way through the talk that Rogers described the Fusion System Architecture as an “open platform” and added that this meant the virtual ISA specification, known as FSAIL, the memory model the despatch mechanism would be published. Rogers said: “The Fusion system architecture is ISA agnostic for both CPUs and GPUs. This is very important because we‘re inviting partners to join us in all areas; other hardware companies to implement FSA and join in the platform; operating systems companies to fully embrace all of the features and deliver its full performance and quality of service; tools and middleware companies to provide the tool infrastructure to develop, optimize and debug the programs that will run on this platform.” He added that an FSA review committee would be formed to guide the evolution of the architecture and to allow all participants a voice in its direction. unified memory and programming models Rogers said that current heterogeneous multicore architectures are currently constrained by the programming model and communications overheads. “The good news is the Fusion System Architecture blows away both of these constraints,” he said. “Where we’re headed is the architected era. We make the GPU into a peer processor rather than a device,” he said Rogers outlined a roadmap that includes support for C++ features, unification of the address space, support for nested data parallelism, user-mode scheduling for lower latency task dispatch between CPUs and GPUs, and the addition of pre-emption and context switching. Automated lower balancing between CPU and GPU is part of that progress, according to Rogers. In addition, specific FSA enhancements will be supported by newer programming languages and interfaces such as OpenCL and DirectCompute. One of the next steps will be the addition of bi-directional power management to CPU, GPU combinations. But the key is the creation of a unified memory address space and fully coherent memory shared by the CPU and GPU so they operate seamlessly together, Rogers said. What was not made clear in what was essentially a technical presentation is how AMD, as one of a number of implementors and contributors to the Fusion System Architecture will make its money from the development of Fusion.