探究AMD發(fā)展APU產(chǎn)品緣由
AMD已經(jīng)正式發(fā)布了旗下的Llano APU產(chǎn)品,業(yè)界對它寄予了很高的期望,APU是一個有別于數(shù)十年CPU的全新產(chǎn)品,它的推出有著很深的歷史淵源,那么究竟為什么AMD要發(fā)展APU產(chǎn)品,APU究竟能給我們帶來和CPU什么不一樣的地方?今天我們就此進行下面的分析。當然本人的分析不一定完全正確,僅是筆者的個人見解,歡迎網(wǎng)友們提出批評意見。
AMD發(fā)展APU有著諸多的原因
首先,APU中文名稱加速處理器,它融合了此前的CPU核心和GPU圖形核心,并且通過業(yè)界標準的OpenCL和DirectCompute接口進行異構計算,應用程序將可以適時調用APU內部的CPU和GPU單元協(xié)同計算,帶來更快速、更豐富的計算體驗。很明顯,AMD希望通過APU來彌補CPU的缺陷,以和競爭對手直接對抗。AMD的這個意圖有著很深刻的原因,其中CPU指令集一直被競爭對手所掌握是其中一個重要因素。
下半年AMD APU產(chǎn)品線對抗Intel CPU
慘痛教訓迫使AMD重新思考
說到指令集對處理器的影響,就從近年兩家處理器廠商的舉動開始吧。
我們知道處理器的指令集可以認為是處理器性能的催化劑,通過它可以大大加速處理器的某些計算性能和效率。一直以來,Intel以處理器市占領導著指令集延伸技術發(fā)展,與各大軟件廠商合作令軟件執(zhí)行效率得以提升,而AMD只能被Intel牽著走,產(chǎn)品在指令集支持上永遠落后對手,就以45奈米Penryn支持47條全新SSE4指令集為例,AMD雖表示支持SSE4A,但實質只含有Intel SSE4數(shù)條指件,有名無實。
為了打破在指令集延伸技術一直落后的窘境,AMD在07年8月份,搶在Intel之前宣布推出SSE5指令集延伸技術,并計劃配備在K10之后的下一代“Bulldozer”核心架構中,2009年推出實際產(chǎn)品。據(jù)了解,SSE5初期規(guī)劃加入超過100指令,其中最值得注意的包括︰三操作數(shù)指令(3-Operand Instructions)及熔合乘法累積(Fused Multiply Accumulate)。
AMD此前表示,SSE5指令集的使命之一是增強高性能計算應用,并充分發(fā)揮多核心、多媒體的并行優(yōu)勢。SSE5將把以往只存在于高性能特殊架構里的功能引入到x86平臺中,以此最大化每條指令的輸出能力,并增強代碼庫。
2007年8月,AMD搶先宣布了SSE5指令集(之前從SSE到SSE4均為Intel制定),但Intel隨即表示,不會支持SSE5。轉而在2008年3月,Intel宣布了Sandy Bridge微架構,其中將引入全新的AVX指令集。4月份,Intel公布了AVX指令集規(guī)范,隨后開始不斷進行更新。
Intel此舉很大程度影響了未來軟件廠商的支持取向,AMD在業(yè)內的影響力遠不及Intel,如果AMD單方面力挺SSE5,勢必在未來的性能對抗中落敗;迫于競爭壓力,AMD不得不選擇支持Intel提出的AVX(高級矢量擴展)指令集,同時采用AVX架構重新改寫AMD的SSE5指令集,重定義為XOP(eXtended Operations指令擴展),CVT16(半精度浮點轉換)以及FMA4(4操作數(shù)乘加)。
Bulldozer歷經(jīng)艱難終將登場
做出這個決定是需要付出慘重代價的,這意味著處理器架構要做大幅調整,到了08年11月,AMD的最新路線圖就顯示,Bulldozer已經(jīng)推遲到了2011年推出。AMD在推土機處理器上,可以說重重摔了一個大跟頭,這也就促使了AMD要繞過CPU,通過自身優(yōu)勢項目來彌補自身缺陷,很顯然這個任務就落到了GPU身上。
APU V.S.CPU:開放挑戰(zhàn)獨斷
另外,AMD發(fā)展APU有著很大應用需求發(fā)展背景,因為我們日常電腦使用中,會接觸到越來越多的3D計算、并行數(shù)據(jù)信息,比如我們未來的網(wǎng)頁將會向3D化發(fā)展,我們的視頻信息需要進行高速并行處理,這種計算正是GPU的優(yōu)勢所在。這種需求也就成為APU發(fā)展的基礎。
CPU自身結構是工作頻率高,核心數(shù)少,如果進行大規(guī)模并行計算的話,顯然比GPU要占下風,盡管可以通過優(yōu)化處理器指令集來加速這種計算性能,但是,未來用戶發(fā)展需求在不斷變化,而指令集牢牢被Intel一家所占據(jù),顯然不可能根據(jù)應用發(fā)展通過完全開放的編程實現(xiàn)優(yōu)化。
而目前GPU技術已經(jīng)發(fā)展到DirectX11,已經(jīng)有OpenCL和DirectCompute這些公開的業(yè)界接口標準,如果未來軟件都支持了OpenCL和DirectCompute以后,它帶來的加速效果可能要比處理器指令集來的更好,孤零零閉門造車的指令集重要性可能就不會像前幾年那么高了。
需要提到的是:Intel這一代Sandy Bridge處理器只支持到DirectX 10.1,無法支持OpenCL和DirectCompute公認標準。
APU OpenCL加速應用逐步開花
AMD 2011年6月13日宣布,越來越多的創(chuàng)新軟件應用程序在大規(guī)模采用OpenCL行業(yè)標準。AMD公司與領先的軟件公司已經(jīng)密切合作,以幫助他們優(yōu)化通用平臺上的應用程序,同時還采用包括AMD Fusion加速處理器(APU)在內的最新技術加速這些程序。
軟件開發(fā)人員樂于采用通用的應用程序編程接口(APIs)。得益于OpenCL標準固有的跨平臺、跨操作系統(tǒng)和跨硬件供應商的靈活性特點,軟件行業(yè)正迎來基于OpenCL標準開發(fā)消費類和商業(yè)應用程序的風潮。