GPU Vs. CPU: 20年后可能不會(huì)再提到CPU
讓電腦能夠看見(jiàn)你我看見(jiàn)的世界?易如反掌。拿起相機(jī)拍張照片傳到電腦里,或者讓你的電腦配上攝像頭。不過(guò)要讓電腦能夠理解自己到底看到了什么,那就不是手到擒來(lái)的事了。
日前,一群來(lái)自哈佛以及麻省理工學(xué)院(MIT)共同組成研究團(tuán)隊(duì),正打算用電腦來(lái)仿真大腦的功能。他們希望能透過(guò)運(yùn)算,將電腦看見(jiàn)的影像轉(zhuǎn)換成有用的信息,進(jìn)而讓電腦可以辨物、識(shí)人、甚至理解一連串的動(dòng)作所代表的意思。說(shuō)白了,進(jìn)一步向人腦靠近。
GPU成仿真大腦視覺(jué)辨識(shí)核心
為了加快研究速度,研究人員借用分子生物學(xué)的篩選技術(shù)———例如同時(shí)對(duì)上千種候選辨識(shí)模塊進(jìn)行一連串的實(shí)驗(yàn),淘汰掉不適用的模塊,最后保留下最棒的模塊。
這過(guò)程簡(jiǎn)單來(lái)說(shuō)就是達(dá)爾文和孟德?tīng)柨偨Y(jié)出來(lái)的八個(gè)字,“物競(jìng)天擇,適者生存”。
不過(guò)來(lái)自研究團(tuán)隊(duì)的反饋顯示,目前出現(xiàn)另一個(gè)難題則是人腦解析信息的速度實(shí)在太快,若要用傳統(tǒng)電腦實(shí)現(xiàn)這一效果,得先花上一大筆錢(qián)。而且電腦至少要花上一整年的時(shí)間才能運(yùn)算完畢。
所幸的是,解決難題的方法多少有些歪打正著。隨著游戲用的G PU擁有越來(lái)越強(qiáng)的運(yùn)算能力而獲得解決,如今,麻省理工學(xué)院和哈佛的研究人員正大量運(yùn)用GPU的運(yùn)算能力,這種方法不僅省下大筆的經(jīng)費(fèi),更使得運(yùn)算的時(shí)間從一年縮減到一個(gè)星期。
GPU的英文全稱(chēng)GraphicProcessingUnit,中文翻譯為“圖形處理器”。GPU是相對(duì)于CPU的一個(gè)概念,由于在現(xiàn)代的計(jì)算機(jī)中,特別是家用系統(tǒng),游戲的發(fā)燒友們對(duì)圖形的處理變得越來(lái)越重要,需要一個(gè)專(zhuān)門(mén)的圖形核心處理器,GPU應(yīng)運(yùn)而生。
一直以來(lái),GPU行業(yè)的競(jìng)爭(zhēng)遠(yuǎn)比CPU的競(jìng)爭(zhēng)來(lái)得激烈。目前通用PC的CPU就只有英特爾和AMD兩家大廠。而在GPU方面領(lǐng)先的是 NVIDIA和ATI(已被AMD收購(gòu))兩家廠商,但能生產(chǎn)中低端產(chǎn)品的還有英特爾、3S等好幾家廠商。盡管這些廠商的產(chǎn)品不如NVIDIA和ATI,但在很多應(yīng)用方面也能滿(mǎn)足用戶(hù)的需要。所以NVIDIA和ATI的處境多少有些高處不勝寒,只有快馬加鞭向前發(fā)展,才能不被后來(lái)者追上。
至于英特爾等CPU廠商為什么沒(méi)有采用GPU的先進(jìn)工藝自己投資生產(chǎn)線(xiàn),是因?yàn)榘言瓉?lái)的產(chǎn)品生產(chǎn)線(xiàn)一次過(guò)淘汰掉,可能連當(dāng)初投入的資金都難以收回。而GPU廠商只是自己設(shè)計(jì),再找其他廠商代工生產(chǎn),并沒(méi)有生產(chǎn)線(xiàn)的壓力。
正因?yàn)槿绱?,NVIDIA和ATI兩家大廠可以投入更多的資金在研發(fā)上,讓GPU技術(shù)快速提升,繼而讓麻省理工和哈佛的研究團(tuán)隊(duì),看到了讓電腦實(shí)現(xiàn)仿真大腦視覺(jué)識(shí)辨的可能。
GPU發(fā)展迅猛遠(yuǎn)超CPU
事實(shí)上早在2003年,科技界已經(jīng)看到許多關(guān)于利用GPU代替CPU的消息。此后的2005年,麻省理工學(xué)院參與到了這項(xiàng)工作之中。該大學(xué)的圖形研究小組運(yùn)用陣列函式測(cè)試了GPU代替CPU的性能,而測(cè)試結(jié)果極度驚人。
在當(dāng)時(shí)使用的測(cè)試程序中,小組使用了Intel C++編譯器來(lái)優(yōu)化超線(xiàn)程和SSE指令,并且以上的運(yùn)行能夠完成16和32位浮點(diǎn)運(yùn)算。2005年,小組成員們便對(duì)幾塊A TIX800 XT和NVIDIA GeForce 6800G PU進(jìn)行測(cè)試,產(chǎn)生的結(jié)果與一臺(tái)3.4 GHz Pentium IV PC產(chǎn)生的結(jié)果進(jìn)行比較發(fā)現(xiàn),性能非常優(yōu)秀。
2008年,NVIDIA公司Tesla計(jì)算事業(yè)部總經(jīng)理Andy Keane表示,到2010年,采用NVIDIATesla GPU構(gòu)建的超級(jí)計(jì)算機(jī),有望進(jìn)入全球高性能計(jì)算機(jī)TO P500排行榜的前十位。
他當(dāng)時(shí)談到,10系列G PU是首批擁有雙精度的NVIDIA處理器。隨著快速發(fā)展,未來(lái)G PU的性能一般每年都會(huì)翻一番,未來(lái)雙精度性能將至少比當(dāng)前的速度快5倍。
除了性能提升,成本、功耗、占地面積也是大規(guī)模超級(jí)計(jì)算機(jī)用戶(hù)所關(guān)心的重要因素。
如比利時(shí)安特衛(wèi)普大學(xué)原來(lái)用的超級(jí)計(jì)算機(jī)有512顆處理器核,成本是530萬(wàn)美元,占用了好幾個(gè)機(jī)柜;而后來(lái)?yè)Q成一臺(tái)擁有8個(gè)G PU的臺(tái)式系統(tǒng),性能相當(dāng),成本只需7000美元,占地面積也大為減少。
人腦、電腦相互“促進(jìn)”
據(jù)了解,在2008年11月公布的最新一期TOP 500排行榜上,NVIDIA Tesla的最好成績(jī)是第29位。這套名為“TSUBAME”的系統(tǒng)由NEC和SUN公司聯(lián)合研制,采用了“CPU+GPU”的混合架構(gòu),包括3萬(wàn)多顆 AMD Opteron和英特爾Xeon處理器內(nèi)核,以及170臺(tái)T eslaS1070 1U服務(wù)器,安裝在日本東京工業(yè)大學(xué),Linpack測(cè)試性能是77.48萬(wàn)億次每秒(TFlops),理論峰值接近170萬(wàn)億次每秒。