當前位置:首頁 > 芯聞號 > 技術解析
[導讀]為增進大家對GPU的認識,本文將對GPU和FPGA予以闡述,因為目前有很多人將二者進行對比。

GPU是圖形處理器,GPU在很多方面都有所應用,如手機、電腦等。前兩篇文章中,小編對GPU和顯卡的關系、GPU渲染等均有所介紹。為增進大家對GPU的認識,本文將對GPU和FPGA予以闡述,因為目前有很多人將二者進行對比。如果你對GPU具有興趣,不妨繼續(xù)往下閱讀哦。

從峰值性能來說,GPU(10Tflops)遠遠高于FPGA(<1TFlops)。GPU上面成千上萬個core同時跑在GHz的頻率上還是非常壯觀的,最新的GPU峰值性能可達10TFlops以上。GPU的架構經過仔細設計(例如使用深度流水線,reTIming等技巧),在電路實現上是基于標準單元庫而在criTIcal path上可以用手工定制電路,甚至在必要的情形下可以讓半導體fab依據設計需求微調工藝制程,因此可以讓許多core同時跑在非常高的頻率。相對而言,FPGA首先設計資源受到很大的限制,例如GPU如果想多加幾個core只要增加芯片面積就行,但FPGA一旦你型號選定了邏輯資源上限就確定了(浮點運算在FPGA里會占用很多資源)。而且,FPGA里面的邏輯單元是基于SRAM-查找表,其性能會比GPU里面的標準邏輯單元差好多。最后,FPGA的布線資源也受限制(有些線必須要繞很遠),不像GPU這樣走ASIC flow可以隨意布線,這也會限制性能。

除了芯片性能外,GPU相對于FPGA還有一個優(yōu)勢就是內存接口。GPU的內存接口(傳統的GDDR,最近更是用上了HBM和HBM2)的帶寬遠好于FPGA的傳統DDR接口,而眾所周知服務器端機器學習算法需要頻繁訪問內存。

但是從靈活性來說,FPGA遠好于GPU。FPGA可以根據特定的應用去編程硬件(例如如果應用里面的加法運算非常多就可以把大量的邏輯資源去實現加法器),但是GPU一旦設計完那就沒法改動了,沒法根據應用去調整硬件資源。目前機器學習大多數適合使用SIMD架構(即只需一條指令可以平行處理大量數據),因此用GPU很適合。但是有些應用是MISD(即單一數據需要用許多條指令平行處理,微軟在2014年ISCApaper里面就舉了一個MISD用于并行提取feature的例子),這種情況下用FPGA做一個MISD的架構就會比GPU有優(yōu)勢。不過FPGA的編程對于程序員來說并不容易,所以為了能讓機器學習程序員能方便地使用FPGA往往還需要在FPGA公司提供的編譯器基礎上進行二次開發(fā),這些都是只有大公司才能做。

FPGA實現的機器學習加速器在架構上可以根據特定應用優(yōu)化所以比GPU有優(yōu)勢,但是GPU的運行速度(>1GHz)相比FPGA有優(yōu)勢(~200MHz)。

所以,對于平均性能,看的就是FPGA加速器架構上的優(yōu)勢是否能彌補運行速度上的劣勢。如果FPGA上的架構優(yōu)化可以帶來相比GPU架構兩到三個數量級的優(yōu)勢,那么FPGA在平均性能上會好于GPU。例如,百度在HotChips上發(fā)布的paper顯示,GPU的平均性能相比FPGA在矩陣運算等標準batchdataSIMDbench上遠好于FPGA;但是在處理服務器端的少量多次處理請求(即頻繁請求但每次請求的數據量和計算量都不大)的場合下,平均性能會比GPU更好。

功耗方面,雖然GPU的功耗(200W)遠大于FPGA的功耗(10W),但是如果要比較功耗應該比較在執(zhí)行效率相同時需要的功耗。如果FPGA的架構優(yōu)化能做到很好以致于一塊FPGA的平均性能能接近一塊GPU,那么FPGA方案的總功耗遠小于GPU,散熱問題可以大大減輕。反之,如果需要二十塊FPGA才能實現一塊GPU的平均性能,那么FPGA在功耗方面并沒有優(yōu)勢。

能效比的比較也是類似,能效指的是完成程序執(zhí)行消耗的能量,而能量消耗等于功耗乘以程序執(zhí)行的時間。雖然GPU的功耗遠大于FPGA的功耗,但是如果FPGA執(zhí)行相同程序需要的時間比GPU長幾十倍,那FPGA在能效比上就沒有優(yōu)勢了;反之如果FPGA上實現的硬件架構優(yōu)化得很適合特定的機器學習應用,執(zhí)行算法所需的時間僅僅是GPU的幾倍或甚至于接近GPU,那么FPGA的能效比就會比GPU強。

以上便是此次小編帶來的“GPU”相關內容,通過本文,希望大家對GPU和FPGA具備一定的了解。如果你喜歡本文,不妨持續(xù)關注我們網站哦,小編將于后期帶來更多精彩內容。最后,十分感謝大家的閱讀,have a nice day!

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內容真實性等。需要轉載請聯系該專欄作者,如若文章內容侵犯您的權益,請及時聯系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或將催生出更大的獨角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數字化轉型技術解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據媒體報道,騰訊和網易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數據產業(yè)博覽會開幕式在貴陽舉行,華為董事、質量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數據產業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經營業(yè)績穩(wěn)中有升 落實提質增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數字經濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術學會聯合牽頭組建的NVI技術創(chuàng)新聯盟在BIRTV2024超高清全產業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現場 NVI技術創(chuàng)新聯...

關鍵字: VI 傳輸協議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯合招商會上,軟通動力信息技術(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術
關閉
關閉