原創(chuàng)

FPGA能取代GPU和CPU嗎？為什么

時(shí)間：2023-12-11 13:00:01

關(guān)鍵字： FPGA CPU GPU

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]本文中，小編將對(duì)FPGA予以介紹，如果你想對(duì)它的詳細(xì)情況有所認(rèn)識(shí)，或者想要增進(jìn)對(duì)它的了解程度，不妨請(qǐng)看以下內(nèi)容哦。

本文中，小編將對(duì)FPGA予以介紹，如果你想對(duì)它的詳細(xì)情況有所認(rèn)識(shí)，或者想要增進(jìn)對(duì)它的了解程度，不妨請(qǐng)看以下內(nèi)容哦。

一、什么是FPGA

FPGA設(shè)計(jì)不是簡單的芯片研究，主要是利用 FPGA 的模式進(jìn)行其他行業(yè)產(chǎn)品的設(shè)計(jì)。與 ASIC 不同，F(xiàn)PGA在通信行業(yè)的應(yīng)用比較廣泛。通過對(duì)全球FPGA產(chǎn)品市場以及相關(guān)供應(yīng)商的分析，結(jié)合當(dāng)前我國的實(shí)際情況以及國內(nèi)領(lǐng)先的FPGA產(chǎn)品可以發(fā)現(xiàn)相關(guān)技術(shù)在未來的發(fā)展方向，對(duì)我國科技水平的全面提高具有非常重要的推動(dòng)作用。 [2]

與傳統(tǒng)模式的芯片設(shè)計(jì)進(jìn)行對(duì)比，F(xiàn)PGA 芯片并非單純局限于研究以及設(shè)計(jì)芯片，而是針對(duì)較多領(lǐng)域產(chǎn)品都能借助特定芯片模型予以優(yōu)化設(shè)計(jì)。從芯片器件的角度講，F(xiàn)PGA 本身構(gòu)成了半定制電路中的典型集成電路，其中含有數(shù)字管理模塊、內(nèi)嵌式單元、輸出單元以及輸入單元等。在此基礎(chǔ)上，關(guān)于FPGA芯片有必要全面著眼于綜合性的芯片優(yōu)化設(shè)計(jì)，通過改進(jìn)當(dāng)前的芯片設(shè)計(jì)來增設(shè)全新的芯片功能，據(jù)此實(shí)現(xiàn)了芯片整體構(gòu)造的簡化與性能提升。

二、從FPGA優(yōu)缺點(diǎn)看FPGA能否取代GPU和CPU

1、延遲

FPGA 的主要優(yōu)勢(shì)之一是延遲小。具體來說，即使是非常好的 CPU 延遲也最多為 50 微秒，而 FPGA 可以達(dá)到 1 微秒。在延遲方面，數(shù)字與 CPU 和 GPU 不同。 FPGA 延遲低的原因是，它獨(dú)立于通用操作系統(tǒng)，并且無需通過通用總線(如 USB 或 PCI-Express)進(jìn)行通信。

由于其低延遲功能，F(xiàn)PGA 用于需要極小延遲的情況，例如噴氣式戰(zhàn)斗機(jī)的自動(dòng)駕駛和高頻算法交易。

2、連接

CPU 和 GPU 通過標(biāo)準(zhǔn)化總線(如 USB 和 PCI-Express)連接到數(shù)據(jù)源，并將數(shù)據(jù)傳遞到應(yīng)用程序，同時(shí)依賴于操作系統(tǒng)。與此相對(duì)，F(xiàn)PGA可以直接連接到網(wǎng)絡(luò)接口和傳感器等數(shù)據(jù)源。這不僅減少了延遲，而且具有增加帶寬的優(yōu)點(diǎn)。

對(duì)于需要捕獲和處理大量數(shù)據(jù)的場景，高帶寬 FPGA 非常有用。例如，射電天文學(xué)使用FPGA來簡化數(shù)據(jù)管理，以處理傳感器產(chǎn)生的大量數(shù)據(jù)。

3、工程成本

與基于指令的體系結(jié)構(gòu) CPU 和 GPU 相比，F(xiàn)PGA 的主要缺點(diǎn)是“編程和配置要困難得多”。直到現(xiàn)在，F(xiàn)PGA 都是用 VHDL 和 Verilog 等硬件描述語言(HDL)編寫的。對(duì)于使用 Java、C 和 Python 等編程語言進(jìn)行編程，使用 HDL 進(jìn)行編程所需的工程成本是巨大的。

近年來，通過使用OpenCL和C++等標(biāo)準(zhǔn)編程語言對(duì)FPGA進(jìn)行編程，雖然出現(xiàn)了可以進(jìn)行高抽象化的高電平Synthesis(HLS)，但與基于命令的系統(tǒng)編程相比難度還是很高的。

另外，F(xiàn)PGA的編譯時(shí)間長度也是一個(gè)很大的缺點(diǎn)。例如，使用Intel OpenCL編譯器時(shí)，編譯一般的FPGA程序需要4-12小時(shí)。為了優(yōu)化性能，需要夜間編譯。

4、能源效率

與 CPU 和GPU 相比，節(jié)能 FPGA 在邏輯和固定精度方面具有更好的能效。因此，F(xiàn)PGA 在加密貨幣挖掘方面優(yōu)于 CPU 和 GPU。 ASIC 優(yōu)于 FPGA，但 ASIC 的缺點(diǎn)是初始投資在設(shè)計(jì)階段很大。

除了在計(jì)算中實(shí)現(xiàn)高能效外，F(xiàn)PGA 還具有“無需啟動(dòng)和運(yùn)行主機(jī)”的高效率。

在使用高性能計(jì)算(如深度學(xué)習(xí))的情況下，現(xiàn)階段嚴(yán)重依賴具有出色浮點(diǎn)計(jì)算性能的 GPU。 FPGA 在浮點(diǎn)運(yùn)算中效率相當(dāng)?shù)?，因?yàn)楦↑c(diǎn)單元必須從邏輯塊組裝，并且需要大量的資源。

然而，新的FPGA如Arria 10和Stratix 10，在能效方面有了相當(dāng)大的改進(jìn)，因?yàn)楦↑c(diǎn)單元內(nèi)置于FPGA結(jié)構(gòu)上。具體比較的話，最尖端GPU的Tesla V100以250W的功率理論上是15TFLOPS，而采用Starix10的最尖端FPGA的Nallatech520C，以225W的功率實(shí)現(xiàn)9.2TFLOPS。雖然GPU的能效仍然很高，但考慮到Tesla V100是以12nm工藝制造的，而Stratix10是以14nm工藝制造的，其差距會(huì)進(jìn)一步縮小。戴爾佩羅格表示，在不久的將來，F(xiàn)PGA可能會(huì)在浮點(diǎn)運(yùn)算中的能效競爭中超過GPU。

上述所有信息便是小編這次為大家推薦的有關(guān)FPGA的內(nèi)容，希望大家能夠喜歡，想了解更多有關(guān)它的信息或者其它內(nèi)容，請(qǐng)關(guān)注我們網(wǎng)站哦。