本文中,小編將對FPGA予以介紹,如果你想對它的詳細(xì)情況有所認(rèn)識,或者想要增進(jìn)對它的了解程度,不妨請看以下內(nèi)容哦。
一、什么是FPGA
FPGA設(shè)計不是簡單的芯片研究,主要是利用 FPGA 的模式進(jìn)行其他行業(yè)產(chǎn)品的設(shè)計。 與 ASIC 不同,F(xiàn)PGA在通信行業(yè)的應(yīng)用比較廣泛。通過對全球FPGA產(chǎn)品市場以及相關(guān)供應(yīng)商的分析,結(jié)合當(dāng)前我國的實際情況以及國內(nèi)領(lǐng)先的FPGA產(chǎn)品可以發(fā)現(xiàn)相關(guān)技術(shù)在未來的發(fā)展方向,對我國科技水平的全面提高具有非常重要的推動作用。 [2]
與傳統(tǒng)模式的芯片設(shè)計進(jìn)行對比,F(xiàn)PGA 芯片并非單純局限于研究以及設(shè)計芯片,而是針對較多領(lǐng)域產(chǎn)品都能借助特定芯片模型予以優(yōu)化設(shè)計。從芯片器件的角度講,F(xiàn)PGA 本身構(gòu)成 了半定制電路中的典型集成電路,其中含有數(shù)字管理模塊、內(nèi)嵌式單元、輸出單元以及輸入單元等。在此基礎(chǔ)上,關(guān)于FPGA芯片有必要全面著眼于綜合性的芯片優(yōu)化設(shè)計,通過改進(jìn)當(dāng)前的芯片設(shè)計來增設(shè)全新的芯片功能,據(jù)此實現(xiàn)了芯片整體構(gòu)造的簡化與性能提升。
二、從FPGA優(yōu)缺點看FPGA能否取代GPU和CPU
1、延遲
FPGA 的主要優(yōu)勢之一是延遲小。 具體來說,即使是非常好的 CPU 延遲也最多為 50 微秒,而 FPGA 可以達(dá)到 1 微秒。 在延遲方面,數(shù)字與 CPU 和 GPU 不同。 FPGA 延遲低的原因是,它獨立于通用操作系統(tǒng),并且無需通過通用總線(如 USB 或 PCI-Express)進(jìn)行通信。
由于其低延遲功能,F(xiàn)PGA 用于需要極小延遲的情況,例如噴氣式戰(zhàn)斗機的自動駕駛和高頻算法交易。
2、連接
CPU 和 GPU 通過標(biāo)準(zhǔn)化總線(如 USB 和 PCI-Express)連接到數(shù)據(jù)源,并將數(shù)據(jù)傳遞到應(yīng)用程序,同時依賴于操作系統(tǒng)。 與此相對,F(xiàn)PGA可以直接連接到網(wǎng)絡(luò)接口和傳感器等數(shù)據(jù)源。這不僅減少了延遲,而且具有增加帶寬的優(yōu)點。
對于需要捕獲和處理大量數(shù)據(jù)的場景,高帶寬 FPGA 非常有用。 例如,射電天文學(xué)使用FPGA來簡化數(shù)據(jù)管理,以處理傳感器產(chǎn)生的大量數(shù)據(jù)。
3、工程成本
與基于指令的體系結(jié)構(gòu) CPU 和 GPU 相比,F(xiàn)PGA 的主要缺點是“編程和配置要困難得多”。 直到現(xiàn)在,F(xiàn)PGA 都是用 VHDL 和 Verilog 等硬件描述語言(HDL)編寫的。對于使用 Java、C 和 Python 等編程語言進(jìn)行編程,使用 HDL 進(jìn)行編程所需的工程成本是巨大的。
近年來,通過使用OpenCL和C++等標(biāo)準(zhǔn)編程語言對FPGA進(jìn)行編程,雖然出現(xiàn)了可以進(jìn)行高抽象化的高電平Synthesis(HLS),但與基于命令的系統(tǒng)編程相比難度還是很高的。
另外,F(xiàn)PGA的編譯時間長度也是一個很大的缺點。例如,使用Intel OpenCL編譯器時,編譯一般的FPGA程序需要4-12小時。為了優(yōu)化性能,需要夜間編譯。
4、能源效率
與 CPU 和GPU 相比,節(jié)能 FPGA 在邏輯和固定精度方面具有更好的能效。 因此,F(xiàn)PGA 在加密貨幣挖掘方面優(yōu)于 CPU 和 GPU。 ASIC 優(yōu)于 FPGA,但 ASIC 的缺點是初始投資在設(shè)計階段很大。
除了在計算中實現(xiàn)高能效外,F(xiàn)PGA 還具有“無需啟動和運行主機”的高效率。
在使用高性能計算(如深度學(xué)習(xí))的情況下,現(xiàn)階段嚴(yán)重依賴具有出色浮點計算性能的 GPU。 FPGA 在浮點運算中效率相當(dāng)?shù)?,因為浮點單元必須從邏輯塊組裝,并且需要大量的資源。
然而,新的FPGA如Arria 10和Stratix 10,在能效方面有了相當(dāng)大的改進(jìn),因為浮點單元內(nèi)置于FPGA結(jié)構(gòu)上。 具體比較的話,最尖端GPU的Tesla V100以250W的功率理論上是15TFLOPS,而采用Starix10的最尖端FPGA的Nallatech520C,以225W的功率實現(xiàn)9.2TFLOPS。雖然GPU的能效仍然很高,但考慮到Tesla V100是以12nm工藝制造的,而Stratix10是以14nm工藝制造的,其差距會進(jìn)一步縮小。戴爾佩羅格表示,在不久的將來,F(xiàn)PGA可能會在浮點運算中的能效競爭中超過GPU。
上述所有信息便是小編這次為大家推薦的有關(guān)FPGA的內(nèi)容,希望大家能夠喜歡,想了解更多有關(guān)它的信息或者其它內(nèi)容,請關(guān)注我們網(wǎng)站哦。