怎么讓FPGA產(chǎn)生“質(zhì)變”?
到2020年,將有500萬(wàn)臺(tái)終端實(shí)現(xiàn)聯(lián)網(wǎng)。每個(gè)終端將會(huì)源源不斷地產(chǎn)生數(shù)據(jù),這些數(shù)據(jù)匯聚起來(lái)就是海量的數(shù)據(jù)。除了物聯(lián)網(wǎng),還有機(jī)器人、5G通信、人工智能等,對(duì)芯片數(shù)據(jù)處理能力提出巨大的需求:強(qiáng)大的運(yùn)算能力,更快的計(jì)算速度,更小的延時(shí),同時(shí)還要保持低功耗等等。
面對(duì)計(jì)算需求的指數(shù)級(jí)增長(zhǎng),當(dāng)前業(yè)界出現(xiàn)多種不同的FPGA解決路徑;在滿(mǎn)足數(shù)據(jù)時(shí)代需求的同時(shí),也推動(dòng)了FPGA的煥發(fā)新生。
01【英特爾】推出CPU+FPGA異構(gòu)組合架構(gòu) 針對(duì)傳統(tǒng)應(yīng)用和新應(yīng)用
面對(duì)需求挑戰(zhàn),英特爾在平臺(tái)架構(gòu)上進(jìn)行了創(chuàng)新,推出CPU+FPGA(+專(zhuān)用加速器ASSP和ASIC等)的異構(gòu)組合架構(gòu)。在這個(gè)異構(gòu)組合架構(gòu)中,英特爾表示,F(xiàn)GPA在其中扮演著加速器的角色。
其中,F(xiàn)PGA在異構(gòu)計(jì)算中有兩種加速形式,一是旁路加速,可以將重度計(jì)算功能轉(zhuǎn)移到FPGA上,從而釋放處理器去處理其他功能;二是內(nèi)建加速。如果時(shí)延比較重要,則可以進(jìn)行內(nèi)建加速,從而通過(guò)FPGA的多功能性帶來(lái)更好的存儲(chǔ)和計(jì)算的加速。
英特爾的FPGA解決方案針對(duì)傳統(tǒng)應(yīng)用和新應(yīng)用,比如在無(wú)人機(jī)、傳感器融合、機(jī)器學(xué)習(xí)、高性能計(jì)算、數(shù)據(jù)分析等領(lǐng)域。
目前,英特爾最新的Stratix 10高端芯片已經(jīng)有樣片,Arria 10產(chǎn)品已經(jīng)在全面生產(chǎn),而Cyclone 10和Max 10已可大量出貨。而英特爾下一代 FPGA——Falcon Mesa也將問(wèn)世,F(xiàn)alcon Mesa是 Altera 并入之后第一代使用了英特爾10nm制程的FPGA。新產(chǎn)品會(huì)支持下一代HBM,轉(zhuǎn)換速率達(dá)112Gbps,還支持PCIe 4x16,意味著支持的帶寬能夠達(dá)到16TB。
英特爾FPGA上的根基源于當(dāng)年收購(gòu)Altera,加上自身的代工實(shí)力,實(shí)現(xiàn)了FPGA方面的大跨越。
02【Efinix】FPGA布線(xiàn)方面革新 滿(mǎn)足傳統(tǒng)應(yīng)用和新應(yīng)用
Efinix公司在布線(xiàn)方面實(shí)現(xiàn)FPGA的革新,顛覆了過(guò)去FPGA的基本架構(gòu)。即,拋棄具有專(zhuān)用功能的每個(gè)電路板格的基礎(chǔ)上,每一個(gè)電路板格都可以根據(jù)特定目的被編程。通過(guò)布線(xiàn)上的突破,可使芯片尺寸縮小75%,而且能耗只有傳統(tǒng)芯片的一半,結(jié)構(gòu)比以往更簡(jiǎn)單。
在應(yīng)用上,Efinix的FPGA方案適用于傳統(tǒng)應(yīng)用和新興應(yīng)用。包括工業(yè)、醫(yī)學(xué)、廣播等傳統(tǒng)應(yīng)用,以及IoT 、移動(dòng)終端、無(wú)人機(jī)、自動(dòng)駕駛汽車(chē)、邊緣計(jì)算等新興應(yīng)用。
據(jù)半導(dǎo)體行業(yè)觀察的分析,在與傳統(tǒng)FPGA的關(guān)系上,從產(chǎn)品技術(shù)應(yīng)用上看,Efinix的Quantum FPGA將有可能替代傳統(tǒng)FPGA,在設(shè)計(jì)驗(yàn)證和異構(gòu)計(jì)算等場(chǎng)合得到應(yīng)用。在異構(gòu)計(jì)算領(lǐng)域,由于Quantum FPGA在性能上比傳統(tǒng)FPGA有不少優(yōu)勢(shì),因此可望能實(shí)現(xiàn)基于FPGA的異構(gòu)計(jì)算方案的進(jìn)一步普及。
在解決方案上,Efinix的Quantum FPGA與英特爾的方雜是不同的解決路徑,沒(méi)有直接的可比性。不過(guò),在市場(chǎng)上將會(huì)有重疊部分,今后兩家公司在搶占市場(chǎng)上將有可能形成競(jìng)爭(zhēng)關(guān)系。
除了傳統(tǒng)FPGA的市場(chǎng)之外,Efinix在嵌入式FPGA市場(chǎng)也有布局。而目前在嵌入式FPGA市場(chǎng),已有一匹黑馬ACHRONIX公司,該公司已推出相關(guān)解決方案,已收到市場(chǎng)很好的客戶(hù)反饋,并進(jìn)一步推出新的eFPGA解決方案。(下一環(huán)節(jié)重點(diǎn)分析這家公司在嵌入式FPGA中方案)
03【Achronix】嵌入式FPGA市場(chǎng)的黑馬 定制單元塊實(shí)現(xiàn)性能、芯片面積和功耗的優(yōu)化
嵌入式FPGA(eFPGA)IP產(chǎn)品可以被嵌入到一款A(yù)SIC或者SoC之中,從而實(shí)現(xiàn)ASIC或SOC靈活的工作方式。
在嵌入式FPGA領(lǐng)域,近期有了新的技術(shù)推進(jìn)。Achronix公司通過(guò)定制單元塊,可使客戶(hù)獲得ASIC級(jí)的效率并同時(shí)保持FPGA的靈活性,從而帶來(lái)了一種可以將功耗和面積降至最低、同時(shí)將數(shù)據(jù)流通量最大化的高效實(shí)現(xiàn)方式。
Achronix是一家采用無(wú)晶圓廠(chǎng)模式的半導(dǎo)體公司,總部位于美國(guó)加利福尼亞州圣克拉拉市。該公司開(kāi)發(fā)了自己的FPGA技術(shù),該技術(shù)是Speedster22i FPGA及Speedcore eFPGA產(chǎn)品的基礎(chǔ)。在2017年Achronix銷(xiāo)售收入增長(zhǎng)7倍。其中Speedcore是Achronix增速最快的產(chǎn)品,2015年,Speedcore開(kāi)始參與客戶(hù)項(xiàng)目評(píng)估;2016年第三季度實(shí)現(xiàn)了向首批客戶(hù)供貨。其集成電路工藝技術(shù)采用TSMC16nm已量產(chǎn),采用TSMC 7nm的產(chǎn)品將在2018年上半年完成測(cè)試芯片和首批設(shè)計(jì)。
Speedcore eFPGA提供了性能極高而成本極低的硬件加速,而現(xiàn)在借助Speedcore custom blocks定制單元模塊,可以面向最高性能和最小片芯面積這些目標(biāo)進(jìn)行優(yōu)化。從以下案例可以了解詳情:
1. 通過(guò)為矩陣乘法運(yùn)算優(yōu)化數(shù)字信號(hào)處理器(DSP)和存儲(chǔ)單元塊,基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的YOLO目標(biāo)識(shí)別算法的芯片面積被縮減了超過(guò)40%。
2. 如果用Speedcore custom blocks定制單元塊來(lái)實(shí)現(xiàn),需要并行比較器陣列的大型字符串搜索功能的片芯面積可以縮減超過(guò)90%。
3. 桶形移位器(Barrel shifter)和二進(jìn)制位處理結(jié)構(gòu)也可以在Speedcore custom blocks定制單元塊中完全實(shí)現(xiàn),從而在同樣的面積中實(shí)現(xiàn)更大的、更精妙的應(yīng)用,提升了可獲得的頻率。
4. 一個(gè)運(yùn)行在800MHz的400Gbps包處理數(shù)據(jù)通道的核心功能也可以用Speedcore custom blocks定制單元塊來(lái)實(shí)現(xiàn),其可編程邏輯管理分析和控制功能。今天的FPGA獨(dú)立芯片不能為包處理應(yīng)用提供這么高的數(shù)據(jù)吞吐量。
在應(yīng)用方面,Achronix市場(chǎng)營(yíng)銷(xiāo)副總裁Steve Mensor指出,Achroni嵌入式FPGA主要應(yīng)用在可加速數(shù)據(jù)密集的人工智能(AI)/機(jī)器學(xué)習(xí)、5G移動(dòng)通信、汽車(chē)先進(jìn)駕駛員輔助系統(tǒng)(ADAS)、數(shù)據(jù)中心和網(wǎng)絡(luò)應(yīng)用等新應(yīng)用領(lǐng)域中。
在與傳統(tǒng)FPGA的關(guān)系中,“eFPGA解決方案不會(huì)替代傳統(tǒng)FPGA,兩者之前將是一種互補(bǔ)的關(guān)系。” Steve Mensor表示。