如何合理優(yōu)化FPGA架構(gòu)設(shè)計及配方法
如果符合一些簡單的設(shè)計原則,采用最新的Xilinx7系列FPGA架構(gòu)上實現(xiàn)無線通信。Xilinx公司已經(jīng)創(chuàng)建了典型無線數(shù)據(jù)路徑的設(shè)計范例,表明中速級(-2)器件上使用的幾乎100%的 slice資源都支持500 MHz以上的時鐘頻率。如何真正時序高速設(shè)計,需要注意一下幾點
影響時鐘頻率的基本規(guī)則
01
DSP48 slice數(shù)與時鐘速率成反比
一般來說DSP48 slice數(shù)與時鐘速率成反比。Block RAM資源也按照階躍函數(shù)隨時鐘速率降低。這在無線電信號處理設(shè)計中較常見,其中Block RAM基本上用來按照相對高的采樣率存儲大量函數(shù)運算的系數(shù)集合,例如,DDS(直接數(shù)字合成器)的正弦/余弦值,峰值抵消脈沖產(chǎn)生器中的CFR (波峰因數(shù)衰減)系數(shù),或DPD (數(shù)字預失真)模型中的非線性函數(shù)抽樣。
所以,提供時鐘頻率能夠降低Slice和BlockRAM的資源利用,當時鐘頻率從368.64轉(zhuǎn)換至491.52 MHz(1.33時鐘比) ,按照比例LUT和FF的數(shù)據(jù)量分別減少了1.34和1.44倍。將時鐘速率從245.76放大一倍至491.52 MHz,這些數(shù)據(jù)減少了1.8倍和1.7倍。這種非線性行為基本上是為執(zhí)行信號處理控制邏輯,不需要按照時鐘頻率進行線性放大。
02
信號采樣率也影響資源利用率
采樣速率為25 Msamples/sec的濾波器帶寬在250 MHz運行時與帶寬在500 MHz運行時相比所需的邏輯資源略降低兩倍。采樣速率為500 Msamples/sec的多相實現(xiàn)帶寬在250 MHz運行時與帶寬在500 MHz時相比,所需的邏輯資源增加兩倍。對邏輯資源使用的一階估計是時鐘頻率增加x倍相當于邏輯利用率減少0.85至1.1倍
高速設(shè)計其他注意事項
01
流水線設(shè)計
適當?shù)牧魉€程序當然是設(shè)計高速程序的關(guān)鍵因素,所有的高速設(shè)計都推崇流水線設(shè)計,在此不做詳細描述
02
合理使用BlockRAM
需要構(gòu)建一個以上Block RAM的存儲時,可通過選擇最大限度地減少數(shù)據(jù)復用和資源利用的配置優(yōu)化速度。舉例來說, 存儲16位數(shù)據(jù)的16K存儲器最好使用16K × 1位的Block RAM進行構(gòu)建,而不是1K × 16位的Block RAM.
03
正確使用DSP Slice
DSP slice邏輯本質(zhì)上可支持較高的時鐘速率。邏輯電平與數(shù)據(jù)路由路徑的數(shù)量限制了速度,因此在構(gòu)建高速設(shè)計時應(yīng)在每一個或兩個LUT電平上插入一個寄存器
04
合理的層次結(jié)構(gòu)
定義合理的層次結(jié)構(gòu),按照邏輯分區(qū)將設(shè)計劃分成相應(yīng)的功能模塊。這種層次結(jié)構(gòu)提供便于在層次邊界寄存輸出的方法,從而限制特定模塊的關(guān)鍵路徑。這樣分析和修復在單一模塊中定位的時序路徑就很容易。實際上,定位超高時鐘速度時,應(yīng)在層次結(jié)構(gòu)的一些層級使用多個寄存器級,以優(yōu)化時序并為后端工具留下更多設(shè)計空間。好的設(shè)計層次結(jié)構(gòu)應(yīng)該將相關(guān)的邏輯集成在一起,使得區(qū)域分組和邏輯壓縮更為有效;
建立適當?shù)膶哟谓Y(jié)構(gòu)可在多個模塊時獲取可重復結(jié)果
在模塊級應(yīng)用實現(xiàn)屬性,可令代碼簡單并具可擴展性,該屬性可傳播該模塊中聲明的所有信號
05
良好的時鐘管理和時鐘分配方法
盡可能減少獨立主時鐘數(shù)量
將時鐘元件放在設(shè)計層次結(jié)構(gòu)的頂層,以便在多個模塊共享時鐘,這將減少所需的時鐘資源,提高時序性能,并降低資源和功率利用率
在不相關(guān)時鐘域之間使用適當?shù)脑偻郊夹g(shù)
限制時鐘“使能”的使用。實際上這條規(guī)則難以實現(xiàn),原因是在多周期實現(xiàn)中時鐘“使能”通常需要評估數(shù)據(jù)樣本或操作符輸出。實現(xiàn)有效的降低功耗技術(shù)很有效。在任何情況下,必須適當寄存時鐘使能信號以刪除高扇出 nets
06
復位策略
最小化復位網(wǎng)絡(luò)的大小
避免全局復位。
優(yōu)選同步復位,實際上對DSP48邏輯片和Block RAM是強制的。
總結(jié)
高速設(shè)計時FPGA設(shè)計的未來,隨著信號處理能力的增強,F(xiàn)PGA高速設(shè)計必不可少。如何合理優(yōu)化FPGA架構(gòu)設(shè)計是我們必須要考慮的問題。